libroxml

홈페이지: http://www.libroxml.net/

roxml

C로 제작된 xml 파서이며 사용하기 아주 쉽고.. 속도도 빠르다.
스크립트 언어로 바인딩하기 좋을것 같다.
아래는 특징.

– load / unload XML document from buffers or files.
– navigate throughout an XML tree using simple getter API.
– handle namespace.
– use xpath syntax to access some nodes in the XML tree.
– read nodes contents (text, attributes, comments …)
– create/modify XML trees and save them to a file or buffer.

다운로드: libroxml-2.3.0.tar.gz

Mini-XML

홈페이지: http://www.msweet.org/projects.php?Z3

다른 라이브러리에 의존적이지 않은 읽기/쓰기가 가능한 작은 XML 파서 라이브러리.
일단 API도 왠만한건 다 지원하는것 같음. MinGW에서 테스트 해보니 굿.

Mini-XML is a small XML library that you can use to read and write XML and XML-like data files in your application without requiring large non-standard libraries. Mini-XML only requires an ANSI C compatible compiler (GCC works, as do most vendors’ ANSI C compilers) and a ‘make’ program.

Mini-XML supports reading of UTF-8 and UTF-16 and writing of UTF-8 encoded XML files and strings. Data is stored in a linked-list tree structure, preserving the XML data hierarchy, and arbitrary element names, attributes, and attribute values are supported with no preset limits, just available memory.

다운로드: mxml-2.8.tar.gz

libxslt

홈페이지: http://xmlsoft.org/XSLT/

확장 마크업 언어(XML: Extensible Markup Language)은 구조화된 데이터를 텍스트 형태로 교환하기 위한 World Wide Web Consortium 표준이다. 이것의 인기는 그 보편성에서 비롯한다. 어떤 컴퓨터든지 텍스트 파일을 읽을 수 있다. 적당한 도구로, 어떤 컴퓨터든지 다른 컴퓨터의 XML 파일을 읽을 수 있다.

이 도구들 가운데 가장 중요한 것의 하나로 확장 마크업 언어 변환(XSLT: Extensible Stylesheet Language Transformations)을 들 수 있다. XSLT 는 선언적인 언어로서 XML 파일을 스타일시트를 이용해 임의의 텍스트 출력으로 변환할 수 있게 해준다. libxslt 는 바로 이러한 변환을 수행 하는 함수를 제공한다.

libxslt 는 Daniel Veillard 가 그놈 프로젝트를 위해 작성한 자유 C 언어 라이브러리로 XSLT 변환을 하는 프로그램을 작성할 수 있도록 하기 위해 만들어졌다.

Libxslt is the XSLT C library developed for the GNOME project. XSLT itself is a an XML language to define transformation for XML. Libxslt is based on libxml2 the XML C library developed for the GNOME project. It also implements most of the EXSLT set of processor-portable extensions functions and some of Saxon’s evaluate and expressions extensions.

다운로드: 1.1.26

libxml2

홈페이지: http://xmlsoft.org/

Libxml2 is the XML C parser and toolkit developed for the Gnome project (but usable outside of the Gnome platform), it is free software available under the MIT License. XML itself is a metalanguage to design markup languages, i.e. text language where semantic and structure are added to the content using extra “markup” information enclosed between angle brackets. HTML is the most well-known markup language. Though the library is written in C a variety of language bindings make it available in other environments.

Libxml2 is known to be very portable, the library should build and work without serious troubles on a variety of systems (Linux, Unix, Windows, CygWin, MacOS, MacOS X, RISC Os, OS/2, VMS, QNX, MVS, VxWorks, …)

다운로드: 2.7.8

scew라이브러리의 element를 패스로 표현하기

SCEW 라이브러리는 C에서 사용가능한 expat 래퍼 XML 라이브러리이다.

SCEW 라이브러리를 이용하면 expat 보다 더 상위레벨에서 좀더 쉽게 XML 데이타를 취급할 수 있다.

하지만 좀더 쉽게 접근하기 위한 패스를 제공하기 위해 아래와 같이 함수를 작성해 봤다.

아래와 같은 xml 이 있다고 할때.. c 노드를 패스로 표현하면 “/a/b/c” 로 표현된다.

<a>
    <b>
        <c>
        </c>
    </b>
</a>

나는 여기서 “/a/b/c” 표현으로 c 노드의 element를 얻고 싶다.

아래는 scew 를 이용하여 get_node_path 를 구현한 함수이며, 이를 이용한 데모이다.

아래의 코드는 mingw, linux 에서 테스트 되었다.

/*
	XML simple read example

	inhak.min@gmail.com
*/

#include <scew/scew.h>
#include <stdio.h>

char *get_attribute(scew_element *node, char *name)
{
	if (node != NULL)
	{
		scew_list *list = scew_element_attributes (node);
		while (list != NULL)
		{
			scew_attribute *attribute = scew_list_data (list);
			if ( !strcmp(scew_attribute_name (attribute), name) )
				return (char *)scew_attribute_value (attribute);

			list = scew_list_next (list);
		}
	}
}

char *get_node_path(scew_element *node)
{
	static char result_path[9072];

	scew_element *parent = node;

	sprintf(result_path, "");
	
	while(parent)
	{
		char *name = (char *)scew_element_name(parent);

		char tmp[9072];
		sprintf(tmp, "%s", result_path);

		sprintf(result_path, "%s", "/");
		sprintf(result_path, "%s%s", result_path, name);
		sprintf(result_path, "%s%s", result_path, tmp);

		parent = scew_element_parent(parent);
	}

	return result_path;
}

int get_node_depth(scew_element *node)
{
	int depth=0;
	scew_element *parent = node;

	while(parent)
	{
		++depth;
		parent = scew_element_parent(parent);
	}

	return depth;
}

scew_list* find_nodes (scew_element *node, char *find_path)
{
	static scew_list *result_list=NULL;

	char *path = get_node_path(node);
	if ( !strcmp(find_path, path) || !(strcmp(find_path, "*")) )
	{
		if(result_list==NULL)
			result_list = scew_list_create(node);
		else
			scew_list_append(result_list, node);
	}

	scew_list *children_list = scew_element_children (node);
	while (children_list != NULL)
	{
		scew_element *child = scew_list_data (children_list);
		result_list = find_nodes (child, find_path);
		children_list = scew_list_next (children_list);
	}

	return result_list;
}

static void
print_attributes (scew_element *node)
{
	if (node != NULL)
	{
		scew_list *list = scew_element_attributes (node);
		while (list != NULL)
		{
			scew_attribute *attribute = scew_list_data (list);
			printf (("%s=\"%s\""),
				scew_attribute_name (attribute),
				scew_attribute_value (attribute));
			list = scew_list_next (list);
		}
	}
}

// 실제 사용 방법
void demo(scew_tree *xml)
{
	scew_list *node_list=NULL;

	char *path = "/ctml/speciesData/species/thermo/NASA/floatArray";
	//char *path = "*";
	node_list = find_nodes (scew_tree_root (xml), path);

	printf(">> Found nodes: %d\n\n", scew_list_size(node_list));

	// 리스트를 검색해서 contents 를 뽑아낸다.
	while (node_list != NULL)
	{
		scew_element *node = scew_list_data (node_list);

		printf("[%d] %s\n", get_node_depth(node), get_node_path(node));

		// contents 를 출력한다.
		char *contents = (char *)scew_element_contents (node);
		printf("contents: %s\n\n", contents);
		
		// attribute 를 출력한다.
		printf("attributes: ");
		print_attributes (node);

		printf("\n-------------------\n");

		// 다음 노드를 얻는다.
		node_list = scew_list_next (node_list);
	}

	scew_list_free(node_list);
}

int
main (int argc, char *argv[])
{
	scew_reader *reader = NULL;
	scew_parser *parser = NULL;
	scew_tree *xml = NULL;

	if (argc < 2)
	{
		printf ("Usage: %s file.xml\n", argv[0]);
		return -1;
	}

	/* Creates an SCEW parser. This is the first function to call. */
	parser = scew_parser_create ();

	scew_parser_ignore_whitespaces (parser, SCEW_TRUE);

	/* Loads an XML file. */
	reader = scew_reader_file_create (argv[1]);

	xml = scew_parser_load (parser, reader);

	demo(xml);

	/* Remember to free xml (scew_parser_free does not free it). */
	scew_tree_free (xml);

	/* Frees the SCEW parser and reader. */
	scew_reader_free (reader);
	scew_parser_free (parser);

	return 0;
}

expat

홈페이지: http://expat.sourceforge.net/

xml 파서 라이브러리.

Expat is an XML parser library written in C

int main()
{
  char buf[convenient size];
  int len;   /* len is the number of bytes in the current bufferful of data */
  int done;
  int depth = 0;  /* nothing magic about this; the sample program tracks depth to know how far to indent. */
                  /* depth is thus going to be the user data for this parser. */

  XML_Parser parser = XML_ParserCreate(NULL);
  XML_SetUserData(parser, &depth);
  XML_SetElementHandler(parser, startElement, endElement);
  do {
    get a piece of input into the buffer
    done = whether this bufferful is the last bufferful
    if (!XML_Parse(parser, buf, len, done)) {
      handle parse error
      return 1;
    }
  } while (!done);
  XML_ParserFree(parser);
  return 0;
}

다운로드: 2.01