C/C++

Thao Tác Với XML Sử Dụng TinyXML Trong C++

Giới thiệu

Không thể phủ nhận được vai trò của XML trong quá trình phát triển ứng dụng. Thông thường được dùng để tạo rss, kết quả trả về từ server, lưu trữ dữ liệu…Vậy trong quá trình phát triển chúng ta cần phải thao tác khá là nhiều với những tài liệu XML này. Thì TinyXML là một trong những thư viện nhỏ gọn, hiệu quả, hổ trợ ngôn ngữ C++ giúp chúng ta làm được điều đó.

Tiền đề bài viết

Trong quá trình thao tác với XML trong C++ tôi muốn tìm kiếm một thư viện để có thể sử dụng thay vì phải viết lại mã nguồn để thao tác. Tôi nhận thấy TinyXML là một thư viện hữu ích giúp chúc ta có thể làm việc được với tài liệu XML thông qua mô hình DOM (Document Object Model).

Cơ bản về XML

Cũng tương tự HTML là ngôn ngữ đánh dấu văn bản, nhưng XML một ưu điểm nổi là các thẻ đều do người dùng tự định nghĩa, không giống như HTML là phải tuân thủ theo các thẻ được xây dựng sẵn.

Ví dụ về HTML và XML:

HTML

XML

Một ví dụ XML có cấu trúc phúc tạp hơn:

Lưu ý: Tài liệu XML bắt buộc phải có một thẻ root. Thẻ root này sẽ chứa tất cả các thẻ con nằm trong nó. Thẻ root ở hai ví dụ trên là <authors></authors><catalog></catalog>.

Thư viện TinyXML

Giới thiệu

TinyXML là một thư viện mã nguồn mở C++, thao tác với tài liệu XML thông qua mô hình DOM (Document Object Model).

Phiên bản mới nhất của thư viện này là TinyXML 2.6.2. Các bạn có thể download thư viện tại ĐÂY.

Sơ đồ phân cấp lớp của thư viện này được mô tả như hình dưới đây:

tinyxml_ss_1

Với thông tin về mỗi lớp như sau:

Tên Class Thông tin về Class
TiXmlAttribute Đại diện cho thuộc tính, là một cặp name-value
TiXmlBase Là class cơ sở của tất cả mọi class trong TinyXML
TiXmlComment Đại diện cho comment trong tài liệu XML
TiXmlDeclaration Đại diện cho những khai báo ở đầu file trong tài liệu XML
TiXmlDocument Đại diện cho một tài liệu XML, chứa tất cả các thông tin về tài liệu này.
TiXmlElement Đại diện cho một node trong tài liệu XML
TiXmlNode Là class cơ sở trong mô hình DOM
TiXmlText Đại diện cho nội dung của một node trong tài liệu XML

Thêm thư viện vào Project

Tạo một Empty Project Console C++ với tên Project là Demo_TinyXML. Sau đó download thư viện ở trên và giải nén. Trong thư mục vừa mới giải nén ta chỉ quan tâm tới những file cần thiết là các file:

  • tinyxmlerror.cpp
  • tinyxmlparser.cpp
  • tinystr.cpp
  • tinystr.h
  • tinyxml.cpp
  • tinyxml.h

Copy những file này vào thư mục project của chúng ta.

tinyxml_ss_2

Sau đó thêm những file vào project trên Visual Studio bằng cách chuột phải (right-click) vào project chọn Add > Existing Item… và chọn những file trên và nhấn Add để kết thúc. Và kết quả sẽ như sau:

tinyxml_ss_3

Và thêm #include “tinyxml.h” vào đầu những file muốn sử dụng thư viện này:

Thao tác với tài liệu XML

Trong bài viết này tôi sẽ thao tác với tài liệu XML có nội dung như sau, việc thao tác với những tài liệu XML khác hoàn toàn tương tự.

Read

Tạo một file có tên là Authors.xml có nội dung như trên và copy file này vào thư mục project của chúng ta.

Các bước để đọc một tài liệu XML:

Bước 1: Load tài liệu lên bộ nhớ.

Bước 2: Lấy thông tin của node gốc (root element).

Bước 2: Lần lượt truy vấn qua các node con để lấy được thông tin cần thiết.

Đọc tài liệu Authors.xml như sau:

Load tài liệu:

Lấy thông tin node gốc

Truy vấn qua từng node và xuất thông tin:

Giả sử có rất nhiều author, thì giải pháp tốt nhất là chúng ta sẽ sử dụng vòng lặp để duyệt qua tất cả các node:

Các bạn có thể tìm hiểu rõ hơn về các phương thức FirstChild, LastChildPreviousSiblingNextSiblingNextSiblingElement để có thể truy vấn trong tài liệu XML một cách hiệu quả.

Write

Ở phần này tôi sẽ tạo lại một tài liệu XML có nội dung như Authors.xml nhưng lưu lại với tên là Author_Write.xml.

Tài liệu XML là một mô hình phân cấp. Nghĩa là một một node trong tài liệu XML đồng thời là cha của node này và là con của node kia. Ví dụ trong tài liệu Authors.xml thì Authors là cha của các Author, các Author là anh chị em với nhau. Mỗi Author đều có thuộc tính id và có hai con là Name Age. Cách tạo tài liệu XML cũng dựa trên điều này. Tạo ra các TiXmlElement và dùng phương thức có prototype như sau để thể hiện mối quan hệ trên:

Tạo một đối tượng TiXmlDocument và thêm các node TiXmlDeclaration, TiXmlComment, đối tượng root TiXmlElement vào tài liệu này:

Với mỗi Author ta sẽ tạo hai node là Name, Age và set nội dung cho chúng, sau đó add vào node author tương ứng.

Author1

Author2

Lưu tài liệu XML.

Dưới đây là toàn bộ souce code tại ra file Authors_Write.xml

Build và chạy chương trình, sau đó mở thư mục chứa project các bạn sẽ thấy file Authors_Write.xml được tạo ra với nội dung giống như file Authors.xml.

Lời kết

Qua bài viết về thao tác với tài liệu XML sử dụng thư viện TinyXML, tôi đã hướng dẫn các bạn thao tác với tài liệu này. Hy vọng bài viết giúp ích cho các bạn. Nếu có bất cứ thắc mắc nào, các bạn có thể đưa ra những câu hỏi để tôi có thể giúp đỡ các bạn tốt nhất.

Tham khảo

http://www.grinninglizard.com/tinyxmldocs/annotated.html – 15/08/2015

Leave a Reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.