Rules of XML Grammar (Basic)

Trong phần giới thiệu mở đầu về XML, bạn đã được xem qua một ví dụ đơn giản về một tài liệu XML. Tuy nhiên, tôi chưa nói gì về các quy định mà ta cần phải theo trong quá trình tạo ra chúng. Và bây giờ ta sẽ nói về chúng. Nếu bạn đã từng làm việc với HTML, bạn sẽ thấy rằng các quy định của cú pháp XML nghiêm ngặc hơn. Tuy nhiên, sự nghiêm ngặc này không phải là điều tồi tệ, vì những quy định này giúp đảm bảo rằng không có bất kì lỗi nào khi chúng ta phân giải (parse), trả lại (render) hoặc chuyển đổi dữ liệu.

Trước khi tôi trình bày chi tiết các quy định, bạn cần làm quen với những phần khác nhau của tài liệu XML. Hãy xem xét ví dụ sau đây một cách cẩn thận.

simple-xml-1

Dòng đầu tiên được gọi là một hướng dẫn xử lý (processing instruction). Một hướng dẫn xử lý được dùng để cung cấp một số thông tin cho ứng dụng đang xử lý tài liệu XML này. Các hướng dẫn xử lý được mở đầu và kết thúc bằng thẻ <? và ?>. Hướng dẫn xử lý xml trong ví dụ trên có 2 thuộc tính: versionencoding. W3C hiện tại đề xuất giữ phiên bản 1.0, vì thế thuộc tính version phải được đặt là 1.0.

Dòng thứ 2 thể hiện một lời ghi chú (comment). Ghi chú có thể xuất hiện bất kì đâu trong một tài liệu XML sau phần hướng dẫn xử lý và có thể có nhiều dòng.

Dòng thứ 3 chứa phần tử tài liệu (document element) của một tài liệu XML. Một tài liệu XML có một và chỉ một phần tử tài liệu. Các tài liệu XML giống như cây ngược (inverted tree) và phần tử tài liệu được đặt tại vị trí gốc. Do đó, phần tử tài liệu này còn được gọi là phần tử gốc (root element). Mỗi phần tử (kể cả đó có phải là phần tử gốc hay không) cũng bao gồm một thẻ mở và một thẻ đóng. Thẻ mở trong trường hợp này là <customers> và thẻ đóng là </customers>.

Trong phần tử <customers>, bạn có 2 nút <customer>. Phần tử <customer> có một thuộc tính được gọi là ID. Giá trị thuộc tính được được bọc bằng dấu ngoặc kép. Phần tử <customer> này có 3 phần tử con: <name>, <phone> và <comments>. Các giá trị văn bản bên trong các phần tử, chẳng hạn như ở đây là <name> và <phone>, thường được gọi là các nút văn bản (text node). Đôi khi, nội dung văn bản mà bạn muốn đưa vào trong một nút có thể bao gồm các kí tự đặc biệt như là < và  >. Để thể hiện dữ liệu như vậy, bạn sử dụng một phần dữ liệu đặc biệt (CDATA).

Sau khi đã lướt qua các phần cơ bản của một tài liệu XML mẫu, bây giờ bạn đã sẵn sàng xem xét các quy định cơ bản của cú pháp XML. Bất kì tài liệu XML mà theo các quy định đã được đề cập tiếp theo được gọi là một tài liệu có định dạng chuẩn (well-formed document).

– Phần đánh dấu phân biệt chữ hoa và chữ thường. Các thẻ <customer>, <Customer> và <CUSTOMER> là khác nhau.

– Một tài liệu phải có một và chỉ một phần tử gốc.

– Một thẻ mở phải có một thẻ đóng.

– Các thẻ mở và thẻ đóng phải khớp với nhau.

– Các giá trị thuộc tính phải được đặt trong các dấu ngoặc kép.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s