XML入门教程:XML CDATA_Xml教程
推荐:AJAX:如何处理书签和后退按钮本文将展示一个开源JavaScript库,该脚本库给AJAX应用程序带来了书签和后退按钮支持。在学习完这个教程后,开发人员将能够获得对一个AJAX问题的解决方案(甚至连Google Maps和Gmail现在都不提供
所有XML文档中的文本均会被解析器解析。
只有CDATA区段(CDATA section)中的文本会被解析器忽略。
Parsed Data
XML解析器通常会解析XML文档中所有的文本。
当某个XML元素被解析时,其标签之间的文本也会被解析:
<message>此文本也会被解析</message>
解析器之所以这么做是因为XML元素可包含其他的元素,就像这个例子中,其中的<name>元素包含着另外的两个元素(first 和 last):
<name><first>Bill</first><last>Gates</last></name>
而解析器会把它分解为像这样的子元素:
以下为引用的内容: <name> <first>Bill</first> <last>Gates</last> </name> |
转义字符
非法的XML字符必须被替换为实体引用(entity reference)。
假如您在XML文档中放置了一个字符,例如"<",那么这个文档会产生一个错误,这是因为解析器会把它解释为新元素的开始。因此你不能这样写:
<message>if salary < 1000 then</message>
为了避免这个错误,您需要把字符"<"替换为实体引用,就像这样:
<message>if salary < 1000 then</message>
在XML中有5个预定义的实体引用:
< < 小于
> > 大于
& & 和号
' ' 省略号
" " 引号
注释:严格地讲,在XML中仅有字符"<"和"&"是非法的。省略号、引号和大于号是合法的,但是把它们替换为实体引用是个好的习惯。
CDATA
CDATA内部的所有东西都会被解析器忽略。
假如您的文本中包含了大量的"<"和"&"字符 - 就像编程代码中经常出现的情况一样 - 那么这个XML元素就可以被定义为一个CDATA部分。
CDATA区段开始于"<![CDATA[",结束于"]]>":
以下为引用的内容: <script> <![CDATA[ function matchwo(a,b) { if (a < b && a < 0) then { return 1 } else { return 0 } } ]]> </script> |
在上面的例子中,在CDATA区段中的所有东西都会被解析器忽略。
关于CDATA区段的注释:
CDATA区段不能包含字符串"]]>",所以,CDATA区段的嵌入是不被允许的。
同时也需要确保在"]]>"字符串中没有空格或折行。
分享:如何得到XML文档文件的大小XML文档从格式到大小都是不是确定的。有的可能只有几行,而有的却有好几兆字节。你也许会怀疑是不是需要了解XML文档的大小。而当性能成为首要问题时,知道XML文档大小就是件必须要作的
- 相关链接:
- 教程说明:
Xml教程-XML入门教程:XML CDATA。