关联数据入门——RDF应用_Xml教程
缂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾惧綊鏌熼梻瀵割槮缁炬儳缍婇弻鐔兼⒒鐎靛壊妲紒鎯у⒔閹虫捇鈥旈崘顏佸亾閿濆簼绨奸柟鐧哥秮閺岋綁顢橀悙鎼闂傚洤顦甸弻銊モ攽閸℃瑥鈷堥梺鎼炲€曢ˇ鎵崲濞戞﹩鍟呮い鏃囧吹閸戝綊姊洪崫鍕櫤缂佽鐗撳璇测槈濮橆偅鍕冮梺缁樺姦閸撴稑鈻撻妶澶嬧拺闁告稑锕ラ埛鎺楁煛娴e憡鎲告俊鍙夊姍楠炴ḿ鈧稒锚椤庢捇姊洪崷顓犲笡閻㈩垰锕ョ粩鐔煎即閵忊檧鎷绘繛杈剧导鐠€锕傚绩閺夋5鐟扳堪鎼粹€斥拫濡炪們鍨洪〃濠呯熅闂佺粯绋撻¨鈧琒闂傚倸鍊搁崐鎼佸磹閹间礁纾圭€瑰嫭鍣磋ぐ鎺戠倞鐟滃繘寮抽敃鍌涚厽闁靛繆鎳氶崷顓犵幓婵°倕鎳忛悡娆撴煙濞堝灝鏋涙い锝呫偢閺屾稓鈧絽澧庣弧鈧梺鍝勬湰濞叉ê顕ラ崟顖氶唶婵犻潧妫楅ˉ娆愮節閻㈤潧浠﹂柛銊﹀劶瑜版粓姊虹悰鈥充壕婵炲濮撮鍡涘磹閻㈠憡鐓ユ繝闈涙閺嗘瑥鈹戦敍鍕幋闁哄本绋撻埀顒婄秵閸嬪懎鐣峰畝鈧埀顒冾潐濞叉ḿ鏁敓鐘茬畺婵炲棙鎸搁拑鐔兼煏婢跺牆鍔滈柡鍡╀邯濮婂宕掑▎鎴М闂佸湱鈷堥崑鍕弲闂侀潧艌閺呮稓澹曟繝姘厽闁归偊鍠栭崝瀣煕婵犲倻浠涢柕鍥у楠炴帡宕卞鎯ь棜闂傚倷绀侀悿鍥綖婢舵劕鍨傞柛褎顨呯粻鏍ㄧ箾閸℃ɑ灏柣顓燁殔椤潡鎳滈惉顏呭灴閺佸秵绗熼埀顒€顫忕紒妯诲閻熸瑥瀚禒鈺呮⒑閸涘﹥鐓ラ梺甯到閻i攱瀵奸弶鎴濆敤閻熸粍绮撳畷鐢稿即閻愨晜鏂€闂佺粯锚绾绢參銆傞弻銉︾厸闁告侗鍠楅崐鎰版煛鐏炶濮傞柟顔哄€濆畷鎺戔槈濮楀棔绱�濠电姷鏁告慨鐑藉极閸涘﹥鍙忛柣鎴f閺嬩線鏌熼梻瀵割槮缁炬儳顭烽弻锝夊箛椤掍焦鍎撻梺鎼炲妼閸婂潡骞冪憴鍕闁瑰嘲鐭堥崝鍛攽閻愭彃鎮戦柣妤冨█楠炲啫鐣¢幍铏€婚棅顐㈡处閹尖晜瀵奸埀顒勬⒒娴h櫣甯涚紒璇插€块幃銉︾附缁嬭儻鎽曞┑鐐村灟閸ㄥ綊鎮炲ú顏呯厱闁规澘鍚€缁ㄥ瓨淇婇幓鎺斿ⅵ婵﹨娅g槐鎺懳熺拠鏌ョ€洪梻浣瑰濞插繘宕归挊澶樺殨濠电姵鑹鹃悘鎶芥煙妫颁胶顦﹂柟顔藉灴閺岀喖鎳栭埡鍕婂鏌嶈閸撴瑧澹曢銏╂晩闁硅揪闄勯埛鎺懨归敐鍥ㄥ殌闁崇粯娲熼弻锟犲焵椤掍焦缍囬柍鍝勫€瑰▓浼存⒑鐠恒劌鏋斿┑顔芥尦閹锋垿鎮㈤崗鑲╁帾婵犵數鍋熼崑鎾斥枍閸℃稒鐓曢悗锝庝簼椤ャ垽鏌$仦鍓с€掑ù鐙呯畵瀹曟粏顦俊鎻掔墕椤啴濡堕崨瀵稿椽闂佺懓鍤栭幏锟� 缂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾惧綊鏌熼梻瀵割槮缁惧墽鎳撻—鍐偓锝庝簼閹癸綁鏌i鐐搭棞闁靛棙甯掗~婵嬫晲閸涱剙顥氶梻浣藉Г钃辩紒璇茬墕椤繐煤椤忓秵鏅㈤梺閫炲苯澧扮紒顔芥⒒閳ь剟娼ч幗婊堟偝缂佹ü绻嗛柕鍫濇噺閸f椽鏌i幘瀵告噰婵﹥妞介、姗€濡歌閺嗙姵绻濋埛鈧崶鈺冩毇闂佸搫琚崐婵嗩嚕閸洖绠伴幖绮光偓鍙夋▕闂傚倷绀侀幖顐﹀嫉椤掑嫭鍎庢い鏍ㄧ◥缁诲棝鏌i幋鐘垫憘闁轰礁锕弻锝夊箻閸愯尙妲板┑鐐跺瀹曠數妲愰幘璇茬<婵炲棙甯╅崬褰掓⒑缁嬫鍎愰柟鍛婃倐閳ワ箓宕稿Δ浣告疂闂傚倸鐗婄粙鎴︼綖瀹ュ鈷戠紓浣股戠亸顓㈡煕閻斿憡灏︾€殿喖顭峰鎾偄妞嬪海鐛梻浣稿閸嬪懐鎹㈤崒鐐┾偓鏍ㄥ緞閹邦厸鎷虹紓鍌欑劍宀h法绮婚妷銉冪懓饪版惔婵嬪仐閻庢鍠栭…鐑藉极閹版澘宸濇い蹇撴噺閺夋悂姊绘担鍛婅础闁稿鎸稿玻鍨枎閹垮啯鏅滈梺璺ㄥ櫐閹凤拷 闂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾惧綊鏌熼梻瀵割槮缁惧墽鎳撻—鍐偓锝庝簻椤掋垺銇勯幇顏嗙煓闁哄被鍔戦幃銏ゅ传閸曟垯鍨婚惀顏堝箚瑜滈悡濂告煛鐏炲墽娲寸€殿喗鎸虫俊鎼佸Ψ瑜夐崑鎾活敆閸曨剛鍘遍梺闈涱檧缁茶姤淇婇悾宀€纾界€广儱鎳忛崰姗€鏌$仦鐣屝х€规洦鍋婂畷鐔碱敃閿濆棭鍟€濠碉紕鍋戦崐褏鈧潧鐭傚畷瑙勬綇閳哄倸搴婂┑鐘绘涧椤戝懘锝為崨瀛樼叆婵犻潧妫欓ˉ鐘绘煏閸℃ê濮嶆慨濠冩そ瀹曨偊宕熼鐐╂嫛闂備礁鎲¢幐楣冨窗鎼淬劍鍋╃€瑰嫭瀚堥弮鍫濈劦妞ゆ帒瀚ㄩ崑鎴澝归崗鍏肩稇闂佸崬娲弻锝夊棘閹稿孩鍎撳Δ鐘靛仦閸旀瑥顫忕紒妯诲閻熸瑥瀚禒鈺呮⒑缁嬪灝鐦ㄩ柛銊ㄦ硾閻e嘲鈹戦崱鈺佹倯婵犮垼娉涢鍛村礈椤撱垺鈷戠痪顓炴噺瑜把囨⒒閸曨偄顏柛鈺傜洴楠炴帡骞嬮鐘叉暩闂佽崵濮惧▍锝囦焊閵娾晛绀夐柣鏃傚帶閺嬩線鏌涢鐘插姕闁抽攱鍨块弻娑樷攽閸℃浼傚銈庡亾缁犳捇寮诲☉娆戠瘈闁告劦浜滈埅鍦偓鍏夊亾闁挎繂鐗嗛崝鐢电磼閻樺磭鈽夐柍钘夘槸铻f繝褏鍋撳▍濠囨煛鐏炶濮傜€殿噮鍣e畷鎺戔堪閸愵亶鍋у┑锛勫亼閸婃垿宕曢懠顒傜煓闁规崘鍩栭~鏇㈡煙閹规劦鍤欑痪鎯у悑缁绘盯宕卞Ο铏逛淮婵犵鈧尙鐭欐慨濠冩そ瀹曨偊濡烽妷銈囨崟婵$偑鍊ら崢楣冨礂濮椻偓閹即顢欑捄銊ф澑濠电偞鍨堕悷锕€鈻嶉姀銈嗏拺閻犳亽鍔屽▍鎰版煙閸戙倖瀚� 闂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾剧懓顪冪€n亝鎹i柣顓炴閵嗘帒顫濋敐鍛婵°倗濮烽崑鐐烘偋閻樻眹鈧線寮撮姀鈩冩珖闂侀€炲苯澧撮柟顔兼健椤㈡岸鍩€椤掑嫬钃熼柨婵嗘啒閺冨牆鐒垫い鎺戝閸嬪鈹戦悩鍙夋悙闁活厽顨婇悡顐﹀炊閵娧€濮囬梺缁樻尰閻熝呮閹惧瓨濯撮梻鍫熺〒娴犲ジ姊洪崫鍕靛剱缂佸甯楃粚杈ㄧ節閸ャ劌鈧兘鏌熷▓鍨灓闁绘挻鎹囧娲传閸曨偒妲甸梺閫炲苯澧柛鎾村哺瀹曘儳鈧綆鍠栫粻鍦磼椤旂厧甯ㄩ柛瀣崌閹崇娀顢楁担瑙勵仯闂傚倸鍊搁崐椋庣矆娓氣偓楠炲鏁撻悩顔瑰亾閸愵喖骞㈡繛鍡楃箲閻庢娊鎮楅獮鍨姎婵炶绠戦悾鐑藉矗婢跺瞼顔曢梺鐟扮摠閻熴儵鎮橀埡鍌ゆ闁绘劦浜滈悘顏勄庨崶褝韬い銏$☉閳规垿骞囬渚囧敳闂傚倸鍊搁崐鎼佀囬婊呯煋闁圭虎鍠栭悡姗€鏌熸潏鎯х槣闁轰礁顑夐弻娑㈠焺閸愵亝鍣柦鍐憾濮婄粯鎷呴崨濠傛殘濠殿喖锕ょ紞濠囧Υ閸愨晝绡€闁搞儜鍕氶梻渚€鈧偛鑻晶顖炴煏閸パ冾伃妤犵偞甯¢獮瀣攽閸モ晙澹曞┑鐘垫暩閸嬫盯宕ョ€n喖绀夋繛鍡樻尭閽冪喖鏌i弮鍌楁嫛闁轰礁锕弻銈吤圭€n偅鐝旈梺缁樻尵閸犳牠骞冨Δ鍐╁枂闁告洦鍓涢ˇ銊モ攽閻愯泛鐨洪柛鐘崇墪椤曪絾绻濆顒€鑰垮┑掳鍊曢敃銈夊箖閹达附鈷戦柛娑橈梗缁堕亶鏌涢妸锕€鈻曠€规洏鍨介、妤呭礋椤戣姤瀚藉┑鐐舵彧缂嶁偓濠殿喓鍊楀☉鐢稿醇閺囩喓鍘遍梺鎸庣箓缁绘帡鎮鹃崹顐闁绘劘灏欑粻濠氭煛娴h宕岄柡浣规崌閺佹捇鏁撻敓锟�,闂傚倸鍊搁崐鎼佸磹閹间礁纾归柟闂寸绾惧湱鈧懓瀚崳纾嬨亹閹烘垹鍊炲銈嗗笂缁€渚€宕滈鐑嗘富闁靛牆妫楁慨褏绱掗悩鍐茬仼缂侇喖鐗忛埀顒婄秵閸嬩焦绂嶅⿰鍫熺厵闁逛絻娅曞▍鍛存煟韫囧﹥娅囬柟顕呭枛椤粓鍩€椤掆偓椤繒绱掑Ο璇差€撶紓浣圭☉椤戝懎鈻撻鐐╂斀妞ゆ梹鏋婚崗顒傜磼閻樿櫕宕岄柡浣瑰姍閹瑩寮堕幋鐘电嵁闂佽鍑界紞鍡涘礈濞戙埄鏁婇柡鍥╁枔缁♀偓闂佹眹鍨藉ḿ褍鐡梻浣呵归鍛涘┑鍡欐殾闁汇垻枪閸楁娊鏌曡箛銉х?闁告ê宕—鍐Χ閸℃衼缂備焦褰冩晶鐣屽垝閸儱鐒垫い鎺戝€荤壕钘壝归敐鍡楃祷濞存粓绠栧娲川婵犲倸顫呴梺鍝勫€搁崐鍦矉瀹ュ應鍫柛顐ゅ枔閸樻悂姊虹粙鎸庢拱婵ǜ鍔嶇粋鎺楀閵堝棛鍘靛銈嗘濡嫰鎮橀敃鍌涚厪闁搞儜鍐句紓缂備胶濮甸惄顖氼嚕閹绢喗鍊烽悗鐢电《閸嬫捇宕滆绾捐棄霉閿濆牊顏犻悽顖涚洴閺岋綁鍩℃繝鍌滀桓闂佺粯渚楅崰姘跺焵椤掑﹦绉甸柛鐘愁殜瀹曟劙鎮滈懞銉у幐婵犮垼娉涢鍛存倶閳哄倻绠鹃柛顐g☉閳ь剚绻傞~蹇曠磼濡顎撻梺鍛婄洴濞佳呯礊婵犲洢鈧線寮介鐐茶€垮┑鐐村灦宀e潡顢欐径鎰拺闁硅偐鍋涢崝鈧柣蹇曞仜婢х晫绮欐笟鈧缁樻媴閸涘﹤鏆堢紓浣筋嚙閸婂鍩€椤掍胶娈伴柛銉戝啫娈ら梺鐟板悑閻n亪宕濆澶嬪亗婵炲棙鍔戞禍婊堟煛瀹擃喖瀚峰Λ鐐烘煟鎼淬垹鍤柛鐘愁殘缁顓兼径妯绘櫆闂佸壊鍋嗛崯鍧楀箯缂佹ḿ绠鹃弶鍫濆⒔閸掍即鏌熺拠褏绡€鐎规洦鍨堕幃娆撴倻濡厧骞楅梻浣虹帛濮婄懓岣垮▎鎾崇闁靛牆顦伴悡娆愵殽閻愯尙浠㈤柣蹇婃櫊閹藉爼鏁愰崨顐熷亾閹烘埈娼╅柣鎾虫捣娴犫晛鈹戦悙鑼闁告柨绉堕幑銏犫攽鐎n偄浠洪梻鍌氱墛閸掆偓闁挎繂娲ㄥΛ顖炴煛婢跺孩纭堕弫鍫ユ倵濞堝灝鏋熼柣鎿勭節閻涱噣寮介妸锕€顎撻梺闈╁瘜閸樼厧顕i幎鑺モ拻濞达綀娅g敮娑欑箾閸欏澧电€规洘鍔欏畷鐑筋敇濞戞ü澹曞┑顔结缚閸嬫挾鈧熬鎷�!
推荐:UTF8转成GB2312乱码问题解决方案
审核完的信息要生成XML类型的文件,并且XML要采用GB2312编码,因为采集的新闻网站,有很多网站采用的是UTF8编码,这样在转化的过程中又出现乱码
语义网(Semantic Web)是一种数据的网络,让数据得以共享,而不仅仅是被应用程序束缚。
但语义网也不仅仅是把数据放在互联网上,而是试图将数据联系起来,并产生数据与现实事物的联系,以方便人与机器阅读与理解这些数据。
The Semantic Web isn't just about putting data on the web. It is about making links, so that a person or machine can explore the web of data.
——Linked Data Design Issues . Tim Berners-Lee
关联数据(Linked Data)是第一种可行的语义网表达形式,它采用RDF数据模型,利用URI(统一资源标识符)命名数据实体,来发布和部署实例数据和类数据,从而可以通过HTTP协议揭示并获取这些数据,同时强调数据的相互关联、相互联系以及有益于人机理解的语境信息。
Linked data is a set of best practices for publishing and deploying instance and class data using the RDF data model, and uses uniform resource identifiers (URIs) to name the data objects. The approach exposes the data for access via the HTTP protocol, while emphasizing data interconnections, interrelationships and context useful to both humans and machine agents.
——Linked Data FAQ . M.K. Bergman
因为语义网是一项庞大的工程,并相伴着各种困难,使其成为一种长期目标与愿景,而关系数据是一类实践活动,其可行并实用,成为当前语义网实现的一种最佳可行方案。
RDF的特点
资源描述框架(Resource Description Framework),作为XML(Extensible Markup Language)的一种衍生版本,他是关联数据的基本数据模型。蒂姆·伯纳斯-李(Tim Berners-Lee)在设计它的时候面临了以下两个问题:
•怎样去设计方便易学易于传播并适合标准化的语言?
•怎样去设计离散数据的入口和出口?
为了解决这两个问题,RDF有以下一些特点:
•使用XML作为基本语言
•使用URIs作为现实事物的名字
•使用HTTP URIs使人们知道如何通过名字在网络中寻找数据(即创建离散数据入口)
•包含与其他URIs的联系,使人们可以通过其找到更多有用的东西(即创建离散数据出口)
•使用三元组(Triple)形式存储数据
实际上,一些RDF版本并非使用XML语言,这里主要指的是初始版本。
一个简单的RDF例子
复制代码 代码如下:www.mb5u.com
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://www.w3.org/">
<dc:title>World Wide Web Consortium</dc:title>
</rdf:Description>
</rdf:RDF>
将该RDF例子通过W3C RDF验证服务,会出现以下列表:
Triples of the Data Model
这是啥东东?
三元组(Triple),RDF数据模型的基本表现单元。所谓三元组就是:主(Subject)-谓(Predicate)-宾(Object)。
A triple store is designed to store and retrieve identities that are constructed from triplex collections of strings (sequences of letters). These triplex collections represent a subject-predicate-object relationship that more or less corresponds to the definition put forth by the RDF standard.
——Triple Store . Jack Rusher
不同于关系数据,其数据本身没有庞大的联系(这在数据网络如此庞大的数据面前也是不可行的),而是使用类似人类陈述语句(Statement)的方式来存储数据,例如:
•Tom is a man.(Tom是个男人)
•Tom lives in a red house.(Tom住在一个红房子里)
•Tom married with Lili.(Tom和Lili结婚了)
可见三元组形式也有强大的数据存储表达潜力,人类正是这种形式的长期受益者。当然像上面这么表述对人类友好,但对机器却不怎么友好,因为这种谓语对于宾语并没有良好的限定,至少机器不这么认为。所以我们应该写成这样的模式:
•Tom(Tom) sex(性别) man(男)
•Tom(Tom) house(房子) red(红色)
•Tom(Tom) wife(妻子) Lili(Lili)
回到标题,这是什么东东?其表述了下列内容:
1.http://www.w3.org (表示该陈述是描述的主体是什么,由于HTTP URI映射现实事物,所以可以看做该是对什么现实事物的描述)
2.http://purl.org/dc/elements/1.1/title (主体的属性,一般表示宾体的类型,例如dc:title是都柏林核心中用来指明资源名称的,即客体是该资源的一个名字)
3.World Wide Web Consortium (客体)
别人是如何获得RDF的?
下图说明了这个过程:

•首先先对HTTP URI进行请求。
•通常浏览器HTTP请求头是:text/html、application/xhtml+xml类型,故服务器返回一般html/xhtml文档。
•但对于语义浏览器,其HTTP请求头是:application/rdf+xml类型,故服务器进行303重定向,得到相应RDF文件。
也就是说,对于一个HTTP URI可以返回两种表达形式:文档和数据。这样就建立了两种不同的网络,一个利于人类阅读的文档网,另一种是利于机器阅读的数据网。
分享:解析服务器上的XML
XML可以在不安装任何XML控件的情况下在服务器端生成。 在服务器上存储XML XML文件可被存储在服务器上,和HTML文件的存储方式是完全相同的。 启动Windows记事本,并编写以下代码行: ?xml version=1.0 encoding=ISO-8859-1?note fromJani/from toTove/to

相关Xml教程:
- 相关链接:
- 教程说明:
Xml教程-关联数据入门——RDF应用
。