中国互联网向何处去之三:中国搜索引擎的出路在哪里_建站经验教程
推荐:不懂网站的人,靠网站月赚20万老刘今年54岁了,我和他熟悉快一个月了,这一个月来我亲眼见证了他通过他的破网站(在我看来很破)成交了7个单子,每个单子的纯利润在2万左右,也就是一个月他纯赚了14万左右。 熟悉老刘是在年前,通过一个朋友熟悉的,这个朋友比我大一岁,我叫他张哥,他在一公司做销
一、搜索引擎的历史
二、搜索引擎的技术现状
三、站内搜索和公网搜索
四、中文分词和检索
五、搜索的未来
今天来讨论搜索引擎,很有意思的是徽剑作为技术背景的从业人士,曾经也参与了搜索引擎的开发,开发过一套基于互联网的情报系统,就是当年百度李彦宏也曾经干过的事。后来一直也在关注搜索技术。现在徽剑手上还有两套搜索引擎系统的方案。
需要指出的是,由于考虑到读者群体,徽剑在这篇文章中基本上以原理为主,对于一些涉及细节的东西,除了要害的地方以外,一般都会略去不说。希望讨论搜索引擎这个话题的可以联系徽剑,或者加入QQ群21423628 搜索技术研究与实践,这里主要讨论搜索技术、分词、数据检索挖掘、技术开发等系列问题,非凡是前沿问题,刚建立的,人不多。不过这个群不欢迎所谓的SEO人士。在徽剑看来,所谓中国的SEO基本都是糊弄人的,这个群里面发现一个清理一个。
徽剑在这里推荐英文好的朋友可以去阅读一篇文章《The Anatomy of a Large-Scale Hypertextual Web Search Engine》,是讲谷歌雏形的东西.一些主要的技术都提到了。不妨可以把徽剑的本文和那篇文章对照起来阅读,相信你对搜索引擎会有更深的熟悉。
一、国内搜索引擎的历史
首先让我们来看看搜索引擎的历史:
最早的计算机是用于计算弹道轨迹的,但随后人们就把它用于信息检索,其实搜索引擎就是一种信息检索。而计算机检索系统也就是搜索引擎,我们可以这么说,计算机出现后不久,就出现了搜索引擎。
照IT历史研究人员的说法,计算机信息检索可以分为三个阶段:
首先是早期的脱机检索:其特点是不对一个检索提问立即作出回答,而是集中大批提问后进行处理,且进行处理的时间较长,人机不能对话,
1954年,美国海军首先采用IBM-701型计算机建立了世界上第一个科技文献检索系统,实现了单元词组配检索,检索逻辑只采用“逻辑与”,检索结果只是文献号。
1958年,美国通用电器公司将其加以改进,输出结果增加了题名、作者和文献摘要等项目。1964年,美国化学文摘服务社建立了文献处理自动化系统,使编制文摘的大部分工作实现了计算机检索。
同年,美国国立医学图书馆建立了计算机数据库,即医学文献分析与检索系统,不仅可以进行逻辑“或”、“与”、“非”等种运算,而且还可以从多种途径检索文献。
第二阶段是联机信息检索,从60年代中期到70年代初。由于计算机分时技术的发展,通信技术的改进,以及计算机网络的初步形成和检索软件包的建立,用户可以通过检索终端设备与检索系统中心计算机进行人机对话,从而实现对远距离之外的数据库进行检索的目的,即实现了联机信息检索。出现了美国的DIALOG系统、ORBIT系统、BRS系统、欧洲的ESA-IRS系统等。
第三个阶段是网络化联机检索阶段,此阶段是从70年代初到现在。由于数据通信网都可为情报检索传输数据。用户可借助通讯网络直接与检索系统联机,从而实现不受地域限制的联机信息检索。像美国的DIALOG信息公司已成为全世界最为闻名的联机检索服务机构。
到了上个世纪90年代,联机检索正式从科研、教育等大型机构,走向了大众的日常生活。让我们来看看报道:
“90年初当时万维网还未出现,为了查询散布在各个分散的主机中的文件,曾有过Archie, Gopher等搜索工具。随着互联网的迅速发展,基于HTTP访问的web技术的迅速普及,在1994年1月,第一个既可搜索又可浏览的分类目录EINet Galaxy(Tradewave Galaxy)上线,它还支持Gopher和Telnet搜索。同年4月,Yahoo目录诞生,随着访问量和收录链接数的增长,开始支持简单的数据库查询。这就是早期的目录导航系统。
分享:《创业路上》这篇文章献给准备与正在创业中的朋友们!第一篇;感想有这么一种说法,一个好的团队由4种动物型人才组成,一老虎,治理型的,威严,能很好的控制团队。二老鹰,市场战略,飞的高,看的远,将资讯最快的速度传达给老虎。三是狼,市场销售,狼的捕食能力及不屈不饶的精神能使其做的最好。四是狗,财务治理,能很
- 相关链接:
- 教程说明:
建站经验教程-中国互联网向何处去之三:中国搜索引擎的出路在哪里。