弗莱切:被遗忘的搜索引擎之父

弗莱切
Image caption 鲜有人知的英国人弗莱切才是真正的搜索引擎之父。

虽然“谷歌”早就成了网络搜索的代名词,但创造了世界首个网络信息采集(web-crawling)搜索引擎的人却是苏格兰的大学老师弗莱切(Jonathon Fletcher)。

不过你要是把弗莱切的名字“谷歌”一下的话,结果恐怕将令人失望。不会有一条搜索结果会明确地留给你一丝线索,这位弗莱切先生在全世界互联网发展过程中所起到的作用有多大。

当然,“谷歌”出来的搜索结果也不会有一条把他叫做“现代搜索引擎之父”。

但20年前,在苏格兰斯特灵大学(University of Stirling)的一间实验室里,弗莱切发明了全世界第一个用于网络信息采集的搜索引擎。直到现在,他的发明还是包括谷歌、微软的“必应”、雅虎和其它当今主流网络搜索引擎门户的“核心动力”。

搜索难题

互联网在1993年还处于“婴儿期”。

当时“最火”的浏览器叫做“马赛克”(Mosaic),模样和现在我们使用的浏览器差不多。不过,这个浏览器在当时可是才发布的新鲜玩意儿,而当时整个互联网的页面总数也不过就几千页而已。

但是,即便在几千个页面里想找到自己想要的内容也绝非易事。

当时的“马赛克”浏览器有一个页面叫做“最新内容”,用来介绍刚刚被创建出来的新网站。

但问题也随着而来。浏览器“马赛克”的开发人员要想随时知道新网站信息,都得给位于美国伊利诺伊斯香槟分校(University of Illinois Urbana-Champaign)的“国家超级计算机程序中心”(National Center for Supercomputing Applications)的浏览器总部写信才行。

而当时的弗莱切还是远在苏格兰斯特灵大学的一名优秀毕业生,当时他已经拿到了格拉斯哥大学的邀请函,准备在那里攻读博士学位。

但他有些时运不济。当他正踌躇满志准备继续自己学业时,格拉斯哥大学的研究经费被削减,他的“博士梦”瞬间化为泡影。

他回忆说:“我当时就立刻想做些什么,好挣点儿钱。所以我又回到了我的母校,并在工程系找到了一份工作。”

但正是这份工程系的职位,让弗莱切首次接触到了“国际互联网”( world wide web),以及“马赛克”浏览器上的“最新内容”页面。

“捷径”

弗莱切在随后搭建一个网络服务器时突然意识到,“马赛克”浏览器上的这个“最新内容”页面本身存在严重缺陷。

由于当时网站列表都是人工录入的,所以根本无法跟踪这些网站随时更新的信息。最终就导致很多链接不是很快就过时了,就是被错误标识了。

弗莱切形容当时的“马赛克”链接时说:“如果要是想看看有哪些更新,就得退回去重新看。”

他说:“作为一名计算机科学专业的毕业生,我想自己能找到一条捷径,我可以编写程序,让电脑替我找到这些内容。”

弗莱切当时编写的内容,就是世界第一个“万维网搜索程序”。

当时弗莱切把他的发明叫做“跳跃站”(JumpStation),并做了一个可以通过网络搜索程序自动查找的索引页面。他发明的搜索程序会自动访问每一个网络页面。

十天后,也就是1993年的12月21日,搜索程序“跳跃站”完成了页面访问任务,总共索引了25000个页面。

20年后的今天,谷歌能索引的页面数量超过万亿页。

搜索的诞生

随后,弗莱切为这个网络索引迅速搭建了一个很容易导航的搜索工具,并把自己的索引页面放在“马赛克”浏览器的“最新内容”页面上。由此,全世界第一个现代搜索引擎开始全面运行。

专门研究信息获取历史的皇家墨尔本技术学院的桑德森教授(Prof Mark Sanderson)说:“应该说,他(弗莱切)是互联网搜索引擎之父。”

他说:“当然,计算机进行搜索的事情在业界早已有之,并在互联网出现前就已经出现搜索引擎。但约翰逊-弗莱切是首位创造出拥有现代搜索引擎所具备的所有内容的人。”

然而现在只要一提起“搜索”,谷歌创始人布林(Sergey Brin)和佩奇(Larry Page)是绝对家喻户晓的“热门词汇”;而现在生活在香港的弗莱切,却极少有人知道他曾在互联网的“进化”中所起到的重要作用。

不幸的是,弗莱切的“跳跃站”项目最终由于需要大量投资被“抛弃”了,斯特灵大学当时不愿意为这个“烧钱”。

弗莱切说:“运行搜索引擎需要大量共享服务器,当时没那么大空间,而且造价也很昂贵。”

向前看

弗莱切也会自我解嘲一下。他说:“再说那也不是我当时的本职工作。我当时的工作就是要保证学生实验室的正常运行。”

之后一份来自日本东京的工作机会让弗莱切彻底告别“搜索引擎”。他说,除了大学“也不想留他”外,他也“没能说服大学这项技术的巨大潜力”。

现在斯特灵大学的同事们为弗莱切当时“超前的创造”而感到自豪。

弗莱切日前说:“在我来看,互联网终究有消亡的那一天,但人类查找信息的动力将永恒。”

尽管现在网络引擎巨头们通过“搜索”赚足了钱,但弗莱切却毫无遗憾。

他说:“我父母为我感到自豪,我的妻子和孩子也为我感到自豪。这些对我来说更有价值。所以,我活得很快乐。”

(编译/责编:孙晨)

更多有关此项报道的内容