鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
u1s1是什么意思?干饭人又是个啥?
当在北戴河阿那亚的剧场里被突然问到类似稀奇古怪的问题,一时发懵的我只想当场掏出手机,给对方来个“百度一下”。
说起来,搜索这项“旧技术”最近的讨论声浪还真有点大。
君不见那边新搜索工具广告天天见,这厢听着海风看话剧的百度万象大会现场,老牌搜索引擎也打出了“百度一下 生活更好”的新Flag。
其实,正如百度集团执行副总裁沈抖现场所说,大家对搜索太过熟悉,以至于感受不到其中技术的变革,搜索的技术存在感那是真“感知不强”。
但实际上,“AI技术为搜索提供了持续进化的动力”。
要知道,从古早的文本检索到今天的人工智能,网络世界的网页数量已经从千万级别,增长到了千亿级别,其中囊括的内容可能比世界上所有图书馆加起来还要丰富。
在今天,想要高效连接今天的互联网用户和海量信息,搜索引擎其实真的没那么简单。
那么,究竟是怎样的技术在驱动搜索引擎更智能地读懂你的需求,连接丰富而又准确的信息?
技术本身在海量信息增长面前,又经历了怎样的进化?
今天,不如就借着这阵势,我们来好好说道说道。
从文本检索到人工智能
现在,在使用搜索引擎时,你可能不只会用几个关键词,还会直接输入你想问的问题。
但其实早期的搜索引擎采用的是文本检索的方式,只能做到用户查询关键词和网页文本内容的匹配。
可想而知,虽然这样的方式也能把不同网页的关联度进行排序,但总体的搜索质量是比较差的。
而实际上,网页之间有着丰富的链接关系,就像高引论文往往本身质量更高,高质量的网页通常也会被更多的网页链接。
为了进一步挖掘和利用这种链接信息,1996年