Feep! search:一款面向程序员的搜索引擎,收录信息超 2900 万页!

公众号关注 「奇妙的 Linux 世界」

设为「星标」,每天带你玩转 Linux !

ac01c8cf944f07ccf4fc10f51f690ebd.jpeg

想让检索代码不再「大海捞针」?就用「Feep! search」。

一款专门面向程序员的搜索引擎,2021年9月才开工,却收录了超过2900万页信息。这样的「编程神器」,你愿意尝试吗?

这两天,草根开发者浮士德发布了一款名为「Feep! search」的搜索引擎。只要在检索框中输入你想找的程序名称,分分钟便能检索出成百上千条成熟代码。

虽然这款「编程神器」还存在着不少问题,却已经令不少苦兮兮的程序猿、程序媛们心驰神往,堪称今年「1024」最好的礼物。

251bc9cb0df13d15494986c3727bffd1.png

Feep! search

「Feep! search」是一款程序员专用的网络搜索引擎,主要用于编程资源的查找。

虽然名称采用了与雅虎(Yahoo!)相似的结构,但与美国门户网站的明贬实褒(Yahoo原意为乡巴佬)不同,「Feep」在《新黑客词典》中特指「终端发出的柔和电子铃声」,尾部的「!」则代表了想要为用户提供令人难忘的服务。

e9ba6b84cef155e17964763555722363.png

目前,「Feep! search」能够检索的信息源,包括DevDocs、Hacker News、Kiwix、Stack Exchange等,甚至还包括一些已索引但未爬网的链接,信息总量超过2900万页——这甚至比谷歌1998年推出的第一款搜索引擎还要多(2600万页)。

据网站作者浮士德介绍,「Feep! search」在检索时会查找它所存储的所有信息,对一些数据进行少量排序,并填充到搜索网站的结果页中。

数据混洗位主要用Node.js编写,许多shell脚本将所有内容粘在一起,排名和全文搜索则由ElasticSearch提供支持。这一切都在他家客厅的HP微型服务器里运行。

9f5d443e0b8cc37fbcc1f0844628e4b4.png

位于浮士德客厅的「Feep! search」服务器

以程序员们最经典的上手程序「hello word」为例,仅用时27毫秒,「Feep! search」那简洁而不简单的界面便检索出超1万条结果。你可以从中轻松找出许多能够实际运行的成熟代码。

ac789e7b48fa7a7c8b14cd9db45d4c15.png

而且,搜索结果的信息来源,也是相当丰富的。

d8c4b078885fdd54ffabd61df71bcdc2.png

在浮士德的帖子下,不少网友表示「Feep! search」真乃程序员的福音:

「很棒的作品。(我)在同一主题不同变体的三次搜索中得到了一些好的答案和有用的链接。」

b31225e4d55fe5868745a4ad97c8434e.png

也有部分网友在体验后发现了问题:

「好主意,但现在的搜索很糟糕。对『django signals』进行检索,第一页得到了非官方的结果,第二页(1)上的所有链接都断了。搜索『go cobra』则根本没有官方文档。」还在最后提出了一些改进建议。

08fc4bf7ad35e0a78697c62e04e8678a.png

美中不足

就连作者自己也承认,因为尚未设置任何搜索运算符或高级搜索语法,导致引擎的搜索结果相当多变,搜索结果的排名不能很好地获得展示。

不过,对于一些检索时的常见问题,作者也在「Query help」页面进行了备注:

  • 单词被词干化(例如「walking」、「walk」等都将被转换为「walk-」),并逐个搜索。目前还没有任何方法可以关闭这个功能,或者搜索完整的短语;

  • 非字母数字字符将被忽略(这意味着你不能搜索符号运算符之类的东西。这对于一个专门为程序员设计的搜索引擎来说非常尴尬。这也是我要着重解决的问题之一);

  • 语句的理解非常肤浅:它不寻找同义词,也不理解同一个词在不同的上下文中可能有不同的含义(这与谷歌截然相反,即使你有非常具体的想法,谷歌也会尽力猜测你的其他意思。哪种方法最有用取决于你寻找的方式)。改变查询的措辞可能会得到一组完全不同的结果;

  • 如果没有搜索到你要找的内容,请尝试添加或删除单词。有时看似微小的调整都会产生巨大的差异。您需要的结果可能就在某个地方,即使可能很难找到;

  • 有时候,好的结果有些被埋没了。建议您多浏览几页,看看要找的内容是不是在后面。

b46997de179559169f3bee6045edb6ce.png

值得一提的是,每页检索结果的末端还提供了Google、DuckDuckGo、Bing和Marginalia四种其他搜索引擎的链接,一键即可进入对应词汇在各大引擎中的检索结果。

作者特别向我们推荐了一款独立的DIY搜索引擎Marginalia Search。与「Feep! search」类似,这是一款专注于推荐「你可能不知道网站」的搜索引擎。这个搜索引擎中的软件都是定制而成,所有的爬网和索引都在内部完成的。

小人物的大梦想

「Feep! search」的作者沃尔夫冈·浮士德(Wolfgang Faust)是一名专业软件开发商和业余爱好者。

通过浮士德的个人网站我们可以了解到,虽然曾发表过大大小小上百项程序,但他却是一名不折不扣的草根开发者。

1709aebe2d79c35706e6d4a7ebd1b3b4.png

正如浮士德个人网站的Slogan「我做了很多不同的事情」所言,2011年至今,他在GitHub上共更新了111条作品,但账号目前也只有25个粉丝。一款名为「yaml-multiline」的开源软件,总计获得过216颗星和16次引用——这已是浮士德开发生涯的扛鼎之作。

a2708e01e521315f8af009b73cc8fe8f.png

不过,他在两大论坛Hacker News和Reddit上却分别收获了4,004和3,712次「功德」,具有极强的表达欲望,也可以说非常努力了。

不管怎么讲,能制作出一款收录接近3000万页信息的搜索引擎,都是一项十分了不起的成就。

毕竟当年Google刚推出时,也同样问题重重。

bba95df079e3b22aac1d3d6d1db81605.png

参考资料:

https://search.feep.dev/about/

https://news.ycombinator.com/item?id=33494221

https://www.wolfgangfaust.com/

本文转载自:「新智元」,原文:https://url.hi-linux.com/BiEGZ,版权归原作者所有。欢迎投稿,投稿邮箱: editor@hi-linux.com。

f46be316347929446d3fefb9e8cb9428.gif

最近,我们建立了一个技术交流微信群。目前群里已加入了不少行业内的大神,有兴趣的同学可以加入和我们一起交流技术,在 「奇妙的 Linux 世界」 公众号直接回复 「加群」 邀请你入群。

e28592598a55a787bfc4cc9aff8c7643.png

你可能还喜欢

点击下方图片即可阅读

027336dd01f2cb65abea317aaa17dec7.png

vhs: 一款超强大命令行录屏神器,Github 星标 7k+

9ac4f117f7d87a7ce7e5b0b90991c6b0.png
点击上方图片,『美团|饿了么』外卖红包天天免费领

19fa51876f98bc397ee9ad29d9a03658.png

更多有趣的互联网新鲜事,关注「奇妙的互联网」视频号全了解!

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值