前言
之前学过一点点关于全文检索相关的技术,当时使用的是Java语言,Lucene和compass框架。有兴趣的话可以参考下面的专栏链接
http://blog.csdn.net/column/details/lucene-compass.html
然后现在用的是Python了,所以需要迭代一下。网上搜索了下,相关的还真不少,还有pylucene,但是相比较而言,whoosh更为出色。那今天就用它吧。
安装它也比较简单。
pip install whoosh
这样就可以了。
目标: 对自己的博客进行“站内搜索”,来稍微改善一下CSDN站内查找的缺点。
模块化
最近越来越喜欢把任务模块化了,这样单个的功能也比较容易管理,而且整合的时候对集成测试也比较方便。或者添加新功能,重构,都很方便。