搜索
文章平均质量分 80
驰驰的老爸
IT民工一枚,长期耕耘于JAVA, JS,LINUX一线,现在努力提高机器学习方面的技能。
展开
-
9个基于Java的搜索引擎框架
在这个信息相当繁杂的互联网时代,我们已经学会了如何利用搜索引擎这个强大的利器来找寻目标信息,比如你会在Google上搜索情人节如何讨女朋友欢心,你也会在百度上寻找正规的整容医疗机构(尽管有很大一部分广告骗子)。那么如果在你自己开发的网站系统中需要能让用户搜索一些重要的信息,并且能以结构化的结果展现给用户,下面分享的这9款Java搜索引擎框架或许就可以帮助到你了。 1、Java 全文搜索引擎框转载 2014-09-04 13:49:09 · 4225 阅读 · 0 评论 -
互联网网站的反爬虫策略浅析
今天路上时间有点长,路上看了一篇robbin一篇很早的博客,觉得不错,扩展了视野,总结一把,顺便转载呵呵。 防止爬虫干扰正常访问的方法: 1、监控TCP连接(netstat查看80的端口),这个比较常用; 2、分析web请求中的User-Agent和refer信息; 3、搞个计数器,把特定ip一天内的总次数和每秒内的频率记录下来,达到实时拦截的目的(这个类似淘宝的TMD,用转载 2014-11-04 22:07:04 · 993 阅读 · 0 评论