自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 有哪些好用的互联网数据抓取,数据采集,页面解析工具?

1、 互联网刚兴起的时候,数据索引是个大问题,当时Yahoo的分类页面着实火了一阵子。2、随着互联网数据量越来越大,Google,百度等搜索引擎火了起来。这个阶段,几乎没有比搜索引擎更火的技术了,连带分词技术都火得一塌糊涂。紧接着, Nutch等开源搜索引擎也横空出世,让人一见倾心!很多人,很多公司都尝试过用它们来做商业用途。但这些东西牛叉是牛叉,真正用起来就不总那么顺畅。一是不太稳定;二是过于复

2015-10-23 18:03:24 14562

原创 QING:免费好用的文本浏览器,爬虫模块

向大家介绍一款非常好用的文本浏览器,爬虫模块。免费好用。下载地址为:http:/www.qcreader.com/download.html。 QING非常合适用于从网上抓取深度数据,快速搭建自己的定向数据引擎。如果我们使用各种工具,依然无法建立一个合适于自己的数据系统,那么,QING可能是个不错的选择。 QING的目标在于准确的抓取到一切可在网页上呈现的数据,并以合适于程序批量处理的方式输出。

2015-10-23 10:04:18 577

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除