![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
搜索
suifeng201
这个作者很懒,什么都没留下…
展开
-
爬虫开发 学习笔记
从[待处理队列]中得到一个URL -> get网页源码 -> 格式化源码-> 提取符合的URL并填入[待处理队列]->提取数据项->存入数据库 第一部分:多线程抓取页面到本地,第二部分多线程分析页面思考如何充分利用网络带宽和磁盘性能,用正则来抓取数据项可以参考Apatch Nutch, Heritrix...2009-12-16 10:48:34 · 70 阅读 · 0 评论 -
elasticsearch 学习笔记(2)-客户端编程【原创】
客户端编程可以自己封装json http请求,也可以采用es客户端API。这里介绍API方式。1. 初始化Client[code="java"]public void init() { String clusterName="elasticsearch"; String ip= "192.168.180.15"; Settings settings = Settings....原创 2016-06-03 16:26:53 · 105 阅读 · 0 评论 -
solr 学习笔记(1)
1. 安装 1) 下载地址: http://apache.fayea.com/lucene/solr/5.4.0/solr-5.4.0.zip 2) 解压到某个目录,并切换到该目录。2. 使用(windows) 1) 启动命令 .\bin\solr start -e cloud -noprompt 2) 索引指定目录的文档 ...原创 2016-02-05 11:02:42 · 105 阅读 · 0 评论 -
solr 学习笔记(2)
[url=http://zhenggm.iteye.com/blog/2275921]上一篇文章[/url]介绍了如何搭建solr服务。这一篇讲其他一些功能。1、停止solr服务.\bin\solr stop -all 2、 删除索引文档rd .\example\cloud /S/Q3、心跳检测bin\solr.cmd healthcheck -c gettingsta...原创 2016-02-05 11:35:29 · 96 阅读 · 0 评论