![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
庸医2048
edgex foundry开发工程师
展开
-
报错
org.dom4j.DocumentException: null Nested exception: null at org.dom4j.io.SAXReader.read(SAXReader.java:484) at org.dom4j.io.SAXReader.read(SAXReader.java:343) at com.spider.util.util.init(util.java原创 2017-02-25 08:02:18 · 322 阅读 · 0 评论 -
日期格式转化
如何把日期格式转成标准的日期格式:Mar 2, 2017原创 2017-03-07 17:56:19 · 571 阅读 · 1 评论 -
redis常用命令汇总
String:set k1 dd --->ddget k1 ----->ddset k2 1 --->1incr k2 ---->2decr k2 --->1incrby k2 2 --->3decrby k2 2 -->1原创 2017-05-08 06:30:45 · 390 阅读 · 0 评论 -
Java与Unix时间戳的相互转换
转载地址:http://blog.csdn.net/YLBF_DEV/article/details/52441545Java将Unix时间戳转换成指定格式日期当从服务器获取数据的时候,有时候获取的数据中的时间在很多的情况下是时间戳类似于这样1473048265,当然,我们不可能将这些数据以时间戳的形式展示给用户,通常情况,是要对这个时间戳进行一系列的处理加工,使其变成我们转载 2017-05-05 17:01:58 · 920 阅读 · 0 评论 -
爬虫代理IP
爬虫代理:http://blog.csdn.net/championhengyi/article/details/70667359githubhttps://github.com/championheng/Crawl-and-IP-proxy-pools-regularly转载 2017-05-14 10:08:03 · 366 阅读 · 0 评论 -
设计模式详解
一、设计模式的分类总体来说设计模式分为三大类:创建型模式,共五种:工厂方法模式、抽象工厂模式、单例模式、建造者模式、原型模式。结构型模式,共七种:适配器模式、装饰器模式、代理模式、外观模式、桥接模式、组合模式、享元模式。行为型模式,共十一种:策略模式、模板方法模式、观察者模式、迭代子模式、责任链模式、命令模式、备忘录模式、状态模式、访问者模式、中介者模式、解释器模式原创 2017-05-04 07:32:05 · 451 阅读 · 0 评论 -
Lucene修改停用分词器添加新的需要停用的单词
代码:第一步:创建自己的分词器public final class MyStopAnalyzer extends Analyzer { //继承Analyzer这个类 private Set stops; public MyStopAnalyzer(String[] sws) { //构造方法 stops=StopFilter.makeStopSe原创 2016-12-24 18:59:46 · 1160 阅读 · 1 评论 -
Httpclient通过代理访问网络
参考链接:http://blog.csdn.net/ffm83/article/details/41955871 博主:阿饭同学转载 2017-04-12 17:52:05 · 935 阅读 · 0 评论 -
爬虫之标签定位记录
1、如何定位ul li下特定的 第一个,第二个,第三个,或其他li呢?解答:li:nth-child(2)原创 2017-03-31 10:41:30 · 1866 阅读 · 0 评论 -
join 和 yield
join 是合并线程。(当线程中使用t.join的意思就是说,执行完当前的线程,才能执行其他线程。)yield是暂停线程,是一个静态的方法。 但是 不是一个绝对的暂停,就是一会可能cpu又调度到了。当这个Thread.yield写在哪个线程中,就暂停那个线程。原创 2017-03-18 11:23:19 · 562 阅读 · 0 评论 -
PriorityBlockingQueue的“优先级“
PriorityBlockingQueue的“优先级“优先级 阻塞队列是如何优先的呢?优先级主要是实现阻塞队列中的存储的对象必须实现 Comparable接口,然后PriorityBlockingQueue 队列就通过排序取出相应的元素。和其他的队列的区别,主要是优先级的区别。和传统的队列先进先出,后进先出 不一样。public class PriorityBlocking原创 2017-03-18 10:28:11 · 2415 阅读 · 0 评论 -
手工写一个分词器
为了能分一些特殊的字典就写了一个简单的分词器,给自己使用。package com.mifan.batch.analyzer.classifier.multipleclassifier.documentsclassifier;import com.mifan.batch.analyzer.classifier.multipleclassifier.util.ChangeToLower;im原创 2017-05-24 11:25:58 · 727 阅读 · 0 评论