java web
1. redis命令大全:http://doc.redisfans.com/
2. dubbo中文文档:http://dubbo.io/User+Guide-zh.htm
3. Maven资源版本查询:http://mvnrepository.com/
4. Maven视频教程:http://www.icoolxue.com/album/show/45
5. 命令行执行java xxx时,如何引用jar包:http://blog.sina.com.cn/s/blog_6aefe4250101fksp.html
DB
1. 数据迁移工具DataX:http://code.taobao.org/p/datax/wiki/DataX%E4%BA%A7%E5%93%81%E8%AF%B4%E6%98%8E/
2. DataX安装教程:
http://www.myexception.cn/open-source/1866902.html
http://yangyoupeng-cn-fujitsu-com.iteye.com/blog/1832143
爬虫、分词和搜索
1. 开源的java分词工具HanLP:http://www.hankcs.com/nlp/hanlp.html
训练分词模型:https://github.com/hankcs/HanLP/wiki/%E8%AE%AD%E7%BB%83%E5%88%86%E8%AF%8D%E6%A8%A1%E5%9E%8B
2. 输入法词库解析工具深蓝词库转换:http://www.cnblogs.com/studyzy/archive/2012/11/02/2751543.html
3. 爬虫服务:神箭手
4. XPath教程:http://www.zvon.org/xxl/XPathTutorial/General_chi/examples.html
5. 爬虫教程:http://blog.csdn.net/youmumzcs/article/details/51396283
6. 搜狗搜索微信订阅号及文章:http://weixin.sogou.com/
7. lucene简介:http://www.cnblogs.com/xing901022/p/3933675.html
8. Solr:http://www.hankcs.com/nlp/segment/full-text-retrieval-solr-integrated-hanlp-chinese-word-segmentation.html
9. Tesseract图像识别-样本训练:https://my.oschina.net/lixinspace/blog/60124
10.openNLP-训练模型:http://blog.csdn.net/qdhy199148/article/details/51038637
11. 人民日报中文语料库:http://www.icl.pku.edu.cn/icl_res/
笑话
http://haha.sogou.com/666213/