- 博客(5)
- 资源 (10)
- 问答 (1)
- 收藏
- 关注
原创 这段时间的收获
好些日子没有发博客了。前面一段时间研究各种网络爬虫,想设计出一个更高效主题定时爬虫程序,想法只停留在在初期的简易爬虫上面,虽然实现了对网页的多线程下载,但是爬取策略以及一些关于主题爬虫算法都还没有实现。自己也是冥思苦想了好久,一直没有想到更好的解决方法。就这样我的爬虫学习计划不了了之了。后面又开始研究了分词系统什么Ik啦,庖丁啦,mmseg4j,smartanalyzer等有关分词的东西,又从网上
2012-02-14 20:29:49 986
转载 毕业后五年拉开差距的原因在哪里?
毕业后,有人工作,有人继续上学。。。看了这篇文章真的让我受益匪浅,给人很大启迪,所以推荐给各位朋友来学习,希望它能帮到正在迷茫中的你,如 果你看完之后又一种“相见恨晚”的感觉,特别激动,希望你能好好珍惜这篇文章,想想多年以后 ,再来看这篇文章,一定有不同的感觉。。。正如“打工皇帝”唐骏说:我觉得有两种人不要跟别人争利益和价值回报。第一种人就是刚刚进入企业的人,头5年千万不要说你能不能多给我一点
2012-02-11 22:38:59 878
原创 基于dyse同学的网络爬虫模型的学习和实现(一)
网络爬虫的原理,简单的来说,就是通过http,socket连接来获得指定URL对应的 网页内容。显然单存的下载网页是不够的,要不爬虫怎么能够持续的获得更多的网页呢~实现网络爬虫肯定需要在已下载的网页中提取其中的超级链接,即该网页的出链。爬虫得到这些超级链接继续进行网页内容的下载,但是这就会遇到一个问题,爬虫可能重复爬取已经爬过的网站。那么这就需要进行URL的分类,一类访问过得队列,一类未访问过得队
2012-02-05 23:50:32 2366
原创 java.sql.SQLException: Access denied for user 'root'@'localhost' (using password: YES)的一种解决方法
昨天晚上就为了连个数据库,搞到2点都没有连上,一直出现这个问题java.sql.SQLException: Access denied for user 'root'@'localhost' (using password: YES)网上网友的解决方法页各有千秋记忆里大概有3种吧,一种认为是要修改root的密码,一种认为是远程连接的权限被限制了,一种是通过写一个文件在Dos里面运行
2012-02-05 11:42:09 123203 12
原创 基于Lucene3.5.0如何从TokenStream获得Token
通过学习Lucene3.5.0的doc文档,对不同release版本 lucene版本的API改动做分析。最后找到了有价值的改动信息。LUCENE-2302: Deprecated TermAttribute and replaced by a new CharTermAttribute. The change is backwards compatible, so mixed new/old
2012-02-01 17:36:57 12769 4
Java Concurrency in Practice.mobi
2017-09-20
Java Concurrency in Practice(Java并发编程实战)
2017-09-20
大数据处理算法课件
2012-06-25
任意位整数相加
2012-06-01
基于lex的shell简单实现
2012-05-31
A*解决8数码问题Java版
2012-05-05
Flex4.5做的3D网页效果展示墙
2012-03-13
大数据相关技术很多,怎么选择合适的学习方向?
2016-06-27
TA创建的收藏夹 TA关注的收藏夹
TA关注的人