WeiboSpider
文章平均质量分 86
Phospher_Lau
这个作者很懒,什么都没留下…
展开
-
谈谈我的首个开源项目WeiboSpider(1)——单元测试
我眼中的单元测试 实际上我接触单元测试的时间并不算短,大三的时候就有一门课是讲测试的,我很早就知道什么是单元测试,要怎么设计测试用例。当然我不打算在博客中炫耀自己的理论知识,所以不要期待我在博客中介绍边界值法、逻辑覆盖、路径覆盖什么的。但把单元测试真正用在实际项目中,还是去年的事情,就算做毕业设计,我也没有写单元测试。 去年我工作的团队开始推广单元测试,当然我不原创 2013-05-20 23:14:49 · 1211 阅读 · 0 评论 -
谈谈我的首个开源项目WeiboSpider(0)——WeiboSpider的总体架构
为什么是微博爬虫? WeiboSpider,顾名思义就是一个微博的爬虫。去年(2012年)年中的刚开始学习python的时候,我同时在看一本关于自然语言识别的书。对自然语言识别有兴趣是因为看了吴军博士的《数学之美》,而且随着数据挖掘、大数据的兴起,自然语言处理在互联网中会有越来越多的应用。 但学习自然语言处理是需要语料的,特别我感兴趣的是统计的识别方法而不是基于原创 2013-05-14 23:49:51 · 2232 阅读 · 0 评论