- 博客(1)
- 资源 (8)
- 问答 (1)
- 收藏
- 关注
原创 使用httpclient、htmlcleaner 、xpath 采集新浪微博3G站点数据
0、背景 原来对新浪微博的采集主要靠对weibo.com这个入口进行,但是最近发现有人使用weibo.cn这个入口操作。应为weibo.cn对应的是微博的3g版本,基本没有广告,页面小,这样下载数据量会小很多,并且3g版本的采集比较简单。于是就有了这个3g版本的采集程序。 写出来,分享给大家,希望对有需要的朋友有所帮助。 使用到的类库:httpclient、htmlcleaner
2013-02-15 23:48:39 7930 2
MSXML6.0 SDK
安装之后文档在C:\Program Files\MSXML 6.0\Docs目录
不想在此下载的可到如下地址下载:
http://www.microsoft.com/downloads/details.aspx?FamilyID=993c0bcf-3bcf-4009-be21-27e85e1857b1&displaylang=en
2009-08-30
Linux - Teach Yourself Shell Programming in 24 Hours
Linux - Teach Yourself Shell Programming in 24 Hours
2008-04-20
Java与c++进行Socket通信问题--求帮助
2011-05-14
TA创建的收藏夹 TA关注的收藏夹
TA关注的人