BeautifulSoup + Request 爬虫实践记录
算法的实现先暂时告一段落,最近有些忙。下面介绍一下最近在干的东西---数据挖掘之数据获取之爬虫。爬虫:网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。其主要目的就是爬取一定的数据。本次的爬虫,目的是爬取美国的国情咨文。这个网站http://ww...
原创
2018-03-12 23:49:25 ·
497 阅读 ·
0 评论