python
文章平均质量分 74
dh0029314
这个作者很懒,什么都没留下…
展开
-
爬虫的简单应用
这是对 Python网络爬虫与信息提取的一个简单的总结。 在课程中学到的网络爬虫一般分为三个步骤: 网页爬取这里把给定的url的整个网页代码爬取下来def getHTMLText(url): try: r = requests.get(url, timeout=30) r.raise_for_status() r.encoding = r.原创 2017-10-18 23:08:39 · 675 阅读 · 0 评论 -
python爬取数据热点词生成词云
这是当时在中国mooc学 用python玩转数据 时,写的一个小demo.程序实现步骤1.从某一网站爬取数据,比如我是在豆瓣爬取的书评利用Requests库的get()爬取网页 使用BeatifulSoup库对爬取网页进行解析。 写入文件2.对所爬取字符串分词利用分词器 jieba ,逐行用jieba分词,单行代码如:word_list=pseg.cut(subject) 3.去除停用词很多原创 2017-10-18 23:08:24 · 10078 阅读 · 0 评论