![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 74
dh0029314
这个作者很懒,什么都没留下…
展开
-
爬虫的简单应用
这是对 Python网络爬虫与信息提取的一个简单的总结。 在课程中学到的网络爬虫一般分为三个步骤: 网页爬取这里把给定的url的整个网页代码爬取下来def getHTMLText(url): try: r = requests.get(url, timeout=30) r.raise_for_status() r.encoding = r.原创 2017-10-18 23:08:39 · 665 阅读 · 0 评论 -
python爬取数据热点词生成词云
这是当时在中国mooc学 用python玩转数据 时,写的一个小demo.程序实现步骤1.从某一网站爬取数据,比如我是在豆瓣爬取的书评利用Requests库的get()爬取网页 使用BeatifulSoup库对爬取网页进行解析。 写入文件2.对所爬取字符串分词利用分词器 jieba ,逐行用jieba分词,单行代码如:word_list=pseg.cut(subject) 3.去除停用词很多原创 2017-10-18 23:08:24 · 10055 阅读 · 0 评论