- 博客(4)
- 收藏
- 关注
原创 python爬取电影热评生成高频词词云
目标:针对一部电影,爬取他的热评高频词,并生成词云分解目标:1、爬取热评内容,只保留文本部分2、热评文本保存到本地的txt文档,以便后续的分词3、文本分词4、生成词云1、爬取热评拿到一个电影:https://movie.douban.com/subject/27010768/这是他的热评列表https://movie.douban.com/subject/27...
2019-09-27 15:29:09
1489
原创 scrapy执行常见错误及解决方案
一个简单项目,爬取豆瓣top250书单运行方法:在cmd中运行 创建main.py运行在编译器中运行main文件,提示:在cmd中输入指令:scrapy crawl douban也出现以上错误,或者出现:没找到pywin32解决方案:注意main文件与scrapy.cfg文件同级 运行时(cmd或编译器)路径切换到scrapy.cfg的所在文件夹位置 先安装py...
2019-04-01 12:30:02
1352
原创 python爬取下厨房本周受欢迎菜谱
下厨房本周最受欢迎菜品:http://www.xiachufang.com/explore/爬取代码:import requestsfrom bs4 import BeautifulSoupres=requests.get('http://www.xiachufang.com/explore/')html=res.textsoup=BeautifulSoup(html,'...
2019-03-12 12:11:08
2783
1
原创 请教python3爬取没数字的星级?
请教:星级的源码是这样的,如何用python3爬取星级呢?初学者,求大佬们赐教o(╥﹏╥)o其他的书名和价格都可以拿到,就是这个星级不知道咋办import requestsfrom bs4 import BeautifulSoupres=requests.get('http://books.toscrape.com/catalogue/category/books/travel_2/...
2019-03-11 16:27:34
751
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人