自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 python爬取电影热评生成高频词词云

目标:针对一部电影,爬取他的热评高频词,并生成词云分解目标:1、爬取热评内容,只保留文本部分2、热评文本保存到本地的txt文档,以便后续的分词3、文本分词4、生成词云1、爬取热评拿到一个电影:https://movie.douban.com/subject/27010768/这是他的热评列表https://movie.douban.com/subject/27...

2019-09-27 15:29:09 1489

原创 scrapy执行常见错误及解决方案

一个简单项目,爬取豆瓣top250书单运行方法:在cmd中运行 创建main.py运行在编译器中运行main文件,提示:在cmd中输入指令:scrapy crawl douban也出现以上错误,或者出现:没找到pywin32解决方案:注意main文件与scrapy.cfg文件同级 运行时(cmd或编译器)路径切换到scrapy.cfg的所在文件夹位置 先安装py...

2019-04-01 12:30:02 1352

原创 python爬取下厨房本周受欢迎菜谱

下厨房本周最受欢迎菜品:http://www.xiachufang.com/explore/爬取代码:import requestsfrom bs4 import BeautifulSoupres=requests.get('http://www.xiachufang.com/explore/')html=res.textsoup=BeautifulSoup(html,'...

2019-03-12 12:11:08 2783 1

原创 请教python3爬取没数字的星级?

请教:星级的源码是这样的,如何用python3爬取星级呢?初学者,求大佬们赐教o(╥﹏╥)o其他的书名和价格都可以拿到,就是这个星级不知道咋办import requestsfrom bs4 import BeautifulSoupres=requests.get('http://books.toscrape.com/catalogue/category/books/travel_2/...

2019-03-11 16:27:34 751 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除