- 博客(2)
- 收藏
- 关注
原创 Python3爬取前程无忧数据分析工作并存储到MySQL
1、导入包import requests #取数from lxml import etree #用xpath解析import pymysql #连接数据库import chardet #自动获取编码2、获取单页htmldef get_one_page(url): headers = {'User-Agent':'Mozilla/5.0 (Windows NT ...
2019-06-11 20:03:12 6664 6
原创 [超详细] Python3爬取豆瓣影评、去停用词、词云图、评论关键词绘图处理
爬取豆瓣电影《大侦探皮卡丘》的影评,并做词云图和关键词绘图第一步:找到评论的网页url。https://movie.douban.com/subject/26835471/comments?start=0&limit=20&sort=new_score&status=P第二步:鼠标放在评论上右键检查,分析源代码,确定抓取的内容。 <span class="sh...
2019-06-13 01:55:10 4269 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人