python-淘宝商品评价可视化

项目截图
README.txt
采集淘宝某一商品评价 (10 分)
对抓取数据进行格式清洗,不能包括特殊标点符号,换行符。(10 分)
对清洗完的数据进行情感分析,统计出好评,差评,中性评论数,并根据次数绘制出饼形图。(10分)
对好评进行文本分析,提取好评关键词,并过滤掉没有意义的词,绘制出好评关键词出现次数的柱状图返回前6个(10分)
对好评进行文本分析,提取好评关键词,并过滤掉没有意义的词,绘制出好评,差评的词云图(20 分)
文件标注
商品评论数据采集.py 采集数据
情感分析.py 情感分析
好评柱状图.py
好评词云图.py
差评词云图.py
注意 不然可视化有问题
pip install xlrd==1.2.0
本文爬取的网址:
https://h5.m.taobao.com/app/rate/www/rate-list/index.html?auctionNumId=535461632510
关注点是商品评论数据采集.py采集数据这里
这里是页数 也就是从第几页到第几页(一页 10个评论信息)
需要更换的地方
cookie和token
cookie获取地址:
打开网页
https://h5.m.taobao.com/app/rate/www/rate-list/index.html?auctionNumId=535461632510
进入F12
搜索
https://h5api.m.taobao.com/h5/mtop.taobao.rate.detaillist.get/6.0/?jsv=
复制请求的cookie
token的位置在cookie中
把cookie粘贴进入一个文本
搜索
_m_h5_tk
主要前面这一些 也就是bf6a8cd64e9a23bb5f153d0e0d25b009
就可以跑了
ps:
问题1:
出现:
{'ret': ['FAIL_SYS_USER_VALIDATE', 'RGV587_ERROR::SM::哎哟喂,被挤爆啦,请稍后重试'], 'data': {'url': 'https://h5api.m.taobao.com:443//h5/mtop.taobao.rate.detaillist.get/6.0/_____tmd_____/punish?x5secdata=xd03e3a1669676cce6beb9d44cd4c6a6c09d35ffbcd2f43c341702961689a-717315356a1703520446abbzc3aaa__bx__h5api.m.taobao.com%3A443%2Fh5%2Fmtop.taobao.rate.detaillist.get%2F6.0&x5step=2&action=captcha&pureCaptcha=‘}}
需要刷新页面 过了滑块 代码换新cookie
问题2
出现如下报错是因为token不对 需要更换cookie和token
{'api': 'mtop.taobao.rate.detaillist.get', 'data': {}, 'ret': ['FAIL_SYS_ILLEGAL_ACCESS::非法请求'], 'v': '6.0'}
  • 7
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值