前言
嗨喽~大家好呀,这里是魔王呐 ❤ ~!
开发环境:
-
Python 3.8
-
Pycharm
模块使用
-
requests
-
jieba 结巴分词
-
wordcloud 词云
第三方模块安装:
win + R 输入cmd 输入安装命令 或 在pycharm中点击Terminal(终端) 输入安装命令
如果出现爆红, 可能是因为 网络连接超时, 可切换国内镜像源,命令如下:
pip install -i https://pypi.doubanio.com/simple/ requests
数据来源分析
明确需求 <数据来源分析>
-
采集数据是什么东西? 通过那个url地址得到想要数据的内容
-
抓包分析: 浏览器自带工具 --> 开发者工具
I. F12 或者 鼠标右键点击检查 选择 network 点击第二页
II. 复制评论内容, 在开发者工具里进行搜索, 可以直接找对应评论数据包
代码展示
获取数据
1. 发送请求
请求链接
url = 'https://****/comment/productPageComments.action'
请求参数 --> 字典数据类型 构建完整键值对
data = {
# 'callback': 'fetchJSON_comment98',
'productId': '100029079354',
'score': '0',
'sortType': '5',