项目截图
README.txt
编写爬虫程序实现通过搜索抓取京东商品信息
对抓取数据进行清洗,把商品名称,评价数量数量,店铺名称,商品详情链接,价格信息清洗出来。
使用店铺名称和评价数量绘制出柱形图
对商品名称进行文本分析,随机抽取6个商品名称做为样本,然后去结果集中进行文本相似度计算或者词频统计,统计出卖该6个商品的商家数量,并根据售卖的商家数量绘制饼形图
完成课程设计报告内容编写,按时提交
文件标注
STSong.ttf 字体
京东商品.csv 数据文件
京东商品可视化.py 可视化
京东商品数据清理.py 清理
商品多页采集.py 采集
商品评论数.py 获取评论数
清洗后京东商品.csv 数据文件
运行步骤
商品多页采集.py —> 商品评论数.py -> 京东商品数据清理.py -> 京东商品可视化.py
本项目采集的是iphone15
需要更换的是cookie
一共两个文件中用到了cookie
分别是
商品多页采集.py
商品评论数.py
商品多页采集.py