原理:通过京东开放的API,用requests库获取商品底下的评论信息。
1.在源码页面找到URL地址,及京东开放的user-agent;
2.在web页面分析评论语句结构,用正则表达式匹配构造,获取关键数据;
3.for循环获取数据并放入列表;
4.将存有评论的dataframe处理后,导出为excel;
5.将带有用户名、时间、产品名称、评论等信息的excel表格进行简单分析;
后续:可将评论信息通过idf、k-means算法等进行情感分析、语义分析。
京东商品评论爬取思路&步骤
于 2025-05-15 13:45:31 首次发布