- 博客(6)
- 收藏
- 关注
原创 京东商品评论爬取思路&步骤
京东商品评论爬取思路&步骤原理:通过京东开放的API,用requests库获取商品底下的评论信息。1.在源码页面找到URL地址,及京东开放的user-agent;2.在web页面分析评论语句结构,用正则表达式匹配构造,获取关键数据;3.for循环获取数据并放入列表;4.将存有评论的dataframe处理后,导出为excel;5.将带有用户名、时间、产品名称、评论等信息的excel表格进行简单分析;后续:可将评论信息通过idf、k-means算法等进行情感分析、语义分析。
2025-05-15 13:45:31
839
原创 关于EXCEL做表的一些思考
一、.影响速度的2个关键点:1.清洗数据,8月份的数据可提前一天做好2.统计、汇总,多利用匹配、透视表行列格式,做到图表模板化
2020-09-18 13:11:55
156
原创 SQL查询语句
Where查询子句练习select * from order_info_table where product_id between 1002 and 1003;select * from order_info_table where user_id in (1,3,5);select * from order_info_table where order_status=‘pay’;select * from order_info_table where user_name like ‘li%’;
2020-09-16 12:59:34
83
原创 Pandas(2)
shift+tab:查看参数1.pandas数据集成通过用numpy的concatenate方法进行级联nd3=np.concatenate([nd1,nd2],axis=0)如果相同行不同列的数据集进行级联,那么使用列的级联(axis=1),形成一个两个数据聚求和之后的列的级联nd3=np.concatenate([nd1,nd2],axis=1)nd3追加数据到末尾,汇总数据:...
2019-10-17 20:25:17
195
原创 Pandas
导入模块和方法import numpy as npimport pandas as pdfrom pandas import Series,DataFrame1.pandas的基本结构:Series:单层数据结构定义:s=Series(data=[12,11,33],index=[‘math’,‘english’,‘chinese’])DataFrame:多层数据结构定义:df=D...
2019-10-14 22:05:01
122
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人