自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 京东商品评论爬取思路&步骤

京东商品评论爬取思路&步骤原理:通过京东开放的API,用requests库获取商品底下的评论信息。1.在源码页面找到URL地址,及京东开放的user-agent;2.在web页面分析评论语句结构,用正则表达式匹配构造,获取关键数据;3.for循环获取数据并放入列表;4.将存有评论的dataframe处理后,导出为excel;5.将带有用户名、时间、产品名称、评论等信息的excel表格进行简单分析;后续:可将评论信息通过idf、k-means算法等进行情感分析、语义分析。

2025-05-15 13:45:31 839

原创 关于EXCEL做表的一些思考

一、.影响速度的2个关键点:1.清洗数据,8月份的数据可提前一天做好2.统计、汇总,多利用匹配、透视表行列格式,做到图表模板化

2020-09-18 13:11:55 156

原创 SQL查询语句

Where查询子句练习select * from order_info_table where product_id between 1002 and 1003;select * from order_info_table where user_id in (1,3,5);select * from order_info_table where order_status=‘pay’;select * from order_info_table where user_name like ‘li%’;

2020-09-16 12:59:34 83

原创 LINUX基础

Linux基础命令>:覆盖>:追加

2020-04-02 14:33:57 98

原创 Pandas(2)

shift+tab:查看参数1.pandas数据集成通过用numpy的concatenate方法进行级联nd3=np.concatenate([nd1,nd2],axis=0)如果相同行不同列的数据集进行级联,那么使用列的级联(axis=1),形成一个两个数据聚求和之后的列的级联nd3=np.concatenate([nd1,nd2],axis=1)nd3追加数据到末尾,汇总数据:...

2019-10-17 20:25:17 195

原创 Pandas

导入模块和方法import numpy as npimport pandas as pdfrom pandas import Series,DataFrame1.pandas的基本结构:Series:单层数据结构定义:s=Series(data=[12,11,33],index=[‘math’,‘english’,‘chinese’])DataFrame:多层数据结构定义:df=D...

2019-10-14 22:05:01 122

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除