利用在京东上爬取的商品评论做分析
1.读入数据
Python中读入数据,查看数据
import pandas as pd
import re
import os
os.chdir("C:/Users/Administrator/Desktop")
base_data = pd.read_excel('A.xls')
base_data.head()

2.对数据进行处理
base_data.drop_duplicates(inplace=True)#删除重复值
base_data.info()
import matplotlib.pyplot as plt
import seaborn as sns
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus'] = False#定义过后可以显示中文
sns.heatmap(base_data.isnull(), yticklabels=False, cbar=False, cmap='viridis', ) # yticklabels=False 不显示纵轴 cmap 颜色组
plt.title('缺失值查看')
plt.show()
把评论时间的字段进行修改,方便后续使用
base_data['评论时间']= base_data['评论时间'].astype(str)
base_data['评论时间']= base_data['评论时间'].apply(lambda x :re.sub("\D", "", x) )
base_
本文讲述了如何利用Python爬取京东商品评论,并对评论数据进行处理,包括调整评论时间字段格式和处理评论长度,接着进行数据探索,对评论内容进行深入分析。
最低0.47元/天 解锁文章
974

被折叠的 条评论
为什么被折叠?



