- 博客(9)
- 资源 (3)
- 收藏
- 关注
原创 拉勾网数据处理与分析
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport matplotlib as mpldf=pd.read_table('拉勾.txt',sep=';')df.columns=['应聘职位','地址','公司名称','工资','经验','学历','公司特点','公司人数']df.reindex(columns=df.columns)dfdf.info()df.duplicated()..
2022-01-05 20:46:46 434
原创 天猫订单数据分析
import pandas as pddf = pd.read_csv('tmall_order_report.csv')df.head(50)df.columnsdf.describe()df.info()df.isnull().sum()#缺失值的查看,订单付款时间为空说明没有付款df.duplicated().sum()#重复值查看df.columnsdf.columns = df.columns.str.strip()#去列名的空值df.columnsdf.s.
2022-01-05 20:45:49 687
原创 去哪儿网数据预处理与分析
import numpy as npimport pandas as pddf=pd.read_csv('C:/Users/15451/data/qunar_freetrip.csv',encoding='gbk',sep='\t')df.head()df.describe()df.info()df.columns data=df.rename(columns=lambda x: x.strip())data.head(2)data.columnsdata1=data[[.
2022-01-05 20:43:25 217
原创 双十一淘宝美妆数据分析
import numpy as npimport pandas as pddf =pd.read_csv('C:/Users/15451/双十一淘宝美妆数据.csv',sep=',')dfdf['update_time'].uniquedf.columnsdf.isnull().sum()df.fillna(0,inplace=True)df[df.duplicated()].count()df=df.drop_duplicates()df.reset_index(drop.
2022-01-05 20:39:31 1988 1
原创 美妆类商品数据分析与挖掘
import pandas as pdproduct=pd.read_excel('日化.xlsx',sheet_name='商品信息表')order=pd.read_excel('日化.xlsx',sheet_name='销售订单表')result=pd.merge(order,product,on='商品编号',how='inner')resultproduct.info()order.info()## (1)缺失值处理product.isnull().sum()orde.
2022-01-05 20:30:22 429
原创 二手房数据预处理与分析
import pandas as pdimport numpy as npdf=pd.read_table('data\lianjiahouselist.txt',sep=';')df.columns=['编号','省','市','区县','位置','详细地址','单价','总价','户型','楼层','面积','户型结构','套内面积','建筑类型','朝向','建筑结构','装修类型','梯户比','有无电梯','上传时间','房屋类型','住宅类型','抵押情况']df.reindex(co.
2022-01-05 20:27:29 869
原创 去哪儿网数据分析
import pandas as pdimport numpy as npdf=pd.read_csv('C:/Users/15451/data/1.csv')dfdf.info()df[df.价格<1000]df[(df.价格<1200)&(df.出发地=='成都')]df[df.价格.between(1000,2000)].sort_values(by='价格')df.groupby('出发地')['路线名'].size()df.groupby('出发.
2022-01-05 20:25:20 570
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人