自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 资源 (3)
  • 收藏
  • 关注

原创 温度 筛选

温度筛选

2022-01-07 00:39:50 327

原创 淘宝双十一

2022-01-07 00:38:51 302

原创 拉勾网数据处理与分析

import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport matplotlib as mpldf=pd.read_table('拉勾.txt',sep=';')df.columns=['应聘职位','地址','公司名称','工资','经验','学历','公司特点','公司人数']df.reindex(columns=df.columns)dfdf.info()df.duplicated()..

2022-01-05 20:46:46 434

原创 天猫订单数据分析

import pandas as pddf = pd.read_csv('tmall_order_report.csv')df.head(50)df.columnsdf.describe()df.info()df.isnull().sum()#缺失值的查看,订单付款时间为空说明没有付款df.duplicated().sum()#重复值查看df.columnsdf.columns = df.columns.str.strip()#去列名的空值df.columnsdf.s.

2022-01-05 20:45:49 687

原创 去哪儿网数据预处理与分析

import numpy as npimport pandas as pddf=pd.read_csv('C:/Users/15451/data/qunar_freetrip.csv',encoding='gbk',sep='\t')df.head()df.describe()df.info()df.columns data=df.rename(columns=lambda x: x.strip())data.head(2)data.columnsdata1=data[[.

2022-01-05 20:43:25 217

原创 双十一淘宝美妆数据分析

import numpy as npimport pandas as pddf =pd.read_csv('C:/Users/15451/双十一淘宝美妆数据.csv',sep=',')dfdf['update_time'].uniquedf.columnsdf.isnull().sum()df.fillna(0,inplace=True)df[df.duplicated()].count()df=df.drop_duplicates()df.reset_index(drop.

2022-01-05 20:39:31 1988 1

原创 美妆类商品数据分析与挖掘

import pandas as pdproduct=pd.read_excel('日化.xlsx',sheet_name='商品信息表')order=pd.read_excel('日化.xlsx',sheet_name='销售订单表')result=pd.merge(order,product,on='商品编号',how='inner')resultproduct.info()order.info()## (1)缺失值处理product.isnull().sum()orde.

2022-01-05 20:30:22 429

原创 二手房数据预处理与分析

import pandas as pdimport numpy as npdf=pd.read_table('data\lianjiahouselist.txt',sep=';')df.columns=['编号','省','市','区县','位置','详细地址','单价','总价','户型','楼层','面积','户型结构','套内面积','建筑类型','朝向','建筑结构','装修类型','梯户比','有无电梯','上传时间','房屋类型','住宅类型','抵押情况']df.reindex(co.

2022-01-05 20:27:29 869

原创 去哪儿网数据分析

import pandas as pdimport numpy as npdf=pd.read_csv('C:/Users/15451/data/1.csv')dfdf.info()df[df.价格<1000]df[(df.价格<1200)&(df.出发地=='成都')]df[df.价格.between(1000,2000)].sort_values(by='价格')df.groupby('出发地')['路线名'].size()df.groupby('出发.

2022-01-05 20:25:20 570

1_lianjia.html

1_lianjia.html

2022-01-06

Untitled (1).html

Untitled (1).html

2022-01-06

pyecharts.html

pyecharts.html

2022-01-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除