自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 数据分析之数据重构二( groupby)

总的来说是:分组-->聚合

2022-03-19 16:40:04 323

原创 数据分析之数据重构一(表的合并)

1、表的合并1.1 使用pd.concat()# 横向合并两张表# 官方文档1表示列也就是列合并 0表示索引也就是行合并df=pd.concat([s1,s2],axis=1)# 纵向合并两张表 axis=0可以不写默认是按行df=pd.concat([s1,s2],axis=0)1.2使用df.join() 、df.merge()进行列合并使用df.append()进行行合并#使用DataFram中的join来实现列合并# 左右合并 other表加入df表中df.

2022-03-18 11:43:05 310

原创 数据分析之数据载入及初步认识

1、数据载入#相对路径载入df = pd.read_csv('train.cvs')#绝对路径导入import ospath = os.path.abspath('train.csv')df = pd.read_csv(path)2、当数据量很大时 逐块读取数据#逐块读取 每次1000个df = pd.read_csv('train.csv',chunksize = 1000)# 查看数据df.get_chunk()3、 将表头改成中文 索引改为乘客IDdf.

2022-03-17 21:21:45 330

原创 python数据清洗

本文来自于DW第二章的第一节部分课总结http://​http://Datawhale/hands-on-data-analysis​数据集:泰坦尼克2、数据清洗2.1缺失值观察与处理2.1.1缺失值观察# 导入数据import numpy as npimport pandas as pddf = pd.read_csv('train.csv')# 查看数据的缺失值# 先查看所有数据的基本信息df.info()Cabin 204 non-null object

2022-03-17 20:58:01 388

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除