自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 第12期DataWhale组队学习作业

第12期DataWhale组队学习作业一、2002-2018上海机动车拍照拍卖import pandas as pd#问题1 哪一次拍卖的中标率首次小于5%df['中标率']=df['Total number of license issued']/df['Total number of applicants']df_auction_rate=df[df['中标率']<0.05...

2020-05-01 23:44:28 322

原创 大量csv数据合并

单行单列的添加,用append和assign即可(append也可以把一个表加到另一个表后边)对于大型的csv文件进行合并,字段匹配,需要用到下面的方法一不是重点,二和三是一、combine和update,表的填充函数1.combine(1)根据列均值大小填充df1 = pd.DataFrame({'A': [1, 20], 'B': [3, 4]})df2 = pd.DataFra...

2020-04-29 22:28:13 2123

原创 Pandas变形,透视表与stack

透视表与stack一、透视表1.pivot一般状态下,数据在DataFrame会以压缩(stacked)状态存放,例如上面的Gender,两个类别被叠在一列中,pivot函数可将某一列作为新的cols:df.pivot(index='ID',columns='Gender',values='Height').head()#ID,性别身高都是表中的列,根据性别不同分两列,表中内容为身高...

2020-04-27 19:38:08 420

原创 Pandas分组方法groupby和聚合函数agg相关

一、groupby函数(a)根据某一列分组grouped_single = df.groupby('School')groupby分组后会生成一个groupby对象,该对象不会返回任何东西,只有当相应方法被调用才会起作用比如取出一个组grouped_single.get_group('S_1')(b)根据某几列分组grouped_single= df.groupby(['Scho...

2020-04-26 22:07:04 1645

原创 pandas筛选与排序

pandas筛选排序处理csv文件必备常见筛选注:df为已读取的csv文件文中df后跟的字段名称多为列名字(1)简单直接筛选A列大于0df[df['A']>0]df.iloc[:3,:][df.ON_LINE_NUM<100]df[df['Gender']=='F'](2)isin方法E列中值为two和four的df2[df2['E'].isin(['two'...

2020-04-23 16:04:12 448

原创 csv文件数据处理基本操作和基础函数

Pandas基础一、文件读取和写入import pandas as pd1.读取df=pd.read_csv(‘文件名字’)csv格式用read_csvtxt格式用read_tableexcel格式用read_excel2.写入指输出已处理的数据df.to_csv(‘文件名字’)excel格式用to_excel二、基本数据结构主要有series和dataframe1.s...

2020-04-20 21:32:21 2419

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除