- 博客(6)
- 收藏
- 关注
原创 第12期DataWhale组队学习作业
第12期DataWhale组队学习作业一、2002-2018上海机动车拍照拍卖import pandas as pd#问题1 哪一次拍卖的中标率首次小于5%df['中标率']=df['Total number of license issued']/df['Total number of applicants']df_auction_rate=df[df['中标率']<0.05...
2020-05-01 23:44:28 322
原创 大量csv数据合并
单行单列的添加,用append和assign即可(append也可以把一个表加到另一个表后边)对于大型的csv文件进行合并,字段匹配,需要用到下面的方法一不是重点,二和三是一、combine和update,表的填充函数1.combine(1)根据列均值大小填充df1 = pd.DataFrame({'A': [1, 20], 'B': [3, 4]})df2 = pd.DataFra...
2020-04-29 22:28:13 2123
原创 Pandas变形,透视表与stack
透视表与stack一、透视表1.pivot一般状态下,数据在DataFrame会以压缩(stacked)状态存放,例如上面的Gender,两个类别被叠在一列中,pivot函数可将某一列作为新的cols:df.pivot(index='ID',columns='Gender',values='Height').head()#ID,性别身高都是表中的列,根据性别不同分两列,表中内容为身高...
2020-04-27 19:38:08 420
原创 Pandas分组方法groupby和聚合函数agg相关
一、groupby函数(a)根据某一列分组grouped_single = df.groupby('School')groupby分组后会生成一个groupby对象,该对象不会返回任何东西,只有当相应方法被调用才会起作用比如取出一个组grouped_single.get_group('S_1')(b)根据某几列分组grouped_single= df.groupby(['Scho...
2020-04-26 22:07:04 1645
原创 pandas筛选与排序
pandas筛选排序处理csv文件必备常见筛选注:df为已读取的csv文件文中df后跟的字段名称多为列名字(1)简单直接筛选A列大于0df[df['A']>0]df.iloc[:3,:][df.ON_LINE_NUM<100]df[df['Gender']=='F'](2)isin方法E列中值为two和four的df2[df2['E'].isin(['two'...
2020-04-23 16:04:12 448
原创 csv文件数据处理基本操作和基础函数
Pandas基础一、文件读取和写入import pandas as pd1.读取df=pd.read_csv(‘文件名字’)csv格式用read_csvtxt格式用read_tableexcel格式用read_excel2.写入指输出已处理的数据df.to_csv(‘文件名字’)excel格式用to_excel二、基本数据结构主要有series和dataframe1.s...
2020-04-20 21:32:21 2419
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人