【educoder实训答案】Pandas合并数据集

第1关:Concat与Append操作

任务描述
本关任务:使用read_csv()读取两个csv文件中的数据,将两个数据集合并,将索引设为Ladder列,并将缺失值填充为0。

相关知识
在Numpy中,我们介绍过可以用np.concatenate、np.stack、np.vstack和np.hstack实现合并功能。Pandas中有一个pd.concat()函数与concatenate语法类似,但是配置参数更多,功能也更强大,主要参数如下。

参数名 说明

objs:参与连接的对象,必要参数 axis 指定轴,默认为0
join inner或者outer:默认为outer,指明其他轴的索引按哪种方式进行合并,inner表示取交集,outer表示取并集
join_axes:指明用于其他n-1条轴的索引,不执行并集/交集运算
keys:与连接对象有关的值,用于形成连接轴向上的层次化索引。可以是任意值的列表或数组 levels 指定用作层次化索引各级别上的索引
names:用于创建分层级别的名称,如果设置了keys和levels
verify_integrity:检查结果对象新轴上的重复情况,如果发现则引发异常。默认False允许重复
ignore_index:不保留连接轴上的索引,产生一组新索引

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
python-pandas的一些小练习——东北大学大数据班数据挖掘实训Python基础二(2) 实训练习:练习使用pandas的dataframe和方法。 1将数据读取为dataframe类型,命名为df 2查看数据的形状[了解数据有多少行、多少列] 3查看数据的最开始的7条数据和尾部的3条数据 4查看数据的各字段的类型 5查看数据是否有缺失值 6如果有缺失值,进行补0操作 7从df按字段取出‘ date’’dist’和‘ flight’形成新的df1 8从df按位置选取行为3和4,列为0,1的数据形成新的df2 9在df添加一列‘ low_dest’,内容是‘ dest’这列的字符串的小写形式 10从df选取‘ dist’大于1000并且小于1200的数据作为一个新的df3 11从df选取‘ time’大于100的数据做为新的df4 12将df3和df4合并为一个dataframe,命名为df5 13取出df3的‘ time’,‘dist’ 这两列做为df6, 求出df6每列最大值与最小值的差值(运用lambda函数的方式进行求解 ) 14将df根据“ dest”分组,统计各目的地,都有多少条数据,命名为“ dest_count”,然后将“ dest”和“ dest_count”组成新的dataframe命名为df7 15根据dep_delay不为0,统计df有多少次航班起飞延误 16利用plane字段,统计df不同航班的飞行次数,以plane和plane_cout格式保存为df8 17利用carrier字段,计算dfcarrier字段不同属性数据的数据量的比值(如:XE的数据量与MQ的数据量的比值) 18分别将df7和 df8保存到本地文件,文件名分别为df7.csv和df8.csv

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

气泡柚子

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值