最全大数据Python基础之DataFrame数据结构学习_dd = pd(4),2024大数据开发面试心得

img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化资料的朋友,可以戳这里获取

d = {'name': {1: 'wang', 2: 'li', 3: 'zhang'}, 'gender': {1: 'M', 2: 'F'}, 'age':{1: 12, 2: 13, 3: 14 }}
dd = pd.DataFrame(d)
print dd

输出:
age gender name
1 12 M wang
2 13 F li
3 14 NaN zhang
3.检索DataFrame
若DataFrame数据量太大,可以用df.head()筛选出最前面的五行。选择一列:类似字典的标记,如df’name’,列名为属性,如df.name(列名是有效的Python变量名)。选择一行:可以使用属性loc返回一个Series对象。如df.loc[1],其索引的名字即为当前行的列索引“1”,索引名为各列的名字。
4.通过列修改数据

d = {'name': {1: 'wang', 2: 'li', 3: 'zhang'}, 'gender': {1: 'M', 2: 'F'}, 'age':{1: 12, 2: 13, 3: 14 }}
dd = pd.DataFrame(d)
# 标量值
dd.age = 16
# 值数组(长度必须匹配)
dd.age = [60, 61, 30]
# Series对象
dd.age = pd.Series([32, 31, 30], index=[3, 2, 1])
print dd

输出:
age gender name
1 30 M wang
2 31 F li
3 32 NaN zhang

5.重新索引reindex()

df4 = pd.DataFrame(np.arange(9).reshape(3,3), index= ['a', 'b', 'c'], columns=['one', 'two', 'three'])
# 默认对行进行重新索引
df4 = df4.reindex(['a', 'c', 'b'])
# 可以同时对列和行进行索引,缺失值自动用NaN填充,如果不想用NaN,可以在reindex()参数里加入fill_value=n,用n代替缺失值
df4 = df4.reindex(index= ['a', 'c', 'b'], columns=['one', 'three', 'four'])
print df4

输出:

img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化资料的朋友,可以戳这里获取

友,可以戳这里获取](https://bbs.csdn.net/forums/4f45ff00ff254613a03fab5e56a57acb)**

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值