Leo的假期学习记录----python大数据入门篇(1)

2021-8-3
问题1:不知道什么时候用双[]
问题2:不清楚’’.’'的使用
日后多加练习寻找

import pandas as pd

data = {'ID': ['001', '002', '003', '004', '005', '006', '007'],
        'name': ['qqq', 'aaa', 'zzz', 'www', 'sss', 'xxx', 'eee'],
        'gender': [True, False, True, False, True, False, True],
        'age': [16, 20, 18, 18, 17, 18, 16],
        'height': [1.88, 1.78, 1.81, 1.86, 1.74, 1.75, 1.76]
        }
frame = pd.DataFrame(data)
'''#更改title:
   #     方法一:直接更改,永久更改
frame.columns = ['学号','姓名','性别','年龄','身高']
print(frame) 
        方法二:临时更改
print(frame.rename(columns={'ID' : '学号', 'name' : '姓名', 'gender' : '性别'}))
'''

#将表格转化为可视化网页界面
#print(frame.to_html())

#更改信息(行为1,列为name,进行更改)
'''frame.loc[1,'name'] = 'aaaa'
print(frame)'''

'''插入信息

       (在最前面添加一列 )

frame.insert(0,'class',['C1','C2','A1','B2','C1','C1','C2'])
       
        (在最下面添加一行),append 是添加的意思,ignore是忽略原序列号的意思
data1 = {
(要添加的东西}
frame1 = pd.DataFrame(data1)
frame = frame.append(frame1, ignore_index = Ture) 
print(frame)'''

'''删除信息  index代表索引号
frame = frame.drop(1)#删除索引号及所代表的
#或者,另一种方法:
frame = frame.drop('name' ,axis = 1)#axis 为1的时候删除列,0的时候删除行
#指定删除:删除性别为男的
frame = frame.drop(index=(frame.loc[(frame['gender'] ==True)].index))
#下面是删除一行一列,并不是定位
print(frame)
frame = frame.drop(index=1,columns='name')
print(frame)
'''

#以height为中心显示,以gender 和age一起分组,求height的平均数
#print(frame[['height']].groupby([frame['gender'], frame['age']]).mean())

#以ID为计量单位,按gender 和age 一起分组,计算数量,并以性别降序,年龄升序进行排序。
#print(frame[['ID']].groupby([frame['gender'],frame['age']]).count().sort_values(by=['gender','age'],ascending=[False,True]))

#计算名字的长度,并进行分组求和
#print(frame['name'].groupby(frame['name'].apply(len)).count())

#按照升高来进行排序,保留小数点后两位(args[1]),round-->四舍五入
#print(frame['name'].groupby(frame['height'].apply(round,args=[1])).count())

#应用函数判断男女身高差值
'''
        方法一:
def peak_to_peak(arr):
        return arr.max()-arr.min()
print(frame['height'].groupby(frame['gender']).apply(peak_to_peak))
        方法二:(比较强硬)
print(frame['height'].groupby(frame['gender']).apply(lambda arr: arr.max() - arr.min()))
'''
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值