python数据分析基础-截取数据

linux+pycharm+anaconda

import pandas as pd
#拿出数据,某几行或某几列
data=pd.DataFrame([[20,99999,6],[30,999999,6],[20,999994],[27],[30,999999,6]])
data.columns=["年龄","收入","家属数"]
data.index=[i for i in range(5)]

#通过传去表头拿数据
data[["收入","年龄"]]


#通过传去具体位置拿数据(前行后是列)
data.iloc[:,[0,2]]#选择所有行中的第一和第三列

#切片方法获取数据
data.iloc[::2,::2]

#筛选符合条件的数据,bool索引筛选
condition=data["年龄"]>25
data[condition]

#loc[[行表头],[列表头]]和iloc[[行索引],[列索引]]

#bool值和列表头筛选,多条件双中括号
data[data["年龄"]>25][["收入","家属数"]]

#混合筛选,ix[行索引,[列表头]],弃用
data.ix[0:2,["年龄","收入"]]


#replace替换,得指定被替换的源数据
new_data=data['收入'].replace(99999,999998)


#替换nana值,相当于fillna(),np.NaN是python对缺失值的表示方式
new_data=data.replace(np.NaN,999955)


#多对对替换,data.replace({旧值:新值,旧值:新值})

#排序ascending,False降序,True升序
new_data=data.sort_values(by=["年龄"],ascending=False)


#通过na_position将确实值显示在最前面
new_data=data.sort_values(by=["收入"],na_position="first")
new_data
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值