“第二课堂”AI实践笔记二

Pandas入门

进入已创建环境中的jupyter notebook

首先载入数据

任务一:导入numpy和pandas7efe3962922e4c30bf39916fa2c7ed6d.png

 任务二:载入数据  (1)相对路径载入数据                                 (2)绝对路径载入数据16b35d7e367647a1b19114215e3cd436.png

87ec9df0704d453c8bc18f8847fafb6e.png 任务三:每1000行为一个数据模块,逐块读取6112c00bcba64e6ebe711ff0e13d24ab.png

任务四:将表头改为中文,索引改为乘客ID

8a1170c43550479db17e7deab6e44294.png

 df=pd.read_csv('train.csv',names=['乘客ID','是否幸存'……],index_col='乘客ID',header=0)

任务五:展示部分数据

前十行:df.head(10)

后15行:df.tail(15)

判断数据是否为空,为空返回true,其余地方返回false

df.isnull().head(5)

任务六:保存数据

将加载并做出改变的数据,在工作目录下保存一个新文件train_Chinese.csv

注意:不同的操作系统保存下来可能会有乱码,可以加入encording='GBK'或者'encording='utf-8''

df.to_csv('train_chinese.csv')

 

pandas基础

查看DateFrame数据的每列的名称:df.columns

查看“Cabin"这列的所有值:df['Name'].head(3)或df.Name.head(3)

删除多余列:del test1['a']

隐藏列元素:df.drop(['PassengerId','Name','Age','Ticket'],axis=1).head(3)

筛选年龄在10岁以下的:df[df['Age']<10]

将midage的数据中第100行的"Pclass"和"Sex"的数据显示出来:midage.loc[[100],['Pclass','Sex']](loc定位方式)(iloc索引方式)

根据c列升序排列:frame.sort_values(by='c',ascending=True)

行索引升序:frame.sort_index()

列索引升序:frame.sort_index(axis=1)

列索引降序:frame.sort_index(axis=1,ascending=False)

两列同时降序:frame.sort_values(by=['a','c'],ascending=False)

 

调用describe函数,观察frame2的数据基本信息:

frame2.describe()

"'count(样本数据大小),mean(样本数据的平均值),std(样本数据的标准差),min(样本数据的最小值),25%(样本数据25%时候的值),50%(样本数据50%时候的值),75%(样本数据75%时候的值),max(样本数据的最大值)"'

 

 

  • 5
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值