“第二课堂”AI实践笔记二

Silver---

于 2024-07-22 16:26:52 发布

阅读量325

点赞数 5

文章标签：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_85193295/article/details/140592897

版权

Pandas入门

进入已创建环境中的jupyter notebook

首先载入数据

任务一：导入numpy和pandas

任务二：载入数据（1）相对路径载入数据（2）绝对路径载入数据

任务三：每1000行为一个数据模块，逐块读取

任务四：将表头改为中文，索引改为乘客ID

df＝pd.read_csv('train.csv'，names＝['乘客ID'，'是否幸存'……]，index_col＝'乘客ID'，header＝0)

任务五：展示部分数据

前十行：df.head(10)

后15行：df.tail(15)

判断数据是否为空，为空返回true，其余地方返回false

df.isnull().head(5)

任务六：保存数据

将加载并做出改变的数据，在工作目录下保存一个新文件train_Chinese.csv

注意：不同的操作系统保存下来可能会有乱码，可以加入encording＝'GBK'或者'encording＝'utf-8''

df.to_csv('train_chinese.csv')

pandas基础

查看DateFrame数据的每列的名称：df.columns

查看“Cabin"这列的所有值：df['Name'].head(3)或df.Name.head(3)

删除多余列：del test1['a']

隐藏列元素：df.drop(['PassengerId','Name','Age','Ticket'],axis＝1).head(3)

筛选年龄在10岁以下的：df[df['Age']＜10]

将midage的数据中第100行的"Pclass"和"Sex"的数据显示出来:midage.loc[[100],['Pclass','Sex']](loc定位方式）（iloc索引方式）

根据c列升序排列：frame.sort_values(by＝'c',ascending＝True)

行索引升序：frame.sort_index()

列索引升序:frame.sort_index(axis＝1)

列索引降序：frame.sort_index(axis＝1,ascending＝False)

两列同时降序：frame.sort_values(by＝['a','c'],ascending＝False)

调用describe函数，观察frame2的数据基本信息：

frame2.describe()

"'count(样本数据大小），mean(样本数据的平均值），std(样本数据的标准差），min(样本数据的最小值），25％（样本数据25％时候的值），50％(样本数据50％时候的值),75％(样本数据75％时候的值),max（样本数据的最大值）"'

关注

5
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
“第二课堂”AI实践笔记二

"'count(样本数据大小），mean(样本数据的平均值），std(样本数据的标准差），min(样本数据的最小值），25％（样本数据25％时候的值），50％(样本数据50％时候的值),75％(样本数据75％时候的值),max（样本数据的最大值）"'df＝pd.read_csv('train.csv'，names＝['乘客ID'，'是否幸存'……隐藏列元素：df.drop(['PassengerId','Name','Age','Ticket'],axis＝1).head(3)
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。