python数据预处理笔记

最新推荐文章于 2024-07-12 16:16:27 发布

StefenSalvatore

最新推荐文章于 2024-07-12 16:16:27 发布

阅读量372

点赞数

分类专栏： python 文章标签： python 数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/csdingpengjie/article/details/78913905

版权

python 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

python数据预处理笔记

numpy
pandas

numpy

–设计目的是处理大数据

arr1=np.array(data) //不用编写循环即可对数组内数据进行批量运算。
arr_slice=arr[5:8] //数组中序号5、6、7元素的切片
arr_slice[1]=123 //切片作为一个新的数组其中序号1元素被重新赋值

pandas

Series:
obj=Series([4,7,5,2],index=[‘d’,’a’,’b’,’c’]) //创建带索引的series对象。
与普通的numpy数组相比，可以通过索引的方式选取Series中的单个或一组值
可以将Series看成是一个定长的有序字典，如果数据被存放在一个python字典中，可以直接通过这个字典来创建Series

DataFrame
DataFrame是一个表格型的数据结构，每列可以是不同的值类型。

将数据文件读取为DataFrame对象的函数：
-pd.read_csv(‘filename.csv’)
-pd.read_table(‘filename’,sep=’,’) //sep后指定分隔符

写出：
-data.to_csv(‘filename’,sep=’ ‘,index=False,header=False,cols=[‘a’,’b’]) //分隔符自己定; 禁用行和列的标签；只输出a、b列；

数据文件读取前n行：
-pd.read_csv(‘fn.csv’,nrows=1000) //参数中直接可以实现

读取json格式文件：
-json.load( )

DataFrame创建：
-data1=pd.DataFrame(data,index=[0,1,2],columns=[‘one’,’two’,’three’])

取列索引：
-DataFrame[‘column’]

取行索引：
-DataFrame.ix[‘row’]

axis=0表述列
axis=1表述行

StefenSalvatore

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python数据预处理笔记

python数据预处理笔记numpypandasnumpy–设计目的是处理大数据arr1=np.array(data) //不用编写循环即可对数组内数据进行批量运算。 arr_slice=arr[5:8] //数组中序号5、6、7元素的切片 arr_slice[1]=123 //切片作为一个新的数组其中序号1元素被重新赋值panda
复制链接

扫一扫

专栏目录

StefenSalvatore CSDN认证博客专家 CSDN认证企业博客

码龄9年

3: 原创

89万+: 周排名

52万+: 总排名

1155: 访问

: 等级

43: 积分

0: 粉丝

0: 获赞

0: 评论

2: 收藏

私信

关注

热门文章

分类专栏

python 1篇
big-data 1篇

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。