摘要:Python是开源的,所以有很多开源固有的问题。如果你是Python新手,很难知道针对特定任务的包哪个是最好的。你需要有经验的人来告诉你。今天我要告诉你们的是:在数据科学中,有一个软件包是你们绝对需要学习的,那就是pandas。
![c1719481893c1dd1b984ecda6c05288a.png](https://img-blog.csdnimg.cn/img_convert/c1719481893c1dd1b984ecda6c05288a.png)
而pandas真正有趣的地方是,很多其他的包也在里面。pandas是一个核心包,因此它具有来自其他各种包的特性。
pandas类似于Python中的Excel:它使用表(即DataFrame)并对数据进行转换,但它还能做更多。
如果你已经熟悉Python,可以直接进入第三部分
现在让我们开始:
import pandas as pd
pandas包最基本的功能
1、读取数据:
data = pd.read_csv('my_file.csv')data=pd.read_csv('my_file.csv',sep=';',encoding='latin-1',nrows=1000, kiprows=[2,5])
sep变量代表分隔符。因为Excel中的csv分隔符是“;”,因此需要显示它。编码设置为“latin-1”以读取法语字符。nrows=1000表示读取前1000行。skiprows=[2,5]表示在读取文件时将删除第2行和第5行
最常用的函数:read_csv, read_excel
还有一些很不错的函数:read_clipboard、read_sql
2、写入数据
data.to_csv('my_new_file.csv', index=None)
index=None将简单地按原样写入数据。如果你不写index=None,会得到额外的行。
我通常不使用其他函数,比如to_excel,to_json,to_pickle&#x