pandas入门
pandas是专门用来处理复杂数据的python库,我们可以使用pandas来很方便的处理数据,这使我们的效率有很大的提升。
pandas导入
在使用pandas之前需要保证已经安装了pandas,可以在pandas官网上下载该库并安装。
安装完成后使用import来导入就可以使用了。打开csv文件
df = pandas.read_csv(filepath_or_buffer="D:\\NBA.csv", encoding="gbk")
filepath_or_buffer是指文件的路径,encoding是指文件的编码格式
- 读取头部
df.head()
type(df.head())
如果不指定读取的行数,一般默认读取前五行数据,使用type函数可以看到返回值的数据类型是数据框:class ‘pandas.core.frame.DataFrame’
- 读取文件的时候指定头部
在有些我们需要处理的文件中并不存在头部,这时我们需要去为其添加头部
df = pandas.read_csv(filepath_or_buffer="D:\\NBA.csv", encoding="gbk", header=None,
names=['1', '2', '3', '4', '5', '6', '7', '8'])