pandas 中文打印无法对齐_数据分析——pandas文件读写和Series操作

pandas文件读写

Pandas是Python的第三方库,提供高性能易用的数据类型和分析工具

import pandas as pd

Pandas基于NumPy实现,常与NumPy和Matplotlib一同使用

1.1读取文本文件

使用read_table来读取文本文件

pandas.read_table(filepath_or_buffer, sep=’t’, header=’infer’, names=None,

index_col=None, dtype=None, engine=None, nrows=None)

使用read_csv函数来读取csv文件

pandas.read_csv(filepath_or_buffer, sep=’t’, header=’infer’, names=None,

index_col=None, dtype=None, engine=None, nrows=None)

参数如下:

55e9b71f5b2a1ae6eb917c2d03674fee.png

· read_table和read_csv函数中的sep参数是指定文本的分隔符的

o 如果分隔符指定错误,在读取数据的时候,每一行数据将连成一片

· header参数是用来指定列名的,如果是None则会添加一个默认的列名

· encoding代表文件的编码格式

o 常用的编码有utf-8、utf-16、gbk、gb2312、gb18030等

o 如果编码指定错误数据将无法读取,IPython解释器会报解析错误

1.2 文本文件存储

使用to_csv函数实现以csv格式存储

DataFrame.to_csv(path_or_buf=None, sep=’,’, na_rep=”, columns=None,

header=True,

index=True,index_label=None,mode=’w’,encoding=None)

参数如下:

ee658b64304d0bb3072092797ef5836c.png

1.3 读取Excel文件

read_excel函数:读取“xls”“xlsx”两种Excel文件

pandas.read_excel(io, sheetname=0, header=0, index_col=None, names=None,

dtype=None)

参数如下:

58f6b697307128f5047660fb02097b46.png

1.4 Excel文件存储

to_excel方法,其语法格式如下。

DataFrame.to_excel(excel_writer=None, sheetname=None’, na_rep=”,

header=True,

index=True, index_label=None, mode=’w’, encoding=None)

· 与to_csv方法的常用参数基本一致

o 区别之处在于指定存储文件的文件路径参数名称为excel_writer

o 增加sheetnames参数以指定存储的Excel sheet名,默认为sheet1

o 没有sep参数

Series

2.1 创建Series对象

类似字典key-value,在series中则为index的纵轴标度与对应的values

7abe1a1a540ed8ed65693002483f3668.png

2c66f6914d3e3e1046d3621bcb5b02c9.png

可以由如下类型创建:

· Python列表:index与列表元素个数一致

· 标量值:index表达Series类型的尺寸

· Python字典:键值对中的键是索引index从字典中进行选择操作

· ndarray:索引和数据都可用ndarray创建

· 其他函数:range等

2.2 Series基本操作

· Series类型包括index和values两部分

.index属性获得纵轴索引,.values获得数据值

· Series类型的操作类似ndarray类型

· Series类型的操作类似Python字典类型

index和value如下操作:

c9180536a8e2d744bb49003882c56948.png

62207a966b25754814c51cea953c7b72.png

类似ndarray类型

索引方法相同,采用 [ ]

numpy中运算和操作可用于Series类型

可以通过自定义索引的列表进行切片

可以通过自动索引进行切片,如果存在自定义索引,则一同被切片

类似Python字典类型

f8bba905173a9502c8cc7e0a1d61c2ed.png

Series类型的对齐操作

777668766cd07c75df16368e8df6c721.png

2.3 Series小结

b7b874b11ddd94f853a9f2dd84c2b794.png

欢迎大家加入人工智能圈参与交流

人工智能学习圈 - 知乎​www.zhihu.com
e731e72ddc7c568301034529b15245c1.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值