文章目录
前言
大家好,我是 👉【Python当打之年】
本期为大家带来Pandas常用操作命令介绍的第一篇,主要介绍在数据处理可视化过程中经常用到的一些指令,本系列在后期会不断进行补充更新,希望对你有所帮助。
1. 读取数据和保存数据
1.1 读取CSV文件数据
pd.read_csv(filename)
1.2 从限定分隔符的文本文件读取数据
pd.read_table(filename)
1.3 读取Excel表格数据
pd.read_excel(filename, sheet_name=' 表1')
1.4 读取SQL表/库数据
pd.read_sql(query, connection_object)
1.5 读取JSON格式的字符
pd.read_json(json_string)
1.6 解析URL地址中包含的数据
pd.read_html(url)
1.7 从粘贴板读取数据
pd.read_clipboard()
1.8 读取字典对象数据,其中key是数据框的表头,value是数据框的内容。
pd.DataFrame(dict)
2. 以csv文件为例:
2.1 从CSV文件读取数据,编码’gbk’
pd.read_csv(filename, encoding='gbk')
encoding需要根据实际情况调整。
2.2 读取前6行,当数据量比较大时,可以只读取前n行
pd.read_csv(filename, encoding='gbk', nrows = 6)
注意和df.head()的区别,一个是读取全部文件再取部分数据,一个是只读取部分数据。
2.3 第一列作为行索引,忽略列索引
pd.read_csv(filename, encoding='gbk', header=None, index_col=0)
header=None,忽略列索引,即把表头当成一行数据。
2.4 读取时忽略第1/3/5行和最后两行
pd.read_csv(filename, encoding='gbk', skiprows=[1,3,5], skipfooter=2, engine='python')
skiprows、skipfooter可以是单值或者列表。
2.5 从限定分隔符(’,’)的文件或文本读取数据
pd.read_table(filename, sep=',', encoding='gbk')
3. 保存数据
# 将数据数据导入csv格式的文件中
df.to_csv(filename)
# 将数据导入Excel格式的文件中
df.to_excel(filename, index=True)
# 将数据导入SQL数据表/数据库中
df.to_sql(table_name,connection_object)
# 将数据导入JSON格式的文件中
df.to_json(filename)
# HTML格式
df.to_html()
# 字符格式
df.to_string()
# 字典格式
df.to_dict('split')
# 保存至剪贴板
df.to_clipboard()
以上就是本期为大家整理的全部内容了,赶快练习起来吧,原创不易,喜欢的朋友可以点赞、收藏也可以分享让更多人知道。
文章首发微信公众号 “Python当打之年” ,每天都有python编程技巧推送,希望大家可以喜欢