Python Pandas操作Excel 01

1.1 Pandas操作Excel 01


1.1.1 数据类型和新建文件

我们用pandas,操作的常见数据类型有:csv txt excel sql

数据.to_csv() 可以新建一个 csv 文件
数据.to_excel() 可以新建一个 excel 文件
数据.to_sql() 可以新建一个 sql 文件

在我们 新建文件之前,肯定要学习 如何封装相应的数据。

pd.DataFrame() 封装成一个二维数据表

import pandas as pd

二维数据表 = pd.DataFrame({'序号':[1,2,3],'姓名':['a','b','c']})
二维数据表 = 二维数据表.set_index('序号')
二维数据表.to_excel('1.xlsx',)
print('新建 1.xlsx 成功')

二维数据表 = 二维数据表.set_index('序号') 我们把索引列 设置为 我们提供的一列 Key,这样就不会 出现 默认索引列了。
在这里插入图片描述

pd.Series() 封装一个一维数据表


1.2.1 读取 txt 和 csv 文件

read_csv() 默认以 文本内容的逗号为分隔符
在这里插入图片描述

import pandas as pd

读取数据 = pd.read_csv('1.csv')

print(读取数据)

在这里插入图片描述

read_table() 默认以 文本内容的 \t 制表符为 分隔符

import pandas as pd

# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',')
print(读取数据)
print(读取数据2)

在这里插入图片描述
如果文本内容 的分隔符 跟我们 用的这两个方法没有一个是对应的,就需要 告诉方法 我们的 分隔符是什么。


1.2.2 认识 read_csv() 的参数

参数描述
sep分隔符,字符串或正则表达式 都支持
header表头的行号设置为什么,以哪个行号为表头。如果没有表头应该写 None
names配合 header=None 使用,创建一行 新的表头
index_col设置索引为哪一列,可以是 表头名,或 列号
skiprows从文件开始处,需要跳过的行数或行号列表。[2,3] 跳过 2 号行和3号行,如果直接提供一个数字,那么就是从读取处开始 跳过多少行数据。
encoding编码,例如 utf-8
nrows从文件开头处 读入的行数,限制我们 读几行。

① 比如我们把 1 号行,设置为 表头

import pandas as pd

# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=1)
print(读取数据)
print(读取数据2)

在这里插入图片描述
② 创建一个新表头

import pandas as pd

# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'])
print(读取数据)
print(读取数据2)

在这里插入图片描述

③ 过滤掉 前 1行

import pandas as pd

# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'])
print(读取数据)
print(读取数据2)

在这里插入图片描述
④ 过滤掉 1 号 行

import pandas as pd

# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'],skiprows=[1])
print(读取数据)
print(读取数据2)

在这里插入图片描述

⑤ 把 字段1 当为索引列

import pandas as pd

# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'],index_col='字段1',skiprows=1)
print(读取数据)
print(读取数据2)

在这里插入图片描述

⑥ 读取前 两行

import pandas as pd

# 读取数据 = pd.read_csv('1.csv')
读取数据 = pd.read_table('1.csv')
读取数据2 = pd.read_table('1.csv',sep=',',header=None,names=['字段1','字段2'],index_col='字段1',skiprows=1,nrows=2)
print(读取数据)
print(读取数据2)

在这里插入图片描述


1.2.3 数据对象的一些方法

数据obj.head(读取的行数) 读取前几行数据
在这里插入图片描述

数据obj.shape 返回 数据表的 行数和列数
在这里插入图片描述

数据obj.columns 返回 数据表的 表头 ,装在一个列表里
在这里插入图片描述

数据obj.index 返回索引数据,比如从哪里开始,到哪里结束,步长是多少。
在这里插入图片描述

数据obj.dtypes 返回 每一列or每一个字段的数据类型。即各个表头名 里面 存储的数据 大致是什么类型的。
在这里插入图片描述


1.3.1 .txt 文件 .csv 文件

import pandas as pd

txt数据 = pd.read_csv(txt文件路径)
txt数据.to_csv(csv文件的存储路径)

就很简单,这样直接 进行 转换就行。


1.4.1 读取 mysql 文件

import pymysql
import pandas as pd

连接对象 = pymysql.connect(host='localhost',user='root',password='123123',database='tempdata')

# 创建一个 模拟 sql 语句操作者 的对象(游标对象)
游标对象 = 连接对象.cursor()

数据表  = pd.read_sql('select * from `基本信息表`',con=连接对象)

print(数据表)

在这里插入图片描述
在这里插入图片描述


1.5.1 读取 Excel 文件

import pandas as pd

数据表 = pd.read_excel('1.xlsx')
print(数据表)

在这里插入图片描述

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值