Python - 了解Pandas及其数据类型

本文摘要:

Pandas数据读取、Pandas数据类型与转换

读取文件类型

在这里插入图片描述

查看数据属性

# 查看数据形状,返回(行数,列数)
dataframe.shape

# 查看列名,返回Index(['id', 'name', 'grade'], dtype='object')
dataframe.columns

# 查看索引,返回RangeIndex(start=0, stop=100, step=1)
dataframe.index

# 查看每列的数据类型
dataframe.dtypes

# 查看前几行数据
dataframe.head()

read_csv相关参数

import pandas as pd

# 读取纯文本文件,txt/csv
dataframe = pd.read_csv(
	file_path,
	sep = '\t',                 # 指定分隔符
	header = None,				# 是否有标题行
	names = ['xx', 'ss', 'oo']  # 自定义列名
)

# 读取excel文件
dataframe = pd.read_excel(excel_path)

# 读取mysql数据
import pymysql
conn = pymysql.connect(
	host = '127.0.0.1', 
	user = 'root',
	password = '123456',
	database = 'db',
	charset = 'utf8'
)

dataframe = pd.read_sql('select * from 表名', con=conn)

Pandas数据结构(DataFrame Series)

在这里插入图片描述

Series,类似一维数组

s1 = pd.Series([1, 's', 2.1])  # 输出时 左侧为索引,右侧为数据

s1.index  # 获取索引,返回RangeIndex
s1.values # 获取数据,返回array

s2 = pd.Series([1, 's', 2.1], index=['a', 'b', 'x']) # 自定义指定索引

# 也可以用字典创建Series
data = {'id': 1, 'name': 'Bob', 'age': 18} # 键即索引,值即数据
s3 = pd.Series(data)

# 访问数据,类似字典
s3['id']   # 返回1,int类型
s3['name'] # 返回Bob,字符串类型

# 查询多值
s3[['name', 'age']]  # 返回仍是Series类型

DataFrame

只查询一行/一列,返回Series对象
查询多行/多列,返回DataFrame对象

# 查询一列,返回Series对象
dataframe['name']

# 查询多列,返回DataFrame对象
dataframe[['id', 'name']]

# 查询一行,返回Series对象
dataframe.loc[1]

# 查询多行,返回DataFrame对象
dataframe.loc[1:3]   # 类似切片,但注意:此方法包含 3

*此文仅为个人笔记

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值