pandas作图基础学习笔记(适合pandas入门)

ℒℴѵℯ心·动ꦿ໊ོ꫞

于 2024-08-26 22:02:31 发布

阅读量137

点赞数 1

文章标签： pandas 学习笔记

本文链接：https://blog.csdn.net/2302_79896301/article/details/141574598

版权

#pandas中的Series创建
#导入pandas
import pandas as pd
s=pd.Series(['smart',18],index=['name','age'])
s.shape#查看形状
s.size#查看个数
s.index#查看行标签
s.values#查看数据
s.keys()#查看行标签
#s.loc[]#根据行列标签获得数据
#s.iloc[]#根据行列位置获得数据
s.dtypes#获得元素类型
t=pd.Series([1.0,2.5,3.4,2.6])
t.mean()#查看平均值，但是不支持int类型
t.max()#查看最大值
t.min()#查看最小值
t.std#查看标准差
s.value_counts()#查看不同元素个数
s.count()#查看非空元素个数
s.describe()# 查看各种统计值
t.sort_values()#排序

#pandas中的dataframe的创建
#导入pandas
import pandas as pd
import numpy as np
# 创建一个字典，其中键是列名，值是数据（通常是列表）
data = {
    'Name': ['Tom', 'Jerry', 'Mickey', 'Donald'],
    'Age': [5, 7, 8, 9],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Orlando']
}

# 使用字典创建DataFrame
df = pd.DataFrame(data)
df.shape#查看形状
df.size#查看个数
df.ndim#查看维度
df.index#查看行标签
df.columns#查看列标签
df.dtypes#查看列数据类型
df.info#查看每列结构
df.head(2)#查看前几行数据这个是2
df.tail(2)#查看后几行数据这个是2
df.max()#列最大值
df.min()#列最小值
df.count()#每列非空值数据
df.describe()#查看每列元素各种统计值
df.describe(include=[np.object_])#显示非数值型列的统计数值

#df.set_index('')#设置行标签
#df.reset_index()#重置行标签
pd.read_csv('路径',index_col='行标签'或index_col=编号)#加载数据时，指定行标签
#改行标签与列标签
pd.rename(index={原:新}，columns={原:新})
#直接修改
pd.index=[新]
pd.columns=[新]
pd.append(other)#末尾添加新行
pd.loc[行标签][列标签]=#修改数据
pd.iloc[行位置][列位置]=#修改数据
pd.drop([行标签])#删除行
#添加新列
df['列标签']=新列
df.loc[:,列标签]=新列
#删除列
pd.drop([列标签],axis=1)#axis=1代表指向所有行

部分导入和导出文件

#导入和导出文件
#导出到Pickle文件
#调用to_Pickle方法将以二进制保存数据
#如果保存成Pickle文件，只能在python使用
#文件扩展名可以是.p,.pkl,.pickle
d=pd.read_csv('路径')
d.to_pickle('新文件名.pickle')#将csv文件导出为pickle
pd.read_pickle('')#导入pickle文件
#将tsv文件导出为csv文件，tsv文件要设置分隔符必为'\t'
d.to_csv('文件.tsv',sep='\t')
d.to_csv('新文件名',index=False)#index=False为了不在csv存入行标签，避免重复
#导入csv
d.to_csv('')