pandas作图基础学习笔记(适合pandas入门)

#pandas中的Series创建
#导入pandas
import pandas as pd
s=pd.Series(['smart',18],index=['name','age'])
s.shape#查看形状
s.size#查看个数
s.index#查看行标签
s.values#查看数据
s.keys()#查看行标签
#s.loc[]#根据行列标签获得数据
#s.iloc[]#根据行列位置获得数据
s.dtypes#获得元素类型
t=pd.Series([1.0,2.5,3.4,2.6])
t.mean()#查看平均值,但是不支持int类型
t.max()#查看最大值
t.min()#查看最小值
t.std#查看标准差
s.value_counts()#查看不同元素个数
s.count()#查看非空元素个数
s.describe()# 查看各种统计值
t.sort_values()#排序
#pandas中的dataframe的创建
#导入pandas
import pandas as pd
import numpy as np
# 创建一个字典,其中键是列名,值是数据(通常是列表)
data = {
    'Name': ['Tom', 'Jerry', 'Mickey', 'Donald'],
    'Age': [5, 7, 8, 9],
    'City': ['New York', 'Los Angeles', 'Chicago', 'Orlando']
}

# 使用字典创建DataFrame
df = pd.DataFrame(data)
df.shape#查看形状
df.size#查看个数
df.ndim#查看维度
df.index#查看行标签
df.columns#查看列标签
df.dtypes#查看列数据类型
df.info#查看每列结构
df.head(2)#查看前几行数据这个是2
df.tail(2)#查看后几行数据这个是2
df.max()#列最大值
df.min()#列最小值
df.count()#每列非空值数据
df.describe()#查看每列元素各种统计值
df.describe(include=[np.object_])#显示非数值型列的统计数值
#df.set_index('')#设置行标签
#df.reset_index()#重置行标签
pd.read_csv('路径',index_col='行标签'或index_col=编号)#加载数据时,指定行标签
#改行标签与列标签
pd.rename(index={原:新},columns={原:新})
#直接修改
pd.index=[新]
pd.columns=[新]
pd.append(other)#末尾添加新行
pd.loc[行标签][列标签]=#修改数据
pd.iloc[行位置][列位置]=#修改数据
pd.drop([行标签])#删除行
#添加新列
df['列标签']=新列
df.loc[:,列标签]=新列
#删除列
pd.drop([列标签],axis=1)#axis=1代表指向所有行

部分导入和导出文件

#导入和导出文件
#导出到Pickle文件
#调用to_Pickle方法将以二进制保存数据
#如果保存成Pickle文件,只能在python使用
#文件扩展名可以是.p,.pkl,.pickle
d=pd.read_csv('路径')
d.to_pickle('新文件名.pickle')#将csv文件导出为pickle
pd.read_pickle('')#导入pickle文件
#将tsv文件导出为csv文件,tsv文件要设置分隔符必为'\t'
d.to_csv('文件.tsv',sep='\t')
d.to_csv('新文件名',index=False)#index=False为了不在csv存入行标签,避免重复
#导入csv
d.to_csv('')

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值