pandas使用_pandas font()-CSDN博客

本文链接：https://blog.csdn.net/stusss/article/details/108661319

数据来源关注公众号FF工作室，后台回复pandas读取文件

Series是一个类似一维数组的对象，主要由一组数据和与之相关的索引两部分构成，如果创建时没有指定索引参数，则默认会创建一个从0-N的整数索引。

import pandas as pd

# 创建Series三种方法如下，索引为默认从0开始,输出类似于列表输出 对象名[索引即可]或者对象名[下标0 1......]，
# 但是当索引是字符串与数字时，输出只能使用 对象[具体索引]，但是当为字符串或者数字一种时两种输出都可以
# 索引以及向量的内容可以使数值也可以是是字符串
ser_ob = pd.Series([1,2,3])
print("ser_ob[0]为 %s"%(ser_ob[0]))
print(ser_ob)
#创建列的向量，索引指定为index内的列表
ser_ob1 = pd.Series([1,2,"v"],index=["a",1,"c"])
print("ser_ob1[""a""] %s" %(ser_ob1["a"]))

ser_obj2=pd.Series({"a":1,"b":2,"c":3})
print(ser_obj2)
#获取索引
print(ser_obj2.index)
#获取内容
print(ser_obj2.values)
print(ser_obj2[2])

DataFrame是一个类似二维数组或表格的对象，由索引和数据组成，索引又分为行索引和列索引。

df_obj=pd.DataFrame([[1,2,3],[4,5,6]],columns=["a","b","c"])
print(df_obj)
# 获取一列数据：采用列索引的方式获取
print(df_obj["a"])
# 增加一列数据
df_obj["d"]=[7,8]
# 删除有一列数据
del(df_obj["d"])

pandas读取excel文件并操作（读取，分组，排序）

data = pd.read_excel(r'D:\数学建模\data\Trade.xlsx')
#set_index排序指定列按照列排序，可以指定多列要按照列表写法
data = data.sort_values(by='Date').set_index('Date')
#取出2012年数据
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
#coding:utf-8
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
data_2012 = data["2012"]
plt.hist(data_2012["Sales"],bins=40,density=True)
plt.xlabel("销售额")
plt.title("2012年销售额分布图")
plt.show()

#groupby分组操作最终返回类型为字典
data_2012_Cost = data_2012["Trans_Cost"].groupby(data_2012["Transport"])
x = np.array([data_2012_Cost.get_group(_) for _ in ["大卡","火车","空运"]])
plt.boxplot(x)
plt.show()