pandas使用

数据来源关注公众号FF工作室,后台回复pandas读取文件
FF工作室

Series是一个类似一维数组的对象,主要由一组数据和与之相关的索引两部分构成,如果创建时没有指定索引参数,则默认会创建一个从0-N的整数索引。

import pandas as pd

# 创建Series三种方法如下,索引为默认从0开始,输出类似于列表输出 对象名[索引即可]或者对象名[下标0 1......],
# 但是当索引是字符串与数字时,输出只能使用 对象[具体索引],但是当为字符串或者数字一种时两种输出都可以
# 索引以及向量的内容可以使数值也可以是是字符串
ser_ob = pd.Series([1,2,3])
print("ser_ob[0]为 %s"%(ser_ob[0]))
print(ser_ob)
#创建列的向量,索引指定为index内的列表
ser_ob1 = pd.Series([1,2,"v"],index=["a",1,"c"])
print("ser_ob1[""a""] %s" %(ser_ob1["a"]))

ser_obj2=pd.Series({"a":1,"b":2,"c":3})
print(ser_obj2)
#获取索引
print(ser_obj2.index)
#获取内容
print(ser_obj2.values)
print(ser_obj2[2])

DataFrame是一个类似二维数组或表格的对象,由索引和数据组成,索引又分为行索引和列索引。

df_obj=pd.DataFrame([[1,2,3],[4,5,6]],columns=["a","b","c"])
print(df_obj)
# 获取一列数据:采用列索引的方式获取
print(df_obj["a"])
# 增加一列数据
df_obj["d"]=[7,8]
# 删除有一列数据
del(df_obj["d"])

pandas读取excel文件并操作(读取,分组,排序)

data = pd.read_excel(r'D:\数学建模\data\Trade.xlsx')
#set_index排序指定列按照列排序,可以指定多列要按照列表写法
data = data.sort_values(by='Date').set_index('Date')
#取出2012年数据
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
#coding:utf-8
plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus']=False #用来正常显示负号
data_2012 = data["2012"]
plt.hist(data_2012["Sales"],bins=40,density=True)
plt.xlabel("销售额")
plt.title("2012年销售额分布图")
plt.show()

#groupby分组操作最终返回类型为字典
data_2012_Cost = data_2012["Trans_Cost"].groupby(data_2012["Transport"])
x = np.array([data_2012_Cost.get_group(_) for _ in ["大卡","火车","空运"]])
plt.boxplot(x)
plt.show()
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值