Python实训Day04-初识Pandas以及与Numpy的关系

Pandas库的引用

Pandas:Python的第三方库,提供高性能易用数据类型和分析工具,有Series 、DataFrame 和Panel三种对象。
经常使用的包括Siries和DataFrame两种操作对象:

操作对象介绍
Siries索引+一维数据
DataFrame行列索引+二维数据

Siries是一维数据,其索引可以是用户自定义的字符或数字,也可以没有索引,默认使用从零开始的序号,这两套索引并存,但不能在依次调用中同时出现。
而DataFrame可以看成一个索引对应一个列表。

实例:引用Pandas库计算学生成绩

读取文件内容,即学生成绩信息,包括学号,姓名,平时成绩1、2、3,试题1~5的得分,求总成绩(=0.3平时总成绩+0.7试题总成绩).

import pandas as pd
import numpy as np
#读excel数据文件,得到的df为DataFrame格式
df = pd.read_excel(r"score.xlsx")
df

excel原始数据

xh = df['学号']
x  = list(xh)
xm = df['姓名']
m  = list(xm)
ps = df['平时成绩1']+df['平时成绩2']+df['平时成绩3']
p  = list(ps)
ks = df['试题1得分']+df['试题2得分']+df['试题3得分']+df['试题4得分']+df['试题5得分']
k  = list(ks)
zc = ps*0.3+ks*0.7
z  = list(zc)
d  = pd.DataFrame({'学号':x, '姓名':m,'平时成绩':p,'考试成绩':k,'总成绩':z})
d

学生总成绩

总结

如果想充分发挥Pandas的优势,就要把Series和DataFrame当成一个单一的变量看待,不能把他们想象得有多庞大,要充分利用第三方库提供的函数达到四两拨千斤的效果。

与Numpy的关系

Pandas是基于Numpy改进的,最主要的区别是在数据的应用当中,建立起了数据跟索引之间的关系,因此Pandas更加易用,性能更高。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

qq_43335313

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值