Pandas、Numpy学习笔记(一)

这篇博客是小白的Pandas和Numpy学习笔记,介绍了Numpy的矩阵运算功能以及Pandas如何基于Numpy处理表格和混杂数据,特别强调了Pandas的Series和DataFrame结构在统计分析中的应用。
摘要由CSDN通过智能技术生成

"""小白自学笔记,参考价值有限,欢迎大神指正~~~~"""

numpy是以矩阵为基础的数学计算模块,提供高性能的矩阵运算,数组结构为ndarray

pandas是基于numpy数组构建的,但二者最大的不同是pandas是专门为处理表格和混杂数据设计的,比较契合统计分析中的表结构,而numpy更适合处理统一的数值数组数据。pandas数组结构有一维Series二维DataFrame

Series是一种类似于一维数组的对象,它由一组数据以及一组与之相关的数据标签(索引index)组成。

# 利用List构造Series,索引是数字
courses = ['语文', '数学', '英语', '计算机']
data1 = pd.Series(courses)
# Series的值向List转换
numbers = data.tolist()
# 利用Dict构造Series,索引是key
grades = {'语文': 98, '数学': 99, '英语': 97, '计算机': 100}
data = pd.Series(grades)
# Series向Dataframe转换
frame = pd.DataFrame(data, columns=['成绩'])
#借助Numpy创建Series
s = pd.Series(
    np.arange(10, 100, 10),
    index=np.arange(101, 110),
    dtype='float'
)
#转化Series的数据类型
s = s.astype(int)  #此处的int是类型
s = s.map(int)  #此处的int是函数
#Series添加元素,;类似于拼接
data = pd.Series({'语文': 98, '数学': 99, '英语': 97, '计算机': 100})
data = data.append(pd.Series({'物理': 88, '化学': 89}))
#用reset_index将Series转成df
df = data.reset_index()  #将原索引也设为Series的一列,前设新的一列0-n为索引
df.columns = ["course", "grade"]  #设置新的列名
#使用字典创建df
df = pd.DataFrame(
    {"姓名": ["小张", "小王", "小李"],
     "性别": ["男", "男", "女"],
     "年龄": [18, 19, 20]})
#给df设置索引列(第一列元素)
df.set_index("姓名", inplace=True)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值