【小白python数据入门5Pandas基础运用】

目录

1.课前准备:

2.Pandas库分为哪些?

3.Series and DataFrame:

3.1创建Series对象:

3.2创建values方法:

3.3创建index方法:

3.4数据类型转换:

3.5 Series索引:

3.6 字典创建Series数据 可以无序,可指定索引排序:

3.7创建DataFrame对象

3.7索引切片

4.运算 pandas 基于Numpy库的,所以Series 数据运算操作保留了Numpy运算操作(算术运算,逻辑运算)

4.1绝对值计算

5.统计

5.1 去重

5.2 统计次数

5.3 判断存在

6.DataFrame的索引,pandas.Date(data,[index],[columns]),index行,columns列

6.1.使用字典的数据创建DataFrame数据。

6.2 使用嵌套字典的数据创建DataFrame数据

6.3 使用二维数组生成DataFrame对象

6.4 使用Series组成的字典创建DataFrame对象

6.5 利用values值获取所有的元素

6.6 选取一行元素,选取一列元素

6.7  获取多行元素

6.8  获取多行元素.获取任意一个元素或一个范围内的元素

6.9   条件选取元素


1.课前准备:

(1)python可视化免费软件(官网:Project Jupyter | Home):

        Jupyter Notebook (anaconda)

(2)  会动的脑袋瓜子

(3)本篇阅读完有啥不理解的可以在评论区留言哈。

2.Pandas库分为哪些?

导入包句:

引入pandas包:
     import pandas as pd
引入Series和DataFrame:
      from pandas import Series, DataFrame   

3.Series and DataFrame:

Series为一维数组,它由一组有序的数据以及与之相关的索引标签组成。

创建Series的方式很灵活。可以直接通过一个数据列表来创建,此时默认索引为整数序列;也可以在创建时提供一个索引列表,这样每个数据点会与指定的索引关联起来;还可以通过字典来创建Series,此时字典的键会成为索引,值会成为数据点。

DataFrame是库中的二维数据结构,尺寸是可变的,这意味着可以动态地添加或删除行和列;可以包含不同类型的数据,例如数值、字符串或布尔值;列是有序的;拥有行索引和列索引;可以将DataFrame理解为一个存放Series对象的容器,每个Series对应DataFrame中的一列。

3.1创建Series对象:

创建一个Series对象,并将其赋值给变量obj。Series对象是一个一维数组,可以存储不同类型的数据。在这个例子中,Series对象包含了四个元素:1、-2、3和-4

from pandas import Series,DataFrame
obj = Series([1,-2,3,-4])
obj

3.2创建values方法:

values是一个用于获取对象中所有属性值的方法:

obj.values

3.3创建index方法:

index是一个用于获取对象中某个属性值的索引的方法:

obj.index

3.4数据类型转换:

  1. import numpy as np:导入numpy库并将其重命名为np,以便后续使用。
  2. arr1 = np.arange(3):使用numpy的arange函数创建一个包含从0到2的整数的数组,并将其赋值给变量arr1。
  3. s1 = arr1.astype(np.int64):将arr1的数据类型转换为int64(原为Int32),并将结果存储在变量s1中。
  4. print(s1):打印s1的值。
arr1 = np.arange(3)
s1 = arr1.astype(np.int64)
print(s1)
obj

3.5 Series索引:

  1. 创建一个名为obj2的Series对象。Series是pandas库中的一种数据结构,用于存储一维的数据序列。这里通过传递一个列表[1, 2, 3, -4]作为数据,以及一个索引列表['a', 'b', 'c', 'c']来指定每个数据对应的标签。

  2. 由于obj2是一个Series对象,所以它会以表格的形式显示数据和索引。

  3. obj2.values返回一个包含Series对象中所有数据的NumPy数组。

  4. obj2.index返回一个包含Series对象中所有索引的Index对象。

obj2=Series([1,2,3,-4],index=['a','b','c','c'])
print("1.\n",obj2)
print("2.",obj2.values)
print("3.",obj2.index)

3.6 字典创建Series数据 可以无序,可指定索引排序:

案例1:
  1. 这是一个字典(dictionary)类型的数据,其中键(key)表示姓名,值(value)表示对应的分数。

  2. 将字典data作为参数传递给Series()函数,创建了一个名为obj3的Series对象。Series是pandas库中的一种数据结构,用于存储一维的数据序列。

  3. 创建一个列表name,包含了四个人的姓名。

  4. 创建一个新的Series对象obj4,并将字典data作为数据源,同时指定了索引为name列表。这样,每个数据项都会根据name列表中的顺序进行排列。

data = {
    '张三':92,
    '李四':78,
    '王五': 68,
    '小米':82
}
obj3 = Series(data)

name = ['张三','李四','王五','小米']
obj4 = Series(data,index = name)
obj4

3.7创建DataFrame对象:

案例1:
  1. 创建一个为obj3的DataFrame对象
  2. 获取DataFrame的索引和值
  3. 创建一个新的obj4的DataFrame,
  4. 设置其名称和索引名称
  5. 打印输出
obj3 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})

index_obj3 = obj3.index
values_obj3 = obj3.values

obj4 = pd.DataFrame(values_obj3, columns=['A', 'B'], index=index_obj3)

obj4.name = 'students'
obj4.index.name = 'math'

print(obj4)
  • 23
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值