目录
3.6 字典创建Series数据 可以无序,可指定索引排序:
4.运算 pandas 基于Numpy库的,所以Series 数据运算操作保留了Numpy运算操作(算术运算,逻辑运算)
6.DataFrame的索引,pandas.Date(data,[index],[columns]),index行,columns列
6.4 使用Series组成的字典创建DataFrame对象
1.课前准备:
(1)python可视化免费软件(官网:Project Jupyter | Home):
Jupyter Notebook (anaconda)
(2) 会动的脑袋瓜子
(3)本篇阅读完有啥不理解的可以在评论区留言哈。
2.Pandas库分为哪些?
导入包句:
引入pandas包:
import pandas as pd
引入Series和DataFrame:
from pandas import Series, DataFrame
3.Series and DataFrame:
Series为一维数组,它由一组有序的数据以及与之相关的索引标签组成。
创建Series的方式很灵活。可以直接通过一个数据列表来创建,此时默认索引为整数序列;也可以在创建时提供一个索引列表,这样每个数据点会与指定的索引关联起来;还可以通过字典来创建Series,此时字典的键会成为索引,值会成为数据点。
DataFrame是库中的二维数据结构,尺寸是可变的,这意味着可以动态地添加或删除行和列;可以包含不同类型的数据,例如数值、字符串或布尔值;列是有序的;拥有行索引和列索引;可以将DataFrame理解为一个存放Series对象的容器,每个Series对应DataFrame中的一列。
3.1创建Series对象:
创建一个Series对象,并将其赋值给变量obj
。Series对象是一个一维数组,可以存储不同类型的数据。在这个例子中,Series对象包含了四个元素:1、-2、3和-4
from pandas import Series,DataFrame
obj = Series([1,-2,3,-4])
obj
3.2创建values方法:
values是一个用于获取对象中所有属性值的方法:
obj.values
3.3创建index方法:
index是一个用于获取对象中某个属性值的索引的方法:
obj.index
3.4数据类型转换:
import numpy as np
:导入numpy库并将其重命名为np,以便后续使用。arr1 = np.arange(3)
:使用numpy的arange函数创建一个包含从0到2的整数的数组,并将其赋值给变量arr1。s1 = arr1.astype(np.int64)
:将arr1的数据类型转换为int64(原为Int32),并将结果存储在变量s1中。print(s1)
:打印s1的值。
arr1 = np.arange(3)
s1 = arr1.astype(np.int64)
print(s1)
obj
3.5 Series索引:
-
创建一个名为
obj2
的Series对象。Series是pandas库中的一种数据结构,用于存储一维的数据序列。这里通过传递一个列表[1, 2, 3, -4]
作为数据,以及一个索引列表['a', 'b', 'c', 'c']
来指定每个数据对应的标签。 -
由于
obj2
是一个Series对象,所以它会以表格的形式显示数据和索引。 -
obj2.values
返回一个包含Series对象中所有数据的NumPy数组。 -
obj2.index
返回一个包含Series对象中所有索引的Index对象。
obj2=Series([1,2,3,-4],index=['a','b','c','c'])
print("1.\n",obj2)
print("2.",obj2.values)
print("3.",obj2.index)
3.6 字典创建Series数据 可以无序,可指定索引排序:
案例1:
-
这是一个字典(dictionary)类型的数据,其中键(key)表示姓名,值(value)表示对应的分数。
-
将字典
data
作为参数传递给Series()
函数,创建了一个名为obj3
的Series对象。Series是pandas库中的一种数据结构,用于存储一维的数据序列。 -
创建一个列表
name
,包含了四个人的姓名。 -
创建一个新的Series对象
obj4
,并将字典data
作为数据源,同时指定了索引为name
列表。这样,每个数据项都会根据name
列表中的顺序进行排列。
data = {
'张三':92,
'李四':78,
'王五': 68,
'小米':82
}
obj3 = Series(data)
name = ['张三','李四','王五','小米']
obj4 = Series(data,index = name)
obj4
3.7创建DataFrame对象:
案例1:
- 创建一个为obj3的DataFrame对象
- 获取DataFrame的索引和值
- 创建一个新的obj4的DataFrame,
- 设置其名称和索引名称
- 打印输出
obj3 = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
index_obj3 = obj3.index
values_obj3 = obj3.values
obj4 = pd.DataFrame(values_obj3, columns=['A', 'B'], index=index_obj3)
obj4.name = 'students'
obj4.index.name = 'math'
print(obj4)