一、内置数据类型
Text Type: str
Numeric Types: int
,float
,complex
Sequence Types: list
,tuple
,range
Mapping Type: dict
Set Types: set
,frozenset
Boolean Type: bool
Binary Types: bytes
,bytearray
,memoryview
From w3schools
二、数据分析需要用到的数据结构
1.1 列表 list ,一个标准可变多元素容器
列表是有序的,可变的,允许出现重复的值;列表是有索引的,第一个索引值为0
列表中的每一个数据的数据类型都可以是不同的。很强大,但有时候也可能导致低效。
1.2 元组 tuple , 一个固定长度,不可改变的Python序列对象
元组是有序的,不可变的,允许出现重复的值;元组是有索引的,第一个索引值为0
1.3 字典 dict , 一个键值对的大小可变集合, 键和值都是Python对象
字典是有序的(Python 3.7及以上),可变的,不允许出现重复的值;字典中的索引是键值对中的 Key
字典的值可以是任意Python对象, 而键通常是不可变的标量类型(整数、 浮点型、 字符串) 或元组(元组中的对象必须是不可变的)
1.4 集合 set ,可以把它当做无序,不可变的字典, 但是只有键没有值。
集合是无序的,不可变的,不允许出现重复的值
1.5 列表、集合、字典推导式!
列表推导式是Python最受喜爱的特性之一。 它允许用户方便的从一个集合过滤元素, 形成列表,
在传递参数的过程中还可以修改元素。 形式如下:expr for val in collection if condition
其等同于下面的for循环
result = [] for val in collection: if condition: result.append(expr)
字典的推导式如下所示:
dict_comp = {key-expr : value-expr for value in collection if condition}
集合的推导式与列表很像, 只不过用的是尖括号:
set_comp = {expr for value in collection if condition}
From 《利用Python进行数据分析》
2.1 NumPy数组 ndarray , 一个快速而灵活的同构数据多维容器
ndarray中的元素必须是相同类型的,每个数组都有一个shape(一个表示各维度大小的元组) 和一个dtype(一个用于说明数组数据类型的对象)。
2.2 Series,是一种类似于一维数组的对象
它由一组数据(各种NumPy数据类型,value) 以及一组相关的数据标签(即索引,index) 组成。可以将Series看成是一个定长的有序字典, 因为它是索引值到数据值的一个映射。Series最重要的一个功能是, 它会根据运算的索引标签自动对齐数据
2,3 DataFrame,一个表格型的数据结构
它含有一组有序的列, 每列可以是不同的值类型(数值、 字符串、 布尔值等)。 DataFrame既有行索引也有列索引, 它可以被看做由Series组成的字典(共用同一个索引)。 DataFrame中的数据是以一个或多个二维块存放的(而不是列表、 字典或别的一维数据结构)。
From 《利用Python进行数据分析》