字典
大小可变的键值对集合,字典中的元素用 {} 括起来,用 : 分割键和值,不同的键值对之间用 , 分割。
创建字典的方法:
(1)dictionary={key1:value1, key2:value2, ... ...}
(2)dictionary=dict(key1=value1, key2=value2,......)
#用大括号{}创建字典
dc1={'刘亮亮':68, '王宏宇':85, '天思明':74, '徐丽':88, '丁涛':63}
dc1
{'刘亮亮': 68, '王宏宇': 85, '天思明': 74, '徐丽': 88, '丁涛': 63}
#用dict函数创建字典
dc2=dict(刘亮亮=68, 王宏宇=85, 天思明=74, 徐丽=88, 丁涛=63)
dc2
{'刘亮亮': 68, '王宏宇': 85, '天思明': 74, '徐丽': 88, '丁涛': 63}
#以列表形式返回字典中的键
dc1.keys()
dict_keys(['刘亮亮', '王宏宇', '天思明', '徐丽', '丁涛'])
#以列表形式返回字典中的值
dc1.values()
dict_values([68, 85, 74, 88, 63])
#以列表形式返回字典中的键值对
dc1.items()
dict_items([('刘亮亮', 68), ('王宏宇', 85), ('天思明', 74), ('徐丽', 88), ('丁涛', 63)])
#返回某个键上的值
dc1['徐丽']
88
#删除某个键值对
del dc1['徐丽']
dc1
{'刘亮亮': 68, '王宏宇': 85, '天思明': 74, '丁涛': 63}
DataFrame
DataFrame是pandas中的一个重要数据结构,类似于Excel中的sheet,是带标签的二维数组,一个DataFrame由行索引(index)、列索引(columns)和二维数据(values)组成。为了便于分析,一般要求一个DataFrame只存储一种类型的数据。可以利用字典变量定义DataFrame。
import pandas as pd
d = {"姓名":['刘亮亮', '王宏宇', '天思明', '徐丽', '丁涛'],
"统计学":[68, 85, 74, 88, 63],
"数学":[85, 91, 74, 100,82],
"经济学":[84, 43, 61, 49, 89]}
table1 = pd.DataFrame(d)
table1
这种方法比较麻烦,不建议使用。可以采用在Excel中输入数据,然后在Python中进行读取。DataFrame对象的方法如下表
方法 | 描述 | 示例 |
columns | 查看所有列名 | df.columns |
dtypes | 查看所有元素的类型 | df.types |
head | 查看前n行数据,默认前5行 | df.head(3) |
index | 查看所有行名 | df.index |
info | 查看数据结构 | df.info |
shape | 查看行数和列数 | df.shape |
T | 行列转置 | df.T |
tail | 查看后n行数据,默认后5行 | df.tail(3) |
values | 查看所有元素的值 | df.values |
df = pd.read_csv("data/table1_1.csv", encoding='gbk')
df
#选择指定的列
df[['数学','统计学']]
#选择指定的行(3和5行)
df.loc[[2, 4]]