1.3 Python的数据处理

刀源

已于 2023-05-21 22:11:23 修改

阅读量29

点赞数

分类专栏：统计学_学习笔记文章标签：数据挖掘大数据数据分析

于 2023-05-20 22:42:07 首次发布

本文链接：https://blog.csdn.net/u013449168/article/details/130786751

版权

统计学_学习笔记专栏收录该内容

2 篇文章 0 订阅

订阅专栏

字典

大小可变的键值对集合，字典中的元素用 {} 括起来，用 : 分割键和值，不同的键值对之间用 , 分割。

创建字典的方法：

（1）dictionary={key1:value1, key2:value2, ... ...}

（2）dictionary=dict(key1=value1, key2=value2,......)

#用大括号{}创建字典
dc1={'刘亮亮':68, '王宏宇':85, '天思明':74, '徐丽':88, '丁涛':63}
dc1

{'刘亮亮': 68, '王宏宇': 85, '天思明': 74, '徐丽': 88, '丁涛': 63}

#用dict函数创建字典
dc2=dict(刘亮亮=68, 王宏宇=85, 天思明=74, 徐丽=88, 丁涛=63)
dc2

{'刘亮亮': 68, '王宏宇': 85, '天思明': 74, '徐丽': 88, '丁涛': 63}

#以列表形式返回字典中的键
dc1.keys()

dict_keys(['刘亮亮', '王宏宇', '天思明', '徐丽', '丁涛'])

#以列表形式返回字典中的值
dc1.values()

dict_values([68, 85, 74, 88, 63])

#以列表形式返回字典中的键值对
dc1.items()

dict_items([('刘亮亮', 68), ('王宏宇', 85), ('天思明', 74), ('徐丽', 88), ('丁涛', 63)])

#返回某个键上的值
dc1['徐丽']

#删除某个键值对
del dc1['徐丽']
dc1

{'刘亮亮': 68, '王宏宇': 85, '天思明': 74, '丁涛': 63}

DataFrame

DataFrame是pandas中的一个重要数据结构，类似于Excel中的sheet，是带标签的二维数组，一个DataFrame由行索引（index）、列索引（columns）和二维数据（values）组成。为了便于分析，一般要求一个DataFrame只存储一种类型的数据。可以利用字典变量定义DataFrame。

import pandas as pd
d = {"姓名":['刘亮亮', '王宏宇', '天思明', '徐丽', '丁涛'],
     "统计学":[68, 85, 74, 88, 63],
     "数学":[85, 91, 74, 100,82],
     "经济学":[84, 43, 61, 49, 89]}
table1 = pd.DataFrame(d)
table1

这种方法比较麻烦，不建议使用。可以采用在Excel中输入数据，然后在Python中进行读取。DataFrame对象的方法如下表

方法	描述	示例
columns	查看所有列名	df.columns
dtypes	查看所有元素的类型	df.types
head	查看前n行数据，默认前5行	df.head(3)
index	查看所有行名	df.index
info	查看数据结构	df.info
shape	查看行数和列数	df.shape
T	行列转置	df.T
tail	查看后n行数据，默认后5行	df.tail(3)
values	查看所有元素的值	df.values

df = pd.read_csv("data/table1_1.csv", encoding='gbk')
df

#选择指定的列
df[['数学','统计学']]

#选择指定的行(3和5行)
df.loc[[2, 4]]

刀源

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
1.3 Python的数据处理

dict_items([('刘亮亮', 68), ('王宏宇', 85), ('天思明', 74), ('徐丽', 88), ('丁涛', 63)]){'刘亮亮': 68, '王宏宇': 85, '天思明': 74, '徐丽': 88, '丁涛': 63}{'刘亮亮': 68, '王宏宇': 85, '天思明': 74, '徐丽': 88, '丁涛': 63}dict_keys(['刘亮亮', '王宏宇', '天思明', '徐丽', '丁涛'])
复制链接

扫一扫