芝帕先生-CSDN博客

原创《利用Python进行数据分析》初阶例题分析-4：2012年联邦选举委员会数据库

从"fec"数据帧中选择出"cand_nm"列值为"Obama, Barack"或"Romney, Mitt"的行，并将结果赋值给变量"fec_mrbo"。n是我们想要获取的前n个最大值的数量。这段代码首先使用groupby()函数对fec_mrbo数据集按cand_nm和contbr_st进行分组，然后使用grouped[“contb_receipt_amt”].sum().unstack(level=0)计算每个分组中contb_receipt_amt的总和，并将结果转换为数据框的形式。

2023-07-12 21:24:40 62 1

原创《利用Python进行数据分析》初阶例题分析-3：美国农业部视频数据库

索引出key为"description", “group”, “id”, "manufacturer"的数据并保存为dataframe的形式，展示前五行数据和信息。这种形式的数据不适合分析，所以需要做一些工作将数据转换成更好的形式。接下来将nutrients对应的值转化为dataframe的形式，最后展示前七行数据。使用 .loc[] 方法选择 “Amino Acids” 索引的行，并获取 “food” 列的值。将db中的键为nutrients的数据逐个添加到nutrients这个列表中。

2023-07-12 21:15:15 114 1

原创《利用Python进行数据分析》初阶例题分析-2：美国1880-2010年的婴儿名字

将出生的人按年份与性别做成透视表，使用pivot_table()函数创建了一个数据透视表total_births，其中聚合了"births"列，以"year"作为行索引，以"sex"作为列索引，并使用sum函数进行聚合。定义了一个名为add_prop的函数，用于在groupby操作中添加一个名为"prop"的新列，该列计算每个组内的出生人数占总出生人数的比例。2010年出生的男孩按取名概率降序排列，并计算累计和，0.5出现在第116个名字，而1900年仅仅出现在24个名字，大众名字确实在减少。

2023-07-12 21:04:02 367 1

原创《利用Python进行数据分析》初阶例题分析-1：MoviesLens 1M数据集

GroupLens实验室提供了一些从MoviesLens用户那里收集的20世纪90年代末到21世纪初的电影评分数据的集合。

2023-07-12 20:46:35 250 1

原创五分钟快速掌握windows深度学习环境配置：Anaconda、PyCharm、Pytorch、jupyter notebook

新手五分钟掌握windows深度学习环境配置：Anaconda、PyCharm、Pytorch、jupyter notebook

2023-07-04 08:41:03 752 12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 《利用Python进行数据分析》初阶例题分析-4：2012年联邦选举委员会数据库

原创 《利用Python进行数据分析》初阶例题分析-3：美国农业部视频数据库

原创 《利用Python进行数据分析》初阶例题分析-2：美国1880-2010年的婴儿名字

原创 《利用Python进行数据分析》初阶例题分析-1：MoviesLens 1M数据集

原创 五分钟快速掌握windows深度学习环境配置：Anaconda、PyCharm、Pytorch、jupyter notebook

空空如也

空空如也

原创《利用Python进行数据分析》初阶例题分析-4：2012年联邦选举委员会数据库

原创《利用Python进行数据分析》初阶例题分析-3：美国农业部视频数据库

原创《利用Python进行数据分析》初阶例题分析-2：美国1880-2010年的婴儿名字

原创《利用Python进行数据分析》初阶例题分析-1：MoviesLens 1M数据集

原创五分钟快速掌握windows深度学习环境配置：Anaconda、PyCharm、Pytorch、jupyter notebook