自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 《利用Python进行数据分析》初阶例题分析-4:2012年联邦选举委员会数据库

从"fec"数据帧中选择出"cand_nm"列值为"Obama, Barack"或"Romney, Mitt"的行,并将结果赋值给变量"fec_mrbo"。n是我们想要获取的前n个最大值的数量。这段代码首先使用groupby()函数对fec_mrbo数据集按cand_nm和contbr_st进行分组,然后使用grouped[“contb_receipt_amt”].sum().unstack(level=0)计算每个分组中contb_receipt_amt的总和,并将结果转换为数据框的形式。

2023-07-12 21:24:40 62 1

原创 《利用Python进行数据分析》初阶例题分析-3:美国农业部视频数据库

索引出key为"description", “group”, “id”, "manufacturer"的数据并保存为dataframe的形式,展示前五行数据和信息。这种形式的数据不适合分析,所以需要做一些工作将数据转换成更好的形式。接下来将nutrients对应的值转化为dataframe的形式,最后展示前七行数据。使用 .loc[] 方法选择 “Amino Acids” 索引的行,并获取 “food” 列的值。将db中的键为nutrients的数据逐个添加到nutrients这个列表中。

2023-07-12 21:15:15 114 1

原创 《利用Python进行数据分析》初阶例题分析-2:美国1880-2010年的婴儿名字

将出生的人按年份与性别做成透视表,使用pivot_table()函数创建了一个数据透视表total_births,其中聚合了"births"列,以"year"作为行索引,以"sex"作为列索引,并使用sum函数进行聚合。定义了一个名为add_prop的函数,用于在groupby操作中添加一个名为"prop"的新列,该列计算每个组内的出生人数占总出生人数的比例。2010年出生的男孩按取名概率降序排列,并计算累计和,0.5出现在第116个名字,而1900年仅仅出现在24个名字,大众名字确实在减少。

2023-07-12 21:04:02 367 1

原创 《利用Python进行数据分析》初阶例题分析-1:MoviesLens 1M数据集

GroupLens实验室提供了一些从MoviesLens用户那里收集的20世纪90年代末到21世纪初的电影评分数据的集合。

2023-07-12 20:46:35 250 1

原创 五分钟快速掌握windows深度学习环境配置:Anaconda、PyCharm、Pytorch、jupyter notebook

新手五分钟掌握windows深度学习环境配置:Anaconda、PyCharm、Pytorch、jupyter notebook

2023-07-04 08:41:03 752 12

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除