![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据处理
文章平均质量分 77
giao客
这个作者很懒,什么都没留下…
展开
-
【GridSearch】 简单实现并记录运行效果
每次运行的数据通过一下代码进行记录。记录每种超参数组合下的运行结果。部分,以及进行网格的备选数据和。循环实现网格搜索的简单框架。使用该框架,需要调整训练数据。原创 2023-11-25 13:33:12 · 83 阅读 · 0 评论 -
【pandas】数据透视表【pivot_table】
使用pivot_table函数将df长数据转换为宽数据原创 2023-11-25 12:50:37 · 274 阅读 · 0 评论 -
【pandas】分层列名调整合并
函数计算了每组数据的总和、均值、标准差、最大值和最小值。然后,我们使用列表推导式将多层级的列名合并到单层级的列名中。重新设置为普通列,得到了合并了不同层级的列名的DataFrame对象。中对多个变量进行分组统计,并同时计算多个聚合函数比如。中对多个变量进行分组统计,并同时计算多个聚合函数比如。时,会出现多层列名的问题,不方便后续数据处理。时,会出现多层列名的问题,不方便后续数据处理。数据集进行了分组,并使用。在这个例子中,我们对。原创 2023-10-19 13:07:48 · 354 阅读 · 0 评论 -
百度指数省域关注度数据【qdata】的地图可视化【pyecharts】实现
百度指数能够反映不同地区对某关键词的搜索频率,因此可以作为不同地区对某关键词关注程度的代理变量。例如统计不同地区对财神信仰的虔诚程度,我们可以使用以下公式来衡量年平均财神搜索频率/当地人口数量然而,即使我们有了数据,单凭直观地数据浏览是难以把控其空间变化以及时间变化的,需要对其进行有效的可视化。使用百度开源的pyecharts可以将地域数据在地图上进行可视化,方便我们直观地观察数据的变动。因此,提出了本项目百度指数qdata + 地图可视化pyechart,在github可获取相关文件,项目仓库。原创 2023-10-12 09:29:20 · 413 阅读 · 0 评论 -
【pandas】有用的代码
替换后,原先的 ‘男’ 和 ‘女’ 被相应的数字替代,并得到了替换后的 DataFrame。是 Pandas 中的一个函数,用于根据数据的分位数将数据分成指定数量的相等大小的区间。astype() 是 Pandas 中的一个函数,用于将 Series 或 DataFrame 中的数据类型转换为指定的数据类型。函数将 ‘A’ 列的数据分成四个等分的区间,并将结果存储在一个新的列 ‘Group’ 中。允许对多个列,进行多种聚合计算,这些聚合函数可以是内置的聚合函数,也可以是自定义的函数。原创 2023-10-07 01:17:24 · 294 阅读 · 0 评论 -
Argparse的一些解析
argparse是Python中一个标准库,用于处理命令行参数和选项。它可以使程序更加灵活,方便地接受各种参数,同时也可以提供帮助信息。原创 2023-05-31 14:30:14 · 491 阅读 · 0 评论 -
创建dataframe
当数据data.csv文件与脚本代码位于同一个文件时,可以直接使用‘data.csv’指向该文件,若是 不在同一个位置,则需要输入文件的全目录地址总结:对于一般写博客需要,可能需要使用字典或者列表进行dataframe创建,而平时的项目则通常使用read_excel和read_csv进行数据读取。参考资料。原创 2023-05-02 16:00:26 · 2167 阅读 · 0 评论