数据分析
菜鸟杜
我是一个开源软件爱好者
展开
-
python pandas为数据表的每一条数据标记其重复的次数
我们可以使用分组汇聚计算每一位客户光顾的次数,但是如果使用名字有可能遇到同名的情况,这里假设客户编号是与每位客户绑定的,有时我们会遇到无法用单列数据来确定客户身份,这个使用可以使用多列数据组合的方式来确定身份(新建一列身份数据 data['客户身份'] = data['客户编号'] + data['姓名'])。总结一下,这个方法只是我在实际工作中找到的比较简洁的方法,当然还有很多方法,如果你有更好的方法,同学们相互学习学习。我们要把这张表的次数写入到客户光顾表中,很简单,使用merge()函数就可以了。原创 2024-06-26 08:52:42 · 293 阅读 · 0 评论 -
python 如何将电子表格按照某一列相同数据分到一个一个工作表中
在上面的代码中,你需要将 `Column_Name` 替换成你需要分组的列名,将 `data.xlsx` 替换成你的电子表格文件名,并将 `output.xlsx` 替换成你的输出文件名。运行上面的代码后,你将会得到一个包含多个工作表的 Excel 文件,每个工作表包含相同值的行。你可以使用 Pandas 库来将电子表格按照某一列相同数据分成多个工作表。# 创建一个 Excel 文件写入分组后的数据。# 将每个分组写入不同的工作表。# 保存并关闭 Excel 文件。# 按照某一列的值分组。原创 2023-05-31 07:43:07 · 608 阅读 · 1 评论 -
使用pandas分析医院人群20分钟分段就医人数
分析医院每20分钟段就医人数情况,找出医院集中就医的时间段。思路首先要对各个时间段的人员进行时间段标记,然后通过分组聚合使用count()函数统计每个时间段的人数。原创 2022-07-28 09:14:45 · 356 阅读 · 0 评论 -
使用pandas处理处理电子表格中的数据
最近学习了pandas,正好将前期学习的openpyxl和pandas结合起来处理数据。总体思路:首先打开工作簿,读取工作表中的数据,将第一行单独读取作为字典Key,然后分别读取工作表中的列并转换为列表作为字典的值。然后将数据通过DateFrame对象化实例。具体怎么处理数据就不说了,可以搜索DateFrame的具体文档,按照自己的意图进行处理。处理之后使用df.to_csv()导出数据。 整个过程中最主要的是将电子表格数据形成一个字典,然后再DataFrame。做好了这一步就可以用pandas作具体原创 2022-07-05 11:31:54 · 642 阅读 · 0 评论