查看dataframe两列之间的对应关系

最新推荐文章于 2024-07-15 22:26:41 发布

百里问姓

最新推荐文章于 2024-07-15 22:26:41 发布

阅读量311

点赞数 3

文章标签： python 数据分析

本文链接：https://blog.csdn.net/weixin_52195184/article/details/136104468

版权

对应大的csv文件，要查看特定两列之间的对应关系似乎并没有可以直接调用的函数（可能自己了解的很有限）。研究了下，结合groupby函数和nunique方法可以完成。

如下：

import pandas as pd

# 创建一个DataFrame对象
df = pd.DataFrame({
    'id': ['A', 'A', 'B', 'B', 'B','C','C','C'],
    'num': ['X', 'Y', 'X', 'Y', 'Z','Z','Z','Z'],
    'sub_id': [1, 2, 3, 4, 5,7,8,9]
})
df

  id num sub_id
0	A	X	1
1	A	Y	2
2	B	X	3
3	B	Y	4
4	B	Z	5
5	C	Z	6
6	C	Z	7
7	C	Z	8

# 对DataFrame对象进行分组
grouped = df.groupby(['id', 'num']).size()

# 将groupby对象转换为DataFrame对象
df_grouped = grouped.reset_index(name='count')

# 打印DataFrame对象
df_grouped

	id num	count
0	A	X	1
1	A	Y	1
2	B	X	1
3	B	Y	1
4	B	Z	1
5	C	Z	3

print(df_grouped.shape)
print(df_grouped['id'].nunique())
print(df_grouped['num'].nunique())

(6,3)
3
3

最后两列的nunique都比df_grouped的列数要少的话则两列之间是多对多关系，某列的nunique和df_grouped的列数一致而另一列要少的话，少的那列是有一对多的。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

百里问姓

关注关注

3
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
查看dataframe两列之间的对应关系

对应大的csv文件，要查看特定两列之间的对应关系似乎并没有可以直接调用的函数（可能自己了解的很有限）。研究了下，结合groupby函数和nunique方法可以完成。
复制链接

扫一扫

在dataframe两列日期相减并且得到具体的月数实例

01-20

df = pd.DataFrame(np.random.randn(6,4), index=pd.date_range('20130101', periods=6), columns=list('ABCD')) df.A = pd.date_range('20160101', periods=6) print (df) df1 = pd.DataFrame(np.random.randn(6,4)...

pandas DataFrame运算的实现

09-16

返回一个布尔型的DataFrame，表示对应位置的条件是否满足。我们还可以结合多个条件使用`&`和`|`运算符，例如： ```python data[(data["open"] > 23) & (data["open"] )] ``` 此外，`query()`函数允许我们用字符串...

1 条评论您还未登录，请先登录后发表或查看评论

对dataframe进行列相加,行相加的实例

09-20

执行上述代码后，DataFrame 'df' 将会增加新的一列 'a'，其中的值是对应行中'x', 'y', 'z'三列的字符串连接。例如，第一行的新值将是 'aaaaa'（'a' + 'aa' + 'aaa'）。这个实例展示了DataFrame基本的字符串操作，...

python dataframe astype 字段类型转换方法

12-23

首先，我们通过`print df.dtypes`查看DataFrame中各列的数据类型，此时`col2`为`object`类型，这意味着它存储的是字符串。接着，我们使用`df['col2'].astype('int')`将`col2`列转换为整数类型（`int32`）。转换后，...

【持续集成_05课_Linux部署SonarQube及结合开发项目部署】

weixin_42333261的博客

07-12

175

前置条件：sonarQube不能使用root账号进行启动，所以需要创建普通用户及。3）CMD上传qube文件-不能传到home路径下哦。2）添加用户、组名、密码。4）检查并解压上传的包。

Nginx七层（应用层）反向代理：UWSGI代理uwsgi_pass篇

jclee95的个人博客

07-10

1101

Nginx提供了多种应用层反向代理支持，包括proxy_pass、uwsgi_pass、fastcgi_pass和scgi_pass等。其中，proxy_pass指令可以接受一个URL参数，用于实现对HTTP/HTTPS协议的反向代理；uwsgi_pass用于代理到uWSGI应用服务器；fastcgi_pass用于代理到FastCGI服务器；而scgi_pass则用于代理到SCGI（Simple Common Gateway Interface）应用。这些指令使Nginx能够灵活地处理不同类型的后端服务和应

聊聊如何在内网下构建大模型微调环境

python1234567_的博客

07-12

835

LlamaFactory新版更新后，还是比较方便，只是说llamafactory-cli命令的确是有点蒙，踩个坑就好了。对于LlamaFactory微调来说，本身不难，毕竟都是配置；主要是在内网环境下的依赖包拉取安装是真麻烦，但其实也还好。走一遍的话，还是可以学到很多的。。

CV06_Canny边缘检测算法和python实现

https://github.com/foxpup11?tab=repositories

07-11

857

https://www.bilibili.com/video/BV1qU4y1U7aK/?spm_id_from=333.337.search-card.all.click&vd_source=7dace3632125a1ef7fd32c285eb2fbac

httpx 的使用

qq_39217312的博客

07-15

488

httpx 是一个可以支持 HTTP/2.0 的库还有一个是： hyper 库这里有一个由HTTP/2.0的网站： https://spa16.scrape.center/使用 requests 库进行爬取报错：安装： httpx pip3 install httpx 这样安装并不能支持 HTTP/2.0如果想要支持，需要这样安装：pip3 install httpx[http2]输出：这里访问的HTTP/1.0的网站，并且依次打印除了，响应状态码(status_code),响应头信息(header

Gradio从入门到精通（1）---快速入门

疯狂飙车的蜗牛的博客

07-15

539

Gradio 是一个开源 Python 包，允许您为机器学习模型、API 或任何任意 Python 函数快速构建演示或 Web 应用程序。然后，您可以使用 Gradio 的内置共享功能在几秒钟内共享指向演示或 Web 应用程序的链接。无需 JavaScript、CSS 或 Web 托管经验！Gradio最大的特点就是简单，便捷，短短几行代码就可以快速构建大模型web应用程序；当前很多人工智能模型的演示都是使用Gradio打造的；您会注意到，为了制作第一个演示，您创建了该类的实例。

sklearn基础教程：掌握机器学习入门的钥匙

AIGC绘图领域探索者，热衷于将创意与技术融合，致力于分享前沿AI绘图技巧与心得，让我们一起开启视觉艺术的新篇章。

07-13

765

是基于Python的一个开源机器学习库，它建立在NumPy、SciPy和matplotlib之上，提供了大量的算法和工具，用于数据挖掘和数据分析。无论是简单的线性回归，还是复杂的神经网络，sklearn都能提供直观易用的接口。作为Python中最为流行的机器学习库之一，以其简洁的API、丰富的算法和强大的功能赢得了广大用户的青睐。通过本文的介绍，相信你已经对sklearn有了初步的了解，并能够开始进行一些基础的机器学习任务。

【python学习】闭包的定义与特点，以及一些常用场景的使用

m0_49243785的博客

07-11

1031

闭包是一个函数，闭包让你可以在一个内层函数中访问其外层函数的作用域，可以使用闭包进行模块化代码和封装代码的操作，从而提高效率。

华为910b推理Qwen1.5-72b

weixin_41549308的博客

07-12

639

910b部署推理大模型

编程学单词：delta(希腊字母Δ/δ)，差值表示

m0_57158496的博客

07-11

1107

结语：代码编写中，用“通用”字符命名相应变量，是一个不错的好习惯。其一，不用注释，望文生义，简单明了；其二，代码书写形式风格“标准”统一，方便维护和流转。说明：今天我在堆叠代码时发现有delta样子的单词存在，修习之，对代码书写大有裨益。从今以后，我遇到类似的单词，都将在学习笔记中标识、分享。😋回页目录。

Python进阶 2024/7/10

weixin_73793099的博客

07-12

258

open（）打开函数name:打开的目标文件的字符串，可以包含文件所在的具体路径mode：访问模式，只读，只写，追加encoding：编码格式，推荐使用UTF-8r：只读w：用于写入a:用于追加，如果该文件已经存在，新的内容会被写到已有的内容之后；如果文件不存在，创建新文件进行写入。

使用Gunicorn提高Web应用的多核并发处理能力

2401_85639015的博客

07-11

938

Gunicorn 是一个基于pre-fork worker模型的WSGI服务器。它能够处理多个工作进程，每个进程可以处理多个请求，这使得它非常适合处理并发请求。兼容性强：支持多种Web框架，如Django、Flask、Pyramid等。高性能：基于pre-fork worker模型，能充分利用多核CPU。易于配置：提供了多种配置方式，包括命令行参数、配置文件和环境变量。稳定性：在生产环境中广泛使用，经过了大量的实践检验。

【Python 项目】类鸟群：仿真鸟群

07-13

1662

仔细观察一群鸟或一群鱼，你会发现，虽然群体由个体生物组成，但该群体作为一个整体似乎有它自己的生命。鸟群中的鸟在移动、飞越和绕过障碍物时，彼此之间相互定位。受到打扰或惊吓时会破坏编队，但随后重新集结，仿佛被某种更大的力量控制。1986年，Craig Reynolds创造鸟类群体行为的一种逼真模拟，称为“类鸟群（Boids）”模型。关于类鸟群模型，值得注意的是，只有 3 个简单的规则控制着群体中个体间的相互作用，但该模型产生的行为类似于真正的鸟群。

使用Python绘制一个自动变色爱心

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交