python计算条件概率_如何计算数据框架pandas-python中的条件概率？

最新推荐文章于 2021-04-22 20:54:35 发布

weixin_39864591

最新推荐文章于 2021-04-22 20:54:35 发布

阅读量107

点赞数

文章标签： python计算条件概率

I want to calculate conditional probabilites of ratings('A','B','C') in ratings column.

company model rating type

0 ford mustang A coupe

1 chevy camaro B coupe

2 ford fiesta C sedan

3 ford focus A sedan

4 ford taurus B sedan

5 toyota camry B sedan

Output:

Prob(rating=A) = 0.333333

Prob(rating=B) = 0.500000

Prob(rating=C) = 0.166667

Prob(type=coupe|rating=A) = 0.500000

Prob(type=sedan|rating=A) = 0.500000

Prob(type=coupe|rating=B) = 0.333333

Prob(type=sedan|rating=B) = 0.666667

Prob(type=coupe|rating=C) = 0.000000

Prob(type=sedan|rating=C) = 1.000000

Any help, Thanks..!!

解决方案

You can use .groupby() and the built-in .div():

rating_probs = df.groupby('rating').size().div(len(df))

rating

A 0.333333

B 0.500000

C 0.166667

and the conditional probs:

df.groupby(['type', 'rating']).size().div(len(df)).div(rating_probs, axis=0, level='rating')

coupe A 0.500000

B 0.333333

sedan A 0.500000

B 0.666667

C 1.000000

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39864591

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

[Python从零到壹] 十七.可视化分析之Matplotlib、Pandas、Echarts入门万字详解

杨秀璋的专栏

08-24

3万+

前一篇文章讲述了数据预处理、Jieba分词和文本聚类知识，这篇文章主要介绍Matplotlib和Pandas扩展包绘图的基础用法，同时引入Echarts技术，该技术主要应用于网站可视化展示中。本文内容以实例为主，给读者最直观的图形感受。两万字基础文章，希望对您有所帮助。

pandas一行代码计算相关性矩阵的条件概率

qq_22473329的博客

01-14

922

参与评论您还未登录，请先登录后发表或查看评论

python 条件概率_使用python查找条件概率