问题:
有多个参数,这些参数形成一系列的组合,需要根据不同参数的取值情况给每种组合一个判断结果作为规则。
比如,参数是本车速度,他车速度,相对距离,需要分配的规则为:危险/不危险
本车速度 | 他车速度 | 相对距离 | 是否危险 |
40 | 30 | 2 | 是 |
。。。 | 。。。 | 。。。 | 。。。 |
难点:
当参数很多的时候,组合太多,难以处理。
方法,还是采用组合权重的方法:
采用权重的方法,比如危险程度用本车车速+他车车速+1/相对距离*系数的方式,将这个结果作为每个组合的危险值,然后根据危险值的大小进行分组,根据不同的分组结果给出是否危险的判断结果。
工具:
一套代码,能够对输入值的数据大小进行分组((可规定组数)
import pandas as pd
# 输入数据,这里的危险值记得要单独再计算一遍,这里只是举例
data = [16.5, 18, 18.75, 20, 21.5, 21.5, 22.5, 23, 23, 23.75, 23.75, 25, 25, 26.5, 26.5, 27.5, 27.5, 28, 28, 28.75,
28.75, 30, 30, 30, 31.5, 31.5, 31.5, 32.5, 32.5, 33, 33, 33, 33.75, 33.75, 33.75, 35, 35, 35, 35, 35, 36.5,
36.5, 36.5, 37.5, 37.5, 37.5, 38, 38, 38, 38.75, 38.75, 38.75, 40, 40, 40, 40, 40, 41.5, 41.5, 41.5, 42.5,
42.5, 42.5, 43, 43, 43, 43.75, 43.75, 43.75, 45, 45, 45, 45, 45, 45, 46.5, 46.5, 47.5, 47.5, 47.5, 48, 48,
48.75, 48.75, 50, 50, 50, 50, 50, 51.5, 51.5, 51.5, 52.5, 52.5, 53, 53, 53, 53.75, 53.75, 53.75, 55, 55,
55, 55, 55, 55, 56.5, 56.5, 57.5, 57.5, 57.5, 58, 58, 58.75, 58.75, 60, 60, 60, 60, 61.5, 61.5, 62.5, 62.5,
63, 63, 63.75, 63.75, 65, 65, 65, 65, 65, 66.5, 67.5, 67.5, 68, 68.75, 70, 70, 70, 71.5, 72.5, 73, 73.75,
75, 75, 75, 77.5, 80, 85]
# 将数据转换为DataFrame
df = pd.DataFrame({'Original_Values': data})
# 计算分位数
quantiles = df['Original_Values'].quantile([0.33, 0.66]) # 这里就是分3组)
# 根据分位数将数据分组
df['Group'] = pd.cut(df['Original_Values'],
bins=[df['Original_Values'].min(), quantiles.iloc[0], quantiles.iloc[1], df['Original_Values'].max()], # 分三组
labels=['Group 1', 'Group 2', 'Group 3']) #分三组
# 输出结果
print(df)