- 博客(3)
- 收藏
- 关注
原创 红葡萄酒质量影响因素分析
1.载入数据,观察数据大致分布data = pd.read_csv('winequality-red.csv')pd.set_option('display.max_columns', None)print(data.describe())打印信息如下: fixed acidity volatile acidity citric acid residual sugar \count 1599.000000 1599.000000 1599.000000
2021-06-24 13:31:25 1556 4
原创 类偏斜(笔记)
类偏斜会出现类偏斜的情况查准率(Precision)、召回率(Recall)会出现类偏斜的情况 训练集中有非常多的同一种类的样本,而其他种类的样本只有很少或者没有。(举例:在1000个人中有5个患者,如果此时预测1000个人中有50个患者,那么即使此时预测没有患病的人数的准确率高达95%(950个人没有患病),但实际上我们所预测的50个患病人数与实际上的5个患病人数仍有很大差距)查准率(Precision)、召回率(Recall)通过查准率和召回率可以判断是否出现了类偏斜,且查准率和召回率越高越
2021-01-12 11:38:32 154
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人