机器学习案例之Python中通过RF预测红酒质量

通过RF预测红酒质量从UCI上获取到了一份winequality的数据来作为小练习的数据源 https://archive.ics.uci.edu/ml/datasets/Wine ,想通过红酒的特征来预测红酒的质量。最后通过随机森林和集成学习的方法,将预测的正确率提升到了90%。数据集信息:这些数据是对意大利同一地区种植的葡萄酒进行化学分析的结果,这些葡萄酒来自三个不同的品种。该分析确定...
摘要由CSDN通过智能技术生成

通过RF预测红酒质量

在这里插入图片描述
从UCI上获取到了一份winequality的数据来作为小练习的数据源 https://archive.ics.uci.edu/ml/datasets/Wine ,想通过红酒的特征来预测红酒的质量。最后通过随机森林和集成学习的方法,将预测的正确率提升到了90%。

数据集信息:

这些数据是对意大利同一地区种植的葡萄酒进行化学分析的结果,这些葡萄酒来自三个不同的品种。该分析确定了三种葡萄酒中每种葡萄酒中含有的13种成分的数量。 数据集中主要采用11种特征变量,一哥目标变量如下:
数据集中属性列表:

attributes 属性
fixed acidity 非挥发性酸;
volatile acidity 挥发性酸度
citric acid 柠檬酸
residual sugar 残余糖分
chlorides 氯化物
free sulfur dioxide 游离二氧化硫
total sulfur dioxide 总二氧化硫
density 密度
pH pH值
sulphates 硫酸盐
alcohol 乙醇
quality 品质
属性信息:

所有属性都是连续的

1、首先先进行数据的导入,探索与预处理:

import pandas as pd
import numpy as np
data = pd.read_csv('./winequality-red.csv',sep=';',encoding='ISO-8859-1')

观察到表有问题,实际上这个csv文件通过分号分割,所以导入时需要添加:sep=’;’,即可正常读取数据。
在这里插入图片描述
在这里插入图片描述

2、处理数据是否分布平衡

data['quality'].value_counts()

在这里插入图片描述

  • 8
    点赞
  • 139
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值