机器学习之支持向量机实战

最新推荐文章于 2022-09-18 18:03:54 发布

张维克

最新推荐文章于 2022-09-18 18:03:54 发布

阅读量383

点赞数

分类专栏：数据可视化文章标签： python

本文链接：https://blog.csdn.net/qq_45179904/article/details/121431152

版权

数据可视化专栏收录该内容

1 篇文章 0 订阅

订阅专栏

import pandas as pd

data = pd.read_csv("文件路径")
data.head()

data["列名"].value_counts()#统计region列中值的数量

data.loc[data["列名"] == "被替换值","列名"] = "替换值"

data['color'].astype("float64")#类型转换int64转换为float64

#1、读取数据集
import pandas as pd
wine = pd.read_csv('wine.csv')
#winequality = pd.read_csv('winequality.csv')
winequality = pd.read_csv('winequality.csv',sep = ';')

#2、数据和标签拆分开
wine_data=wine.iloc[:,1:]
wine_target=wine['Class']
winequality_data=winequality.iloc[:,:-1]
winequality_target=winequality['quality']
#winequality_target=winequality.iloc[:,-1]

#3、划分训练集和测试集
from sklearn.model_selection import train_test_split
wine_data_train, wine_data_test,wine_target_train, wine_target_test =train_test_split(wine_data, wine_target,test_size=0.1, random_state=6)

winequality_data_train, winequality_data_test,winequality_target_train, winequality_target_test = train_test_split(winequality_data, winequality_target,test_size=0.1, random_state=6)

#4、标准化数据集
from sklearn.preprocessing import StandardScaler #标准差标准化
stdScale = StandardScaler().fit(wine_data_train) #生成规则（建模）
wine_trainScaler = stdScale.transform(wine_data_train)#对训练集进行标准化
wine_testScaler = stdScale.transform(wine_data_test)#用训练集训练的模型对测试集标准化

stdScale = StandardScaler().fit(winequality_data_train) 
winequality_trainScaler = stdScale.transform(winequality_data_train)
winequality_testScaler = stdScale.transform(winequality_data_test)

#5、PCA降维
from sklearn.decomposition import PCA
pca = PCA(n_components=5).fit(wine_trainScaler) 
wine_trainPca = pca.transform(wine_trainScaler) 
wine_testPca = pca.transform(wine_testScaler)

pca = PCA(n_components=5).fit(winequality_trainScaler)
winequality_trainPca = pca.transform(winequality_trainScaler) 
winequality_testPca = pca.transform(winequality_testScaler)

张维克

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习之支持向量机实战

import pandas as pddata = pd.read_csv("文件路径")data.head()data["列名"].value_counts()#统计region列中值的数量data.loc[data["列名"] == "被替换值","列名"] = "替换值"data['color'].astype("float64")#类型转换int64转换为float64#1、读取数据集import pandas as pdwine = pd.read_csv('.
复制链接

扫一扫