学习python记录1（mosh大神）

太阳当空照zz

已于 2023-08-27 11:24:29 修改

阅读量69

点赞数

文章标签： python pandas

于 2023-08-27 11:17:38 首次发布

本文链接：https://blog.csdn.net/pejoyzhao/article/details/132521599

版权

import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

music_data = pd.read_csv('music.csv')
X = music_data.drop(columns = ['genre'])
Y = music_data['genre']
X_train,X_test,Y_train,Y_test = train_test_split(X,Y,test_size = 0.8)

model = DecisionTreeClassifier()
model.fit(X_train,Y_train)
predictions = model.predict(X_test)
predictions

score = accuracy_score(Y_test,predictions)
score

 import pandas as pd
导入 pandas 库并将其简写为 pd，用于处理数据
from sklearn.tree import DecisionTreeClassifier
从 sklearn.tree 模块导入 DecisionTreeClassifier 类，用于构建决策树模型
from sklearn.model_selection import train_test_split
从 sklearn.model_selection 模块导入 train_test_split 函数，用于划分训练集和测试集
from sklearn.metrics import accuracy_score
从 sklearn.metrics 模块导入 accuracy_score 函数，用于计算准确率
music_data = pd.read_csv(‘music.csv’)
使用 pd.read_csv() 方法读取名为 ‘music.csv’ 的 CSV 文件，将数据存储到 music_data 变量中
X = music_data.drop(columns = [‘genre’])
从 music_data 中移除 ‘genre’ 列，并将结果存储到变量 X 中
Y = music_data[‘genre’]
将 music_data 中的 ‘genre’ 列作为目标变量，并将其存储到变量 Y 中
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.2)
使用 train_test_split() 函数将数据集划分为训练集和测试集，其中 test_size=0.2 表示测试集占总数据集的比例为 20%
model = DecisionTreeClassifier()
创建一个 DecisionTreeClassifier 类的实例，即决策树分类器模型
model.fit(X_train, Y_train)
使用 fit() 方法拟合模型，其中 X_train 是训练集的特征变量，Y_train 是训练集的目标变量
predictions = model.predict(X_test)
使用 predict() 方法对测试集进行预测，得到预测结果存储在 predictions 变量中
predictions
打印预测结果
score = accuracy_score(Y_test, predictions)
使用 accuracy_score() 函数计算模型在测试集上的准确率，其中 Y_test 是测试集的真实目标变量，predictions 是模型的预测结果
score
打印准确率的值