import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
music_data = pd.read_csv('music.csv')
X = music_data.drop(columns = ['genre'])
Y = music_data['genre']
X_train,X_test,Y_train,Y_test = train_test_split(X,Y,test_size = 0.8)
model = DecisionTreeClassifier()
model.fit(X_train,Y_train)
predictions = model.predict(X_test)
predictions
score = accuracy_score(Y_test,predictions)
score
import pandas as pd
导入 pandas 库并将其简写为 pd,用于处理数据
from sklearn.tree import DecisionTreeClassifier
从 sklearn.tree 模块导入 DecisionTreeClassifier 类,用于构建决策树模型
from sklearn.model_selection import train_test_split
从 sklearn.model_selection 模块导入 train_test_split 函数,用于划分训练集和测试集
from sklearn.metrics import accuracy_score
从 sklearn.metrics 模块导入 accuracy_score 函数,用于计算准确率
music_data = pd.read_csv(‘music.csv’)
使用 pd.read_csv() 方法读取名为 ‘music.csv’ 的 CSV 文件,将数据存储到 music_data 变量中
X = music_data.drop(columns = [‘genre’])
从 music_data 中移除 ‘genre’ 列,并将结果存储到变量 X 中
Y = music_data[‘genre’]
将 music_data 中的 ‘genre’ 列作为目标变量,并将其存储到变量 Y 中
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.2)
使用 train_test_split() 函数将数据集划分为训练集和测试集,其中 test_size=0.2 表示测试集占总数据集的比例为 20%
model = DecisionTreeClassifier()
创建一个 DecisionTreeClassifier 类的实例,即决策树分类器模型
model.fit(X_train, Y_train)
使用 fit() 方法拟合模型,其中 X_train 是训练集的特征变量,Y_train 是训练集的目标变量
predictions = model.predict(X_test)
使用 predict() 方法对测试集进行预测,得到预测结果存储在 predictions 变量中
predictions
打印预测结果
score = accuracy_score(Y_test, predictions)
使用 accuracy_score() 函数计算模型在测试集上的准确率,其中 Y_test 是测试集的真实目标变量,predictions 是模型的预测结果
score
打印准确率的值