学习python记录1(mosh大神)

import pandas as pd
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

music_data = pd.read_csv('music.csv')
X = music_data.drop(columns = ['genre'])
Y = music_data['genre']
X_train,X_test,Y_train,Y_test = train_test_split(X,Y,test_size = 0.8)

model = DecisionTreeClassifier()
model.fit(X_train,Y_train)
predictions = model.predict(X_test)
predictions

score = accuracy_score(Y_test,predictions)
score
 import pandas as pd
导入 pandas 库并将其简写为 pd,用于处理数据
from sklearn.tree import DecisionTreeClassifier
从 sklearn.tree 模块导入 DecisionTreeClassifier 类,用于构建决策树模型
from sklearn.model_selection import train_test_split
从 sklearn.model_selection 模块导入 train_test_split 函数,用于划分训练集和测试集
from sklearn.metrics import accuracy_score
从 sklearn.metrics 模块导入 accuracy_score 函数,用于计算准确率
music_data = pd.read_csv(‘music.csv’)
使用 pd.read_csv() 方法读取名为 ‘music.csv’ 的 CSV 文件,将数据存储到 music_data 变量中
X = music_data.drop(columns = [‘genre’])
从 music_data 中移除 ‘genre’ 列,并将结果存储到变量 X 中
Y = music_data[‘genre’]
将 music_data 中的 ‘genre’ 列作为目标变量,并将其存储到变量 Y 中
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.2)
使用 train_test_split() 函数将数据集划分为训练集和测试集,其中 test_size=0.2 表示测试集占总数据集的比例为 20%
model = DecisionTreeClassifier()
创建一个 DecisionTreeClassifier 类的实例,即决策树分类器模型
model.fit(X_train, Y_train)
使用 fit() 方法拟合模型,其中 X_train 是训练集的特征变量,Y_train 是训练集的目标变量
predictions = model.predict(X_test)
使用 predict() 方法对测试集进行预测,得到预测结果存储在 predictions 变量中
predictions
打印预测结果
score = accuracy_score(Y_test, predictions)
使用 accuracy_score() 函数计算模型在测试集上的准确率,其中 Y_test 是测试集的真实目标变量,predictions 是模型的预测结果
score
打印准确率的值

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值