Python学习笔记_05

最新推荐文章于 2022-11-21 18:37:21 发布

Gpower丶

最新推荐文章于 2022-11-21 18:37:21 发布

阅读量162

点赞数

分类专栏： python学习

本文链接：https://blog.csdn.net/qq_37127101/article/details/106224820

版权

python学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

机器学习实例

数据来源：
链接: https://pan.baidu.com/s/144ASMnonil7xF7u6mTWPRA
提取码: fnhb
数据不是真实的嗷，只是单纯练习

在这里插入图片描述
数据描述 gender：1代表男人，2代表女人
20-25岁的男人喜欢hiphop
20-25岁的女人喜欢dance 同理

#导入数据
import pandas as pd
#决策树
from sklearn.tree import DecisionTreeClassifier
music_data = pd.read_csv('music.csv')
#所有行和列都有值 不清理数据
#分割数据
#输入集
X = music_data.drop(columns=['genre'])
y = music_data['genre']
#建立模型
model = DecisionTreeClassifier()
model.fit(X, y)
predictions = model.predict([ [21,1] , [22, 0] ])
predictions

输出结果
在这里插入图片描述

测试模型准确性

import pandas as pd
#决策树
from sklearn.tree import DecisionTreeClassifier
#测量准确性
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
#导入数据
music_data = pd.read_csv('music.csv')


#所有行和列都有值 不清理数据
#分割数据
#输入集
X = music_data.drop(columns=['genre'])
y = music_data['genre']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
#建立模型
model = DecisionTreeClassifier()
model.fit(X_train, y_train)
predictions = model.predict(X_test)
score = accuracy_score(y_test, predictions)
score

输出结果：不唯一
在这里插入图片描述

模型持久化

import pandas as pd
#决策树
from sklearn.tree import DecisionTreeClassifier
from sklearn.externals import joblib
music_data = pd.read_csv('music.csv')


#所有行和列都有值 不清理数据
#分割数据
#输入集
X = music_data.drop(columns=['genre'])
y = music_data['genre']

model = DecisionTreeClassifier()
model.fit(X, y)
joblib.load(model, 'music-recommender.joblib')

可视化一个决策树

import pandas as pd
#决策树
from sklearn.tree import DecisionTreeClassifier
from sklearn import tree 
music_data = pd.read_csv('music.csv')


#所有行和列都有值 不清理数据
#分割数据
#输入集
X = music_data.drop(columns=['genre'])
y = music_data['genre']


model = DecisionTreeClassifier()
model.fit(X, y)

tree.export_graphviz(model, out_file='music-recommender.dot',
                    feature_names=['age','gender'],
                    class_names=sorted(y.unique()),
                    label='all',
                    rounded=True,
                    filled=True)

需要安装dot插件
在这里插入图片描述

Gpower丶

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Python学习笔记_05

机器学习实例数据来源：链接: https://pan.baidu.com/s/144ASMnonil7xF7u6mTWPRA提取码: fnhb数据不是真实的嗷，只是单纯练习数据描述 gender：1代表男人，2代表女人20-25岁的男人喜欢hiphop20-25岁的女人喜欢dance 同理#导入数据import pandas as pd#决策树from sklearn.tree import DecisionTreeClassifiermusic_data = pd.read_cs
复制链接

扫一扫