决策树与支持向量机做预测--血友病计数数据

最新推荐文章于 2024-07-21 14:24:18 发布

wodertianna

最新推荐文章于 2024-07-21 14:24:18 发布

阅读量87

点赞数 7

文章标签：决策树支持向量机算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wodertianna/article/details/138342842

版权

读取数据及数据集区分

所使用的数据是血友病数据，如有需要，可在主页资源处获取，数据信息如下：

数据预处理及区分数据集代码如下（详细预处理说明见上篇文章--随机森林）：

import pandas as pd
import numpy as np
hemophilia = pd.read_csv('D:/my_files/data.csv')  #读取数据

#数值变量化为分类变量
hemophilia['hiv']=hemophilia['hiv'].astype(object) 
hemophilia['factor']=hemophilia['factor'].astype(object)
new_hemophilia=pd.get_dummies(hemophilia,drop_first=True)   
    #drop_first=True--删去一列，如hiv，处理后为两列，都是01表示，但只保留一列就足够表示两种状态
new_data=new_hemophilia
from sklearn.model_selection import train_test_split
x = new_data.drop(['deaths'],axis=1)   #删去标签列
X_train, X_test, y_train, y_test = train_test_split(x, new_data.deaths, test_size=0.3, random_state=0)  
    #区分数据集，70%训练集，30%测试集

决策树回归预测

#决策树回归
from sklearn.tree import DecisionTreeRegressor
from sklearn import metrics
clf = DecisionTreeRegressor(random_state=0)
clf.fit(X_train, y_train)
y_pred2 = clf.predict(X_test)
print('MSE of clf: %.3f' %metrics.mean_squared_error(y_test, y_pred2))
'''MSE of zero_gp: 0.503'''

支持向量机回归预测

from sklearn.svm import SVR
from sklearn import metrics
svm_model=SVR() 
svm_model.fit(X_train, y_train)
y_pred1 = svm_model.predict(X_test)
print('MSE of SVR: %.3f' %metrics.mean_squared_error(y_test, y_pred1))  #%.3f表示保留三位小数
'''
MSE of SVR: 0.499'''

关注

7
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
决策树与支持向量机做预测--血友病计数数据

决策树回归预测+支持向量机回归预测。
复制链接

扫一扫

wodertianna

CSDN认证博客专家 CSDN认证企业博客

码龄5年

86: 原创

6181: 周排名

1万+: 总排名

6万+: 访问

: 等级

2193: 积分

1183: 粉丝

1467: 获赞

11: 评论

417: 收藏

私信

关注

热门文章

分类专栏

Python操作基础 24篇
一些报错解决记录 1篇

最新评论

Python模块之Numpy（三）-- 数组的访问
CSDN-Ada助手: 恭喜作者发布了第19篇博客！对于Python模块Numpy的讲解，让读者受益匪浅。希望作者能够继续保持创作的热情，不断分享有价值的知识给大家。下一步建议可以考虑深入探讨Numpy在数据处理和科学计算中的应用，相信会吸引更多读者的关注。期待作者的更多精彩内容！
Python模块之Numpy（一）-- 创建数组
CSDN-Ada助手: 恭喜您写了第17篇博客！您对Python模块Numpy的介绍非常详细，让读者受益匪浅。接下来，或许可以考虑深入探讨Numpy的数组操作方法，或者结合实际案例展示Numpy在数据处理中的应用。期待您更多的精彩内容，加油！祝您创作顺利，不断进步！
Python基础操作之自定义函数
CSDN-Ada助手: 恭喜您写了第16篇博客！自定义函数是Python基础操作中很重要的一部分，您的分享一定帮助了很多初学者。希望您能继续保持创作的热情，不断提升自己的写作水平。下一步可以考虑深入探讨函数的高级用法或者与其他模块的结合应用，期待您的更多精彩内容！
2024 年“泰迪杯”A 题：生产线的故障自动识别与人员配置--第四题（用遗传算法解决生产线排班问题--matlab代码）
CSDN-Ada助手: 恭喜您发布了第15篇博客！标题看起来非常专业和有趣，对于解决生产线排班问题采用遗传算法的方法也非常引人注目。希望您能继续坚持创作，分享更多有价值的内容给大家。或许下一步可以考虑结合实际案例或者深入探讨算法的优化方向，让读者更深入地了解这一领域的知识。期待您的下一篇作品！
英语六级作文模板
CSDN-Ada助手: 恭喜作者撰写了关于“英语六级作文模板”的博客，这对许多需要备考的同学来说肯定是一大福音。希望作者能继续保持创作的热情和耐心，为读者提供更多有用的学习资料。或许下一步可以考虑分享一些实用的写作技巧或者范文分析，让读者更好地掌握英语写作的技巧。期待作者的更多精彩内容！

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。