决策树---预测泰坦尼克号的生存

最新推荐文章于 2024-01-16 17:21:49 发布

houjibofa2050

最新推荐文章于 2024-01-16 17:21:49 发布

阅读量369

点赞数 1

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011243684/article/details/85397149

版权

机器学习专栏收录该内容

65 篇文章 2 订阅

订阅专栏

决策树---预测泰坦尼克号的生存

#!/usr/bin/python
# -*- coding:utf-8 -*-

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.feature_extraction import DictVectorizer
from sklearn.tree import DecisionTreeClassifier

def mydesiontree():
    '''
    决策树预测泰坦尼克号的生死
    :return:
    '''
    data=pd.read_csv("http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic.txt")
    # print(data.columns)
    x=data[['pclass','age','sex']]
    y=data['survived']
    x['age'].fillna(x['age'].mean(),inplace=True)
    print(x['age'])
    x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.25,random_state=34)
    dictver=DictVectorizer(sparse=False)
    x_train=dictver.fit_transform(x_train.to_dict(orient="records"))
    print(dictver.get_feature_names())

    x_test=dictver.fit_transform(x_test.to_dict(orient="records"))
    decisiontree=DecisionTreeClassifier()
    decisiontree.fit(x_train,y_train)
    y_predict=decisiontree.predict(x_test)
    print("预测结果：",y_predict)
    print("预测准确率：",decisiontree.score(x_test,y_test))

    pass
if __name__ == '__main__':
    print("hello")
    mydesiontree()

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

houjibofa2050 CSDN认证博客专家 CSDN认证企业博客

码龄11年

581: 原创

4万+: 周排名

125万+: 总排名

51万+: 访问

: 等级

8787: 积分

47: 粉丝

164: 获赞

29: 评论

403: 收藏

私信

关注

热门文章

分类专栏

分布式 3篇
go 14篇
大数据技术 4篇
架构设计 5篇
LeetCode 139篇
联邦学习 1篇
git 5篇
源码 5篇
计算机基础 5篇
云原生 14篇
开发工具 11篇
ELK 11篇
Java 40篇
机器学习 65篇
算法 74篇
设计模式 5篇
消息队列 6篇
JVM 13篇
多线程并发 3篇
Spring 31篇
数据库 11篇

最新评论

golang垃圾回收算法
CSDN-Ada助手: SpringBoot里使用redis做缓存，有哪些套路呢？
机器学习 knn和kmean相似点和区别
菜码代码: 牛，老哥
LRU 缓存实现
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)；(2)增加除了各种控件外，文章正文的字数；(3)使用更多的站内链接。
b树与b+树的区别
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)增加除了各种控件外，文章正文的字数；(3)增加内容的多样性(例如使用标准目录、标题、图片、链接、表格等元素)。
归并排序及其应用
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用标准目录；(2)增加除了各种控件外，文章正文的字数；(3)文章不宜太短。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。