【机器学习】kaggle 泰坦尼克

最新推荐文章于 2024-03-16 03:32:38 发布

山间wu

最新推荐文章于 2024-03-16 03:32:38 发布

阅读量216

点赞数

本文链接：https://blog.csdn.net/qq_42011358/article/details/84588870

版权

参考代码
kaggle泰坦尼克入门，分别使用了线性回归、逻辑回归和随机森林三种算法。
链接如下：
https://www.jianshu.com/p/bbfbdedc3c1c

随机森林算法介绍
决策树-Gini不纯度
决策树算法有缺陷，当我们需要区分的特征很多时，需要引入Gini不纯度来表示结果的可靠性。
鉴于决策树容易过拟合的缺点，随机森林采用多个决策树的投票机制来改善决策树。

随机森林的生成方法：

1.从样本集中通过重采样的方式产生n个样本

2.假设样本特征数目为a，对n个样本选择a中的k个特征，用建立决策树的方式获得最佳分割点

3.重复m次，产生m棵决策树

4.多数投票机制来进行预测

（需要注意的一点是，这里m是指循环的次数，n是指样本的数目，n个样本构成训练的样本集，而m次循环中又会产生m个这样的样本集）

链接如下：
https://blog.csdn.net/mao_xiao_feng/article/details/52728164#commentBox

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

山间wu

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

kaggle大学之机器学习（灌水帖）

rainrainm的博客

09-15

413

kaggle真是一个好网站，这里的微课虽然内容非常少，但是却是有着学习加训练的闭环。每次学习都能从实际例子中让我真正学到东西。好了废话不多说，今天继续冲机器学习的微课。 sql已经学完了，sql提高不打算看，因为这些操作可以在更便捷的编程语言上学习到。机器学习入门看了一半，不过不理解数据使得我止步了。但是今天我要重返这里，征服机器学习的高峰。 机器学习搞完看pandas和数据可视化模块。目录一、模型是怎么运作的二、基本数据探索EDA 三、你的第一个机器学习模型选择数据：查看一下列名

Kaggle课程 — 机器学习入门 Intro to Machine Learning

迷途小书童问天的博客

02-26

1466

学习Machine Learning的核心概念, 然后创建你的第一个模型.

参与评论您还未登录，请先登录后发表或查看评论

机器学习 Kaggle

hsx1612727380的专栏

11-19

1365

为什么使用Kaggle？免费GPU，白嫖党的快乐 Kaggle: Your Machine Learning and Data Science CommunityKaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.https://www.kaggle.com/ Kaggle是什么？ Kagg

机器学习：kaggle入门学习一些笔记

weixin_42721412的博客

01-18

384

1.机器学习概述。 2.kaggle上下载的文件都是csv格式的，可以直接调用python的csv库进行处理：参考 import csv f = csv.reader(open('1111.csv','r')) for i in f: print(i) 代码结果： ['测试1', '软件测试工程师'] ['测试2', '软件测试工程师'] ['测试3', '软件测试工程师'] ['测试4', '软件测试工程师'] ['测试5', '软件测试工程师'] ...

机器学习/深度学习实战——kaggle房价预测比赛实战（数据分析篇）

Liu Feng's Blog

08-04

9140

文章目录很不容易，这个实战项目肝了好几天，借鉴了很多大佬的思路和代码，也从中学习到了很多东西（我比较喜欢将比较经典的代码复写一遍，我自我感觉这样学习到的东西比CV大法会高那么一点点），因为这个项目的内容比较多，所以我将会分为三个blog进行整理。第一个blog整理关于数据部分的认识和预处理第二个blog整理使用机器学习回归分析的算法进行建模和预测第三个blog整理基于pytorch设计深度学习模型进行恢复i ......

机器学习系列(3)_逻辑回归应用之Kaggle泰坦尼克之灾

热门推荐

寒小阳

11-12

43万+

kaggle机器学习竞赛泰坦尼克号船员数据集

06-09

kaggle机器学习竞赛泰坦尼克号船员数据集，原网址https://www.kaggle.com/c/titanic

【机器学习kaggle赛事】泰坦尼克号生存预测

m0_51933492的博客

09-22

5698

回顾这个项目的基本流程：1、查看数据集，合并训练集测试集以一起进行数据清洗2、数据清洗：查看数据集空缺值，并填充空缺值3、探索性可视化：通过透视表和图表，探究各个特征与label（需要预测的值）的相关性，若有相关性则保留。4、特征选择：通过相关系数来选择。

机器学习经典Kaggle案例:泰坦尼克号：从灾难中学习机器

weixin_42662126的博客

08-18

1万+

kaggle链接:https://www.kaggle.com/c/titanic 一、简介 泰坦尼克号案例可以说是kaggle的“hello world”，入门者的必看案例。 1.1 比赛描述 RMS泰坦尼克号沉没是历史上最臭名昭着的沉船之一。1912年4月15日，在她的处女航中，泰坦尼克号在与冰山相撞后沉没，在2224名乘客和机组人员中造成1502人死亡。这场耸人听闻的悲剧震惊了国际社会，并为...

Kaggle泰坦尼克号数据集.zip

02-02

题目提供的训练数据集包含11个特征，分别是： Survived:0代表死亡，1代表存活 Pclass:乘客所持票类，有三种值(1,2,3) Name:乘客姓名 Sex:乘客性别 Age:乘客年龄(有缺失) SibSp:乘客兄弟姐妹/配偶的个数(整数值) ...

机器学习项目实战:泰坦尼克号获救预测训练数据和测试数据完整版

02-11

机器学习实例不多，泰坦尼克号获救测试是一个比较好的，可是苦于没有训练数据，最近出去下载下来了，与诸君分享。

Python机器学习kaggle案例-泰坦尼克船员获救预测

lwycc2333的博客

12-03

345

1. Python常用数据库 numpy: Python科学计算库 pandas： Python数据分析处理库 Scikit-learn: Python机器学习库以上三个库都是开源的。 2. 数据集下载地址：数据集 SibSp : 兄弟姐妹有几个 Parch ：老人和孩子 Fare：船票多少钱 Embarked：不同的上传地点 3. 数据预处理 import pandas as pd tita...

七个值得实践的Kaggle机器学习项目 - 2024更上一层楼

加百力的技术博客

12-26

6056

这是一个监督学习问题，我们通过分析欺诈（fraud）和非欺诈（non-fraud）交易案例的信用卡交易数据集，开发一个机器学习模型来检测欺诈性信用卡交易，这对于金融机构增强安全性、保护用户免受欺诈活动并使不同交易的环境变得非常容易至关重要。在这个项目中，我们利用带有标记音频剪辑的数据集，例如包含情感语音录音的“RAVDESS”数据集，开发一个可以识别口语中不同类型的情绪（愤怒、快乐、疯狂等）的模型。应用不同的聚类算法，根据模型形成的其他聚类可视化客户细分，分析每个细分的特征以获得营销数据信息。

机器学习实战1 泰坦尼克号沉船人员获救(随机森林)

最新发布

2301_76427842的博客

03-16

971

预测泰坦尼克号沉船事件中哪些人员会获救？

应用kaggle进行机器学习项目开发

@bangbang的博客

05-29

1466

你可能听说过Kaggle数据科学竞赛，但你知道Kaggle还有许多其他功能，可以帮助你完成机器学习项目吗?对于为机器学习项目寻找数据集的人，Kaggle允许你访问别人的公共数据集，并共享你自己的数据集。对于那些希望构建和训练自己的机器学习模型的人，Kaggle还提供了浏览器上notebook开发环境和一些免费的GPU时长。你也可以查看其他人的公开的notebook! 除了网站之外，Kaggle还有一个命令行界面(CLI)，你可以在命令行中使用它来访问和下载数据集。概述本博客分为五个部分;它们是: Ka

【机器学习】Kaggle知识点：集成学习基础

fengdu78的博客

04-14

690

集成学习基础集成学习是指结合两个或多个模型的机器学习模型。集成学习是机器学习的分支，通常在追求更强预测的能力时使用。集成学习经常被机器学习竞赛中的顶级和获胜参与者使用。现代机器学习库（scikit-learn、XGBoost）内部已经结合了常见的集成学习方法。集成学习介绍集成学习结合多个不同的模型，然后结合单个模型完成预测。通常情况下，集成学习能比单个模型找到更好的性能。...

数据(机器学习/深度学习)竞赛平台——Kaggle

g11d111的博客

08-14

3万+

这篇文章适合那些刚接触Kaggle、想尽快熟悉Kaggle并且了解项目情况的朋友。本文分为两部分介绍Kaggle，Part One简单介绍Kaggle，Part Two将简单介绍正规的竞赛的项目，大家可以针对性的解决感兴趣的题目。 1、Kaggle简介Kaggle是一个数据分析的竞赛平台，网址：https://www.kaggle.com/企业或者研究者可以将数据、问题描述、期望的指标发布到Kagg

六、（2）随机森林——根据泰坦尼克号船员数据，预测其是否生还。

python

05-24

700

六、（2）随机森林——根据泰坦尼克号船员数据，预测其是否生还。数据集下载地址https://pan.baidu.com/s/1g76H1913c5vYK1z02Ba_5w，密码：yj1y ，保存为csv格式。根据自己想要测试的数据，选取目标值，另存为txt格式。下图是我整理的结果，抽取了社会等级、年龄、所住楼层、性别四个特征来预测是否生还。代码如下: # -*- coding: utf-...

Kaggle泰坦尼克号生存预测机器学习分析

Kaggle泰坦尼克号生存预测项目是机器学习入门的一个很好的实践案例，它不仅涉及到机器学习流程的多个重要环节，还包括了数据处理和模型优化的实战经验。通过这个项目，学习者可以加深对数据科学和机器学习的理解，并...