关于泰坦尼克号之灾

最新推荐文章于 2022-06-09 21:48:13 发布

VIP文章 Python技术博文

最新推荐文章于 2022-06-09 21:48:13 发布

阅读量1.5k

点赞数 1

本文链接：https://blog.csdn.net/frbevrqbn4l/article/details/81187438

版权

泰坦尼克号之灾

“

使人觉得遥远的不是时间长，而是两三件不可挽回的事。 from 博尔赫斯

”

import pandas as pd #数据分析
import numpy as np #科学计算
from pandas import Series,DataFrame
data_train = pd.read_csv("/Titanic_data/Train.csv")
import matplotlib.pyplot as plt
fig = plt.figure()
fig.set(alpha=0.2) # 设定图表颜色alpha参数
plt.subplot2grid((2,3),(0,0)) # 在一张大图里分列几个小图
data_train.Survived.value_counts().plot(kind='bar')# 柱状图
plt.title(u"获救情况 (1为获救)") # 标题
plt.ylabel(u"人数")
plt.subplot2grid((2,3),(0,1))
data_train.Pclass.value_counts().plot(kind="bar")
plt.ylabel(u"人数")
plt.title(u"乘客等级分布")
<

最低0.47元/天解锁文章

优惠劵

Python技术博文

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
关于泰坦尼克号之灾

泰坦尼克号之灾“使人觉得遥远的不是时间长，而是两三件不可挽回的事。 from 博尔赫斯”import pandas as pd #数据分析import numpy as ...
复制链接

扫一扫

Kaggle入门-泰坦尼克号之灾（数据集+代码+结果）.zip

02-06

Kaggle入门-泰坦尼克号之灾可以参考：https://jnsimba.blog.csdn.net/article/details/104245964

泰坦尼克号之灾分析

weixin_30616969的博客

08-18

310

大神经验： 1、应用机器学习，千万不要一上来就试图做到完美，先撸一个baseline的model出来，再进行后续的分析步骤，一步步提高，所谓后续步骤可能包括『分析model现在的状态(欠/过拟合)，分析我们使用的feature的作用大小，进行feature selection，以及我们模型下的bad case和产生的原因』等等。 2、对数据的认识太重要了！数据中的特殊点/...

1 条评论您还未登录，请先登录后发表或查看评论

机器学习方法汇总——泰坦尼克号之灾难分析

GeekZW的博客

05-15

3532

泰坦尼克号之灾难分析整合背景及方法描述：寒小阳——泰坦尼克号之灾分析包含方法有：Adaboost，GBDT，LR，RF，SVM，VotingC，xgboost等方法。下载链接：点击打开链接或https://pan.baidu.com/s/1xF_0QdiDZIi61kfCp07zMA 密码：7eof 文件夹内...

Titanic 泰坦尼克之灾 | Kaggle| 入门 1

yonsan_的博客

06-09

314

写这篇博客，有两个目的：1. 我是一个kaggle新手，刚刚完成这个入门项目，想做一个总结。2. 给别的小伙伴讲讲这个项目，顺便提升自己的理解。如果文中有问题，请在评论区一起讨论，谢谢。流程总结：1. 观察数据，通常使用data.head() 和data.columns.unique()来观察数据的大概情况和特征情况。2. 数据清洗3. 特征提取4. 建立模型5. 输出结果像很多课程中的机器学习项目一样，titanic项目也是通过使用一组数据（特征）来完成对船上的人是否存活的预测。我们先来看看这个项目的数

关于泰坦尼克之灾的数据分析

毕业作品网站

02-15

697

目录：加载数据，分析数据数据清洗特征工程模型预测 1. 加载数据，分析数据的组成 import warnings warnings.filterwarnings("ignore") import re import numpy as np import pandas as pd import matplotlib.pyplot as plt import random as rd df = pd.read_csv('./data/train.csv') # 输出数据信息 print(df.i

Kaggle入门-泰坦尼克号之灾

夫唯不争，故天下莫能与之争。

02-10

1624

跟着饼干大神磕磕绊绊的走完了机器学习小组的第一期之旅，接下来的任务就是巩固一下以前的诸多知识点，有时候太忙都没有学习完；再就是参与一下实战，打打kaggle比赛，也算是应用吧，毕竟公司短期内还暂时用不到机器学习。英语本来就比较渣，看着kaggle的纯英文，一脸懵逼不知道从何下手，你如果也和我一样，可以参考这篇文章https://www.jiqizhixin.com/articles/2019-...

04-07

07-21

06-19

泰坦尼克号csv数据，机器学习中做特征工程的样例数据

kaggle泰坦尼克数据titanic

08-16

平台下载的原始三个数据train.csv test.csv gender_submission.csv （本来想0积分分享给大家无奈最低是1分了）

泰坦尼克python数据分析

01-04

泰坦尼克python数据分析，带数据集和源代码，强烈推荐。

泰坦尼克号案例ppt

02-24

就是那个大家都熟悉的『Jack and Rose』的故事，豪华游艇倒了，大家都惊恐逃生，可是救生艇的数量有限，无法人人都有，副船长发话了『lady and kid first！』，所以是否获救其实并非随机，而是基于一些背景有rank...

泰坦尼克号之灾学习笔记

肥仔的博客

07-23

349

学习资料：寒小阳的博客有几个点是非常重要的： 1）对数据的认识！！！对数据的认识！！！对数据的认识！！！ 2）要做交叉验证！！！要做交叉验证！！！要做交叉验证！！！ 1.目标：预测什么样的乘客有可能存活 2.数据初步分析： 1）和获救有关的特征有：舱位等级、性别、cabin项是否为空 2）对有许多缺失值的cabin属性来说，我们暂且分为yes和no两种属性 3）这里说一下通常处理缺失值的几种方...

【Kaggle入门练习赛】泰坦尼克之灾_续

weixin_39655021的博客

02-14

275

在情人节这个喜大普奔的日子里，终于找到了之前结果一直提不上去的原因……当然这个原因也不是自己想出来的。在泰坦尼克之灾这个题的处理中，比较关键的两点都包含在名字这个字段中，反应出来的一是社会地位，而是家庭联系。之前做的时候直接把这个字段丢弃了，然后在如何填补年龄那里一直纠结。总结一下： 1.XGBoost https://www.missshi.cn/api/view/blog/5a06...

kaggle--泰坦尼克之灾--Python--图文详解

查数菇乐园

01-13

1298

关联分析，get_dummies特征值幻化，RandomForestRogressor填充缺失值，交叉验证

基于SSM+JSP的企业人事管理信息系统毕业设计(源码+录像+说明).rar

05-09

基于SSM+JSP的企业人事管理信息系统毕业设计(源码+录像+说明).rar 【项目技术】开发语言：Java 框架：ssm+jsp 架构：B/S 数据库：mysql 【演示视频-编号：420】 https://pan.quark.cn/s/b3a97032fae7 【实现功能】实现了员工基础数据的管理，考勤管理,福利管理,薪资管理,奖惩管理,考核管理,培训管理,招聘管理,公告管理,基础数据管理等功能。

node-v6.12.0-linux-ppc64le.tar.xz

最新发布

05-09

Node.js，简称Node，是一个开源且跨平台的JavaScript运行时环境，它允许在浏览器外运行JavaScript代码。Node.js于2009年由Ryan Dahl创立，旨在创建高性能的Web服务器和网络应用程序。它基于Google Chrome的V8 JavaScript引擎，可以在Windows、Linux、Unix、Mac OS X等操作系统上运行。 Node.js的特点之一是事件驱动和非阻塞I/O模型，这使得它非常适合处理大量并发连接，从而在构建实时应用程序如在线游戏、聊天应用以及实时通讯服务时表现卓越。此外，Node.js使用了模块化的架构，通过npm（Node package manager，Node包管理器）,社区成员可以共享和复用代码，极大地促进了Node.js生态系统的发展和扩张。 Node.js不仅用于服务器端开发。随着技术的发展，它也被用于构建工具链、开发桌面应用程序、物联网设备等。Node.js能够处理文件系统、操作数据库、处理网络请求等，因此，开发者可以用JavaScript编写全栈应用程序，这一点大大提高了开发效率和便捷性。在实践中，许多大型企业和组织已经采用Node.js作为其Web应用程序的开发平台，如Netflix、PayPal和Walmart等。它们利用Node.js提高了应用性能，简化了开发流程，并且能更快地响应市场需求。

node-v6.8.0-linux-ppc64le.tar.xz

05-09

逻辑回归应用之kaggle泰坦尼克之灾

07-25

逻辑回归在Kaggle泰坦尼克之灾竞赛中的应用主要是用于预测乘客是否幸存。在这个竞赛中，我们可以将乘客的特征（如性别、年龄、船票等级等）作为自变量，将乘客是否幸存作为因变量，通过训练逻辑回归模型来预测新乘客的生存情况。以下是逻辑回归在Kaggle泰坦尼克之灾竞赛中的一般步骤： 1. 数据探索和预处理：首先，我们需要对数据进行探索，了解各个特征的分布情况、缺失值情况等。然后，我们可以对缺失值进行填充、对分类变量进行编码等预处理操作。 2. 特征工程：根据对数据的理解和领域知识，我们可以进行特征工程，提取新的特征或者对原有特征进行组合，以提高模型的性能。 3. 数据划分：将数据集划分为训练集和测试集，通常采用交叉验证的方法进行模型选择和调参。 4. 模型训练：使用逻辑回归算法对训练集进行拟合，并根据模型评估指标（如准确率、精确率、召回率等）选择最佳模型。 5. 模型调参：可以通过网格搜索等方法对模型的超参数进行调优，以获得更好的性能。 6. 模型评估：使用测试集对训练好的模型进行评估，得到模型在未知数据上的性能指标。 7. 预测并提交结果：使用训练好的模型对新的数据进行预测，并将结果提交到Kaggle平台上进行评估和排名。逻辑回归是一个简单而有效的分类算法，在泰坦尼克之灾竞赛中有着广泛的应用。但是要注意，逻辑回归并不是唯一可用的算法，根据数据集的性质和特点，我们也可以尝试其他的分类算法来提高预测性能。

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交