![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Datawhale-数据分析
cyberEther
这个作者很懒,什么都没留下…
展开
-
Datawhale数据分析-Task2-part1-数据清洗和特征处理
Datawhale数据分析-Task2-part1-数据清洗和特征处理数据清洗缺失值观察与处理我们拿到的数据经常会有很多缺失值,比如我们可以看到Cabin列存在NaN,那其他列还有没有缺失值,这些缺失值要怎么处理呢方法1:使用isnull().sum()train_df.isnull().sum()'Age’有177个缺失值'Cabin’有687个缺失值'Embared’ 有2个缺失值方法2:info()函数train_df.info()缺失值处理(1) 处理缺失值一般有原创 2020-08-21 22:51:03 · 180 阅读 · 0 评论 -
Datawahle机器学习算法-Task1基于逻辑回归的分类预测
Datawahle机器学习算法-Task1基于逻辑回归的分类预测简介本次作业采用阿里云提供的天池平台,模型调用自scikit-learn的linear_model.LogisticRegression。本次作业之后掌握的知识包括1. 基础的逻辑回归理论,2. 用scikt-learn实现预测任务,3. 决策边界的绘图理论逻辑回归实际上是一种因变量基于Binomial分布的模型,从而处理的是分类问题。线性模型经过sigmoid函数变换得到样本是某一类别的概率。采用梯度下降法得到参数。具体实现拟合和原创 2020-08-20 21:55:46 · 187 阅读 · 0 评论 -
Datawhale数据分析第一章
这门课程得主要目的是通过真实的数据,以实战的方式了解数据分析的流程和熟悉数据分析python的基本操作。知道了课程的目的之后,我们接下来我们要正式的开始数据分析的实战教学,完成kaggle上泰坦尼克的任务,1. 第一章:数据载入及初步观察1.1 载入数据数据集下载 https://www.kaggle.com/c/titanic/overview1.1.1 任务一:导入numpy和pandasimport numpy as npimport pandas as pd1.1.2 任务二:载入数原创 2020-08-19 22:11:24 · 244 阅读 · 1 评论