algorithm
文章平均质量分 79
一瑞111
一个爱吃爱美的上市公司数据分析师
职位申请|新手转岗|数分干货|实战项目
为大家分享实操落地的转岗数分实操干货
️定制转岗计划(进本人)
展开
-
回归分析--数学基础篇
一、回归分析概述回归分析是寻找存在关系的变量间的数学表达式,并进行统计推断的一种统计方法。简单的说,回归分析可以预测数值型的目标值,比如已知一批特征数据及目标值,找到这些特征与目标存在的关系系数,求得方程,从而可以推测未知的目标值是多少。用这个方法可以做很多事情,如预测明年销售量,制造缺陷预测,又或者预测明星们的离婚率。二、回归分析一般步骤确定回归方程中的因变量和自变量 确定回归模...原创 2018-12-26 16:52:00 · 1741 阅读 · 0 评论 -
回归分析--python应用篇(statsmodels)
实例一:用statsmodels库做一元回归分析import numpy as npimport statsmodels.api as smimport matplotlib.pyplot as plt#构造变量number=20 x=np.linspace(0,10,number) #x值X=sm.add_constant(x) #回归方程添加一列x0=1bata=np.a...原创 2018-12-27 18:38:35 · 10630 阅读 · 4 评论 -
回归分析--python应用篇(scikit-learn)
目录实例一:目前有汽车数据,找到相关规律并做汽车价格预测。1.调取相关工具包、读取数据、观察数据2.清理数据:数据格式化、缺失值处理、异常值处理、预处理、特征相关性等2.1 缺失值处理2.2 特征相关性2.3 预处理(标准化,分类处理)3.Lasso 回归4.预测及检验实例一:目前有汽车数据,找到相关规律并做汽车价格预测。 ...原创 2018-12-28 19:08:44 · 2788 阅读 · 4 评论 -
信贷评分卡--开发流程篇
目录一、评分卡介绍二、数据收集三、数据准备3.1. 数据准备包括:处理异常值、缺失值、定义好坏客户、样本量、定义样本窗口期等。3.2. 变量可视化:可助于寻找特征数据之间的关系和发现问题。四、变量筛选4.1. IV和WOE4.2. 第二次筛选:相关性分析4.3. 衍生变量(组合变量)五、变量分箱六、建立模型6.1. logit变换函数推导6...原创 2019-01-04 12:02:27 · 4699 阅读 · 1 评论 -
逻辑回归--理论与python实例
一、逻辑回归介绍逻辑回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。以胃癌病情分析为例,选择两组人群,一组是胃癌组,一组是非胃癌组,两组人群必定具有不同的体征与生活方式等。因此因变量就为是否胃癌,值为“是”或“否”,自变量就可以包括很多了,如年龄、性别、饮食习惯、幽门螺杆菌感染等。自变量既可以是连续的,也可以是分类的。然后通过log...原创 2019-01-04 20:16:05 · 1524 阅读 · 2 评论 -
机器学习--个人心得
一、机器学习的介绍刚刚百度了下,机器学习,百度百科给这个词汇的解释是:研究计算器怎么模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。我个人的理解是,研究计算机,怎么让它学习人的行为,完成人指定给他的任务。现在很多日常生活都有机器学习相关的应用,比如:人脸识别,垃圾邮件过滤,购物车隔壁的产品推荐等等。二、机器学习的任务及各类算法机器学习主要分...原创 2018-12-19 17:14:28 · 2427 阅读 · 0 评论