Python商业实战
Python实战分析课程和书籍的笔记整理
Vivian Ouyang
在联合健康保险公司(UnitedHealth Group)的Data Scientist
展开
-
12_商业实战第七章学习笔记PartI:不平衡数据处理
商业实战第六章学习笔记PartI:不平衡数据处理什么是不平衡数据常用处理方法抽样欠采样过采样什么是不平衡数据常用处理方法抽样欠采样过采样原创 2020-05-25 13:28:07 · 268 阅读 · 0 评论 -
10_商业实战第六章学习笔记PartI:决策树
商业实战第六章学习笔记PartI:决策树ID3决策树C4.5决策树的核心问题有两个。该按什么样的次序来选择变量(属性)最佳分离点(连续的情形)在哪儿ID3决策树ID3的缺点C4.5原创 2020-05-25 13:17:31 · 240 阅读 · 0 评论 -
11_商业实战第六章学习笔记PartII:神经网络
商业实战第六章学习笔记PartII:神经网络感知器BP神经网络原理概述详述BP总结局限性改进感知器BP神经网络原理概述详述BP总结局限性改进原创 2020-05-25 13:05:01 · 543 阅读 · 0 评论 -
09_商业实战第五章学习笔记PartIII:逻辑回归
商业实战第五章学习笔记PartIII:逻辑回归优势比(Odds Ratios)结果的概率 vs 结果的发生比逻辑回归模型模型表现优劣的评估成对比较 (C-statistics)ROC优势比(Odds Ratios)结果的概率 vs 结果的发生比逻辑回归模型模型表现优劣的评估成对比较 (C-statistics)ROC...原创 2020-05-25 04:54:33 · 249 阅读 · 0 评论 -
08_商业实战第五章学习笔记PartII:凸优化
商业实战第五章学习笔记PartII:凸优化导数凸函数无约束凸优化问题求解梯度下降方法牛顿法有约束凸优化的优化问题求解导数凸函数无约束凸优化问题求解梯度下降方法牛顿法有约束凸优化的优化问题求解...原创 2020-05-25 04:40:51 · 183 阅读 · 0 评论 -
07_商业实战第五章学习笔记PartI: 参数估计
商业实战第五章学习笔记PartI: 参数估计统计学推断的基本问题参数估计的类型矩估计极大似然估计模型调优KNN统计学推断的基本问题参数估计的类型矩估计极大似然估计模型调优KNN...原创 2020-05-25 03:58:39 · 174 阅读 · 0 评论 -
06_商业实战第四章学习笔记Part II:线性回归价值预测
商业实战第四章学习笔记Part II:线性回归价值预测简单线性回归的估计多元线性回归多元线性回归的变量筛选向前选择后向消元逐步选择查看残差图强影响点分析多重共线性分析线性模型流程数值预测评估原理正则化方法解决共线性的方法岭回归Lasso两者比较与弹性网络简单线性回归的估计多元线性回归多元线性回归的变量筛选向前选择后向消元逐步选择查看残差图强影响点分析多重共线性分析线性模型流程数值预测评估原理正则化方法解决共线性的方法岭回归Lass原创 2020-05-25 03:24:09 · 181 阅读 · 0 评论 -
05_商业实战第四章学习笔记Part I:参数估计和统计推断
商业实战第四章学习笔记Part I:参数估计和统计推断点估计置信区间均值的标准误差和置信区间假设检验的两类错误t检验两变量关系检验方法综述两独立样本t检验检验方差齐性的F检验相关分析相关系数的计算相关系数的检验卡方检验列联表点估计置信区间样本的变异来自于抽样的偏差。均值的标准误差和置信区间假设检验的两类错误t检验两变量关系检验方法综述两独立样本t检验检验方差齐性的F检验相关分析相关系数的计算相关系数的检验卡方检验列联表...原创 2020-05-25 00:51:48 · 202 阅读 · 0 评论 -
04_商业实战第三章学习笔记Part 2:数据清理和整合
商业实战第三章学习笔记Part 2:数据清理和整合Select数据查询语句使用嵌套语句(子查询)完成发现数据问题类型 (数据清洗)处理错误值发现缺失值单变量离群值发现盖帽法处理分箱法Select数据查询语句使用嵌套语句(子查询)完成发现数据问题类型 (数据清洗)处理错误值发现缺失值单变量离群值发现盖帽法处理指的就是离群值归于最小最大范围分箱法...原创 2020-05-25 00:24:22 · 139 阅读 · 0 评论 -
03_商业实战第三章学习笔记Part I:描述性统计分析
商业实战第三章学习笔记:描述性统计分析和数据整合清理连续数据的位置描述连续变量的分布形态-偏态与峰度正态分布其它常见连续分布形式描述统计的总结图表第三章主要介绍描述性统计分析和数据整合清理连续数据的位置描述连续变量的分布形态-偏态与峰度正态分布其它常见连续分布形式描述统计的总结图表...原创 2020-05-24 13:18:18 · 255 阅读 · 0 评论 -
02_商业实战第二章学习笔记:Python语言编程
商业实战第二章学习笔记:Python语言编程Python 日期列表元祖集合列表、元组、集合、字典的互相转换列表生成式第二章主要是介绍了Python的用法。Python 日期列表元祖集合列表、元组、集合、字典的互相转换列表生成式...原创 2020-05-24 12:57:05 · 184 阅读 · 0 评论 -
01_商业实战第一章学习笔记:数据科学基本概念和案例
商业实战第一章学习笔记:数据科学基本概念和案例数据科学的运用场景数据科学家的角色![在这里插入图片描述](https://img-blog.csdnimg.cn/2020052412352381.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L295d3c3MTA=,size_16,color_FFFFFF,t_70)数据科学家的能力数理统计技术机器学原创 2020-05-24 12:43:44 · 284 阅读 · 0 评论