自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (1)
  • 收藏
  • 关注

原创 数据科学导引欧高炎重点知识三

数据科学导引重点知识1说明9.特征选择9.1一般过程子集产生子集评估子集验证1说明从9开始编号的原因是与书本一致。篇一数据预处理篇二回归模型本篇特征选择与降维可以说使回归模型中需要用到并且熟知的知识,所以不按书本原顺序进行复习,直接先跳到这。9.特征选择9.1一般过程子集产生根据某种策略产生候选的特征子集。前向搜索迭代地进行特征地添加后向搜索迭代地进行特征地删除双向搜索迭代地增加选定地相关特征,同时减少无关特征或者荣誉特征。子集评估由图,子集产生与子集评估

2020-08-23 15:03:22 839

原创 数据科学导引欧高炎重点知识二

数据科学导引重点知识1.说明3.回归模型3.1线性回归运用线性回归的假设一元线性回归多元线性回归过拟合与欠拟合3.2线性回归正则化岭回归LASSO岭与LA的对比弹性网络正则化与Group LASSO3.3非线性回归样条回归1.说明从3开始编号的原因是与书本一致。上一篇数据预处理3.回归模型3.1线性回归运用线性回归的假设输入特征非随机且互不相关随机误差具有零均值、同方差的特点,且彼此不想关输入特征与随机误差不相关随机误差服从正太分布假设好像有点多哈,但是条条必要。一元线性回归一

2020-08-22 21:21:28 767

原创 数据科学导引欧高炎重点知识一

数据科学导引重点知识1.说明2.数据预处理2.1特征编码数字编码One-Hot编码哑变量编码2.2缺失值处理原因删除法均值填补随机填补1.贝叶斯方法2.近似贝叶斯基于模型的填补哑变量方法EM方法2.3数据标准化原因Z-score标准化Min-Max标准化小数定标标准化Logistic标准化2.4不同标准化方法的对比2.5特征离散化等距离散化等频离散化聚类离散化信息增益离散化其它2.6离群值检测拉依达准则(3σ\sigmaσ准则)K近邻局部离群因子算法(LOF)1.说明从2开始编号的原因是与书本一致。第

2020-08-21 17:23:36 1936 3

原创 基于python代码的数据科学导引学习笔记(一)

目录1.说明2.数据预处理2.1.数据初步诊断与探索(1)(2)1.说明该学习笔记仅供个人学习使用,不代表任何官方指导或意见。如侵权,请练习删除。有需要其他资料或有其他问题可私信或者加qq2356081476,这不是我的义务但也欢迎各位朋友与我讨论相关问题,共同进步。错字,语法,排版等问题请见谅。2.数据预处理2.1.数据初步诊断与探索(1)用pandas库读取csv文件c...

2020-04-01 21:54:37 3066 1

原创 matlab中用polyfit、regress、nlinfit等进行详细的回归分析

目录1.说明回归的介绍前面两篇所发现的一些问题回归和拟合是什么关系?回归到底是做预测还是用来去脏数据?最小二乘法函数polyfit1.说明该学习笔记仅供个人学习使用,不代表任何官方指导或意见。该学习笔记为个人原创,转载请征得博主同意,或声明原文链接。继我上一次写的学习笔记数据探索、数据清洗学习笔记与,回归的部分有需要其他资料或有其他问题可私信或者加qq2356081476,这不是我的义...

2020-02-13 23:07:32 8765 3

原创 用matlab代码进行数据探索、数据清洗学习笔记

目录1.说明2.作文目的3.数据质量分析3个判别方法3-1.异常值判别3-1-1.箱型图法3-1-2.3σ准(原)则1.说明该学习笔记仅供个人学习使用,不代表任何官方指导或意见。该学习笔记为个人原创,转载请征得博主同意,或声明原文链接。有需要其他资料或有其他问题可私信或者加qq2356081476,这不是我的义务但也欢迎各位朋友与我讨论相关问题,共同进步。错字,语法,排版等问题请见谅。...

2020-02-09 18:08:50 16759 4

原创 数据探索、数据清洗学习笔记

数据探索、清洗学习笔记说明作文目的数据探索定义意义方法数据质量分析定义意义判别方法改善方法数据特征分析小结注释部分说明1.学习笔记仅供个人学习使用,不代表任何官方指导或意见。2.学习笔记个人原创,转载请征得博主同意,或声明原文链接。3.有需要其他资料或有其他问题可私信或者加qq2356081476,这不是我的义务但也欢迎各位朋友与我讨论相关问题,共同进步。4.这一条是加上来的,建议先看目...

2020-01-20 22:37:05 2780 1

逻辑回归.ipynb

数据科学导引中,分类问题的第一个简单问题——二分类问题的解法。 逻辑回归。名字虽然是回归,但是不能解决回归问题。这是由Logistic函数的特征所决定的。与logistic标准化有如出一辙的思路。

2020-04-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除