![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习一百天 笔记
文章平均质量分 62
lvweishuai001
这个作者很懒,什么都没留下…
展开
-
普通最小二乘法
print(__doc__)# 输出文件开头注释的内容import matplotlib.pyplot as pltimport numpy as npfrom sklearn import datasets,linear_modelfrom sklearn.metrics import mean_squared_error,r2_score#mean_squared_error预测...原创 2018-12-05 10:02:34 · 281 阅读 · 0 评论 -
岭回归——Ridge
Ridge回归通过对系数的大小施加惩罚来解决普通最小二乘法的一些问题,岭系数最小化的是带惩罚项的残差平方和其中惩罚项的系数越大,收缩量越大,这样的系数对共线性的鲁棒性也更强与其他的线性模型一样,Ridge用fit方法将模型系数存储在conf_成员中from sklearn import linear_modelreg = linear_model.Ridge(alpha=.5)reg....原创 2018-12-05 20:54:58 · 534 阅读 · 0 评论 -
决策树基本流程及其实现
周志华《机器学习》笔记 仅供学习使用决策树也称作判定树,是一类常见的的机器学习方法。周志华老师在其书《机器学习》中,以二分类任务为例给我们讲解了决策树的基本流程。我们希望从给定的训练集学的一个模型,此模型可以对新的示例进行分类,这个把样本分类的任务,可看作对“当前样本属于正常吗”这个问题的“决策”或“判定”过程。决策树是基于树结构来进行决策的,这也是人类在面临决策问题时一种很自然的处理机制。...原创 2018-12-07 15:05:51 · 18703 阅读 · 1 评论 -
机器学习一百天 数据预处理
机器学习一百天中文版地址https://github.com/MLEveryday/100-Days-Of-ML-Code机器学习一百天英文版地址https://github.com/Avik-Jain/100-Days-Of-ML-Code本章是第一天内容的笔记,作记录学习之用第一天的内容——数据预处理第一步:导入需要的库 NumPy和PandasNumPy:包含数学计算函数Pa...原创 2019-04-04 11:49:37 · 302 阅读 · 0 评论 -
机器学习100天 第二天 简单线性回归模型
简单线性回归使用单一特征值来预测响应值这种方法是基于自变量X来预测因变量值Y的方法,假设这两个变量是线性相关。在这个任务重使用最佳拟合曲线来最小化预测误差——回归线的误差将是最小的。实验步骤第一步是数据预处理导入相关库,数据集,检查缺失的数据,划分数据,特征缩放将使用简单线性模型的相关库进行#数据预处理import pandas as pd import numpy as np...原创 2019-04-04 20:22:58 · 286 阅读 · 0 评论 -
机器学习一百天 第三天 多元线性回归
多元线性回归是尝试通过用一个线性方程来适配观测数据,这个线性方程是两个以上的特征和相应之间构建的一个关系。多元线性回归的实现步骤和简单的线性回归相似,只是在评价部分有所不同。前提自变量和因变量的关系是线性误差项的方差必须等同多元回归假定残差符合正态分布缺少多重共线性虚拟变量在多元回归模型中,当遇到数据集时非数据类型时,使用分数数据是一个非常有效的方法。例如可使用1或0这样的值来...原创 2019-04-05 20:51:34 · 530 阅读 · 0 评论 -
机器学习一百天 第四天笔记 逻辑回归
逻辑回归逻辑回归被用来处理不同的分类问题,这里的目的是预测当前被观察对象属于哪个组,他会提供一个离散的二进制输出结果如何工作逻辑回归使用基础逻辑函数通过估算概率来测量因变量(我们想要预测的标签)和一个或者多个自变量之间的关系Sigmoid 函数Sigmoid 函数是一个s形曲线,可以实现任意真实值映射为值域范围为0-1的值,但从来不局限于这些限制图片来自于唐戈S函数 - 维基百科,...原创 2019-04-07 22:28:27 · 735 阅读 · 0 评论 -
机器学习一百天 K近邻算法
这里介绍的略简单了一些,稍后会补上K-NNk近邻算法是一种简单但也最常用的分类算法,他也可以应用于回归计算。K-NN是无参数学习,它是基于实例并在一个有监督的学习环境中使用。K–算法的工作原理k-NN 用于分类是,输出是一个类别,这种方法有三个关键因素:一组标记的对象,例如:一组已存储的记录、对象之间的距离以及k的值-最近邻的数量做出预测若要对未标记的对象进行分类,则会计算出该对象标记...原创 2019-04-08 20:45:44 · 147 阅读 · 0 评论 -
机器学习一百天 支持向量机
支持向量机(SVM)支持向量机是一个有监督的机器学习算法,特可用于分类和回归分析,最主要的是用在分类问题中。在这个算法中,根据特征值构建一个n维空间(其中n是特征数量),把每个数据点投影到此空间内如何分类通过查找一个超平面,把数据分成两类,也就是使用算法输出一个超平面,用于数据分类最佳超平面对SVM来说,它指的是距离两类数据最远的一个超平面H1 不能把类别分开。H2 可以,但只有很小...原创 2019-04-09 17:31:25 · 173 阅读 · 1 评论