![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 80
Charles_TheGod
知识改变命运,亘古不变的哲理。
展开
-
机器学习--正则化(Regularization)
过拟合问题:下图是一个回归问题第一个模型是一个线性模型,欠拟合,不能很好地适应我们的训练集;我们看看这些数据,很明显,随着房子面积增大,住房价格的变化趋于稳定或者说越往右越平缓。因此线性回归并没有很好拟合训练数据。没有很好地拟合训练数据,我们称之为欠拟合,或者叫做高偏差第三个模型是一个四次方的模型,过于强调拟合原始数据,而丢失了算法的本质:预测新数据。我们可以看出,若给出一个新的值使之...原创 2018-10-31 18:02:24 · 9145 阅读 · 5 评论 -
机器学习之模型选择与调优
原创 2018-11-23 12:39:49 · 1056 阅读 · 0 评论 -
机器学习之k-近邻算法
原创 2018-11-23 12:34:07 · 492 阅读 · 0 评论 -
机器学习之转换器和估计器
1️⃣、转换器想一下之前做的特征工程的步骤?1 实例化 (实例化的是一个转换器类(Transformer))2 调用fit_transform(对于文档建立分类词频矩阵,不能同时调用)我们把特征工程的接口称之为转换器,其中转换器调用有这么几种形式fit_transformfittransform实例化一个转换器transfer = StandardScaler()...原创 2018-11-23 12:25:01 · 2478 阅读 · 0 评论 -
机器学习之特征工程
skleandatasets.load_*() 加载小数据集datasets.load_iris(), datasets.load_boston()datasets.fetch_*(data_home=None, sunset=‘train’ ) 加载大数据集datasets.fetch_newgroups()from sklearn.datasets import load_irisde...原创 2018-11-22 01:24:28 · 459 阅读 · 0 评论 -
Matplotlib之基本的用法
使用Jupyter来进行Matplotlib的绘制Jupyter notebook使用进入虚拟环境workon ai# 输入命令jupyter notebook1.实现一个简单的Matplotlib图形。import matplotlib as plt%matplotlib inlineplt.figure() # 创建一个画布plt.plot([1,3,4],[5,6...原创 2018-11-12 17:30:47 · 1130 阅读 · 0 评论 -
聚类算法
1. K-Means(K均值)聚类算法步骤: (1) 首先我们选择一些类/组,并随机初始化它们各自的中心点。中心点是与每个数据点向量长度相同的位置。这需要我们提前预知类的数量(即中心点的数量)。 (2) 计算每个数据点到中心点的距离,数据点距离哪个中心点最近就划分到哪一类中。 2. 均值漂移聚类均值漂移聚类是基于滑动窗口的算法,来找到数据点的密集区域。这是一个基于质心的算法,通过将中心点的...转载 2018-11-09 15:55:07 · 337 阅读 · 0 评论 -
朴素贝叶斯公式
本文参考了该博客的实例,但该博客中的朴素贝叶斯公式计算错误,评论中的也不对,所以,重新写一篇。一. 朴素贝叶斯 朴素贝叶斯中的朴素一词的来源就是假设各特征之间相互独立。这一假设使得朴素贝叶斯算法变得简单,但有时会牺牲一定的分类准确率。 首先给出...转载 2018-11-09 15:20:07 · 739 阅读 · 0 评论 -
奇异值分解(SVD)原理
奇异值分解是一个有着很明显的物理意义的一种方法,它可以将一个比较复杂的矩阵用更小更简单的几个子矩阵的相乘来表示,这些小矩阵描述的是矩阵的重要的特性。就像是描述一个人一样,给别人描述说这个人长得浓眉大眼,方脸,络腮胡,而且带个黑框的眼镜,这样寥寥的几个特征,就让别人脑海里面就有一个较为清楚的认识,实际上,人...转载 2018-11-06 16:08:22 · 476 阅读 · 0 评论 -
机器学习之朴素贝叶斯
朴素贝叶斯算法1️⃣、概率定义概率定义为一件事情发生的可能性扔出一个硬币,结果头像朝上的概率P(X):取值在[0,1]2️⃣、女神是否喜欢计算案例#### 1、原创 2018-11-23 12:46:01 · 316 阅读 · 1 评论