Python机器学习
ml
CC_且听风吟
行百里者半九十
展开
-
初探监督学习:使用OpenCV实现 k-NN 机器学习算法(分类模型)
其实NumPy部分还是有一定要求的,已经大致看完了。本来打算先把NumPy数据分析的坑填完的。。结果最近几天一直在看机器学习,过两天争取发几篇文章把NumPy那里补完!问题背景(太长了。简要陈述):有两个队伍(蓝色正方形和红色三角形),他们都只喜欢和相同队伍的人做邻居,根据随机的数据集(一堆蓝色正方形和红色三角形的位置关系),预测在某一点如果有一个人住,这个人是蓝队还是红队--> 就...原创 2019-04-02 23:54:13 · 557 阅读 · 0 评论 -
初探监督学习2:使用线性回归预测波士顿房价(回归模型)
继续学习机器学习:监督模型中的回归模型书上使用的是scikit-learn中的fit函数来实现线性回归模型目标:根据训练数据来训练一个回归模型,从而预测测试数据,并且对预测对精准度进行分析step1:载入数据集感谢万能的sklearn,在datasets中有波士顿房价的数据import numpy as npfrom sklearn import datasetsfrom...原创 2019-04-03 15:29:51 · 3382 阅读 · 0 评论 -
数据预处理
数据预处理分为三种形式:数据格式化:数据可能并不是适合我们处理的那种格式 数据清理:数据中可能存在无效的或者丢失的条目,这些数据需要被清理或者移除 数据采样:数据可能对于特定的目的过于庞大,需要把数据使用巧妙的方式进行采样特征工程:缩放:某些机器学习算法常常要求数据在一个特定的范围内,比如需要拥有零均值和单位方差。缩放是将所有的特征(可能物理单位不同)变成特定范围内的值的一个过程。...原创 2019-04-18 10:13:54 · 322 阅读 · 0 评论 -
类别变量表示、文本特征表示、图像表示
一、类别变量表示首先准备数据集data = [ {'name':'dzzhyk111', 'born': 1912, 'died': 1954}, {'name':'dzzhyk222', 'born': 1916, 'died': 1959}, {'name':'dzzhyk333', 'born': 1922, 'died': 1964}, {'name':'dzzhyk...原创 2019-04-27 12:49:28 · 896 阅读 · 0 评论 -
降维技术简要
opencv中主要有三种降维技术:主成分分析 独立成分分析 非负矩阵分解开始之前首先进行一些小准备:import numpy as npimport cv2import matplotlib.pyplot as pltplt.style.use('ggplot')# 导入数据mean = [20, 20]cov = [[5, 0], [25, 25]]x, y =...原创 2019-04-25 00:51:06 · 511 阅读 · 0 评论 -
使用opencv实现简单的单个感知器
part 1前面的神经元部分略。。简单的考虑只有两个输入参数的神经元:这两个参数都有不同的权重系数x0, x1则有净输入:为了训练一个神经网络,一般需要:训练数据 代价函数(损失函数):代价函数提供了评价当前权重系数效果的方法 学习规则:学习规则指明了如何在一次迭代之后来更新权重系数,学习规则常常依赖于在训练数据集上观测到的误差(使用代价函数来计算)part 2...原创 2019-04-25 01:19:40 · 332 阅读 · 0 评论 -
多层感知器MLP和梯度下降法
为了可以更好地研究非线性数据的决策边界,可以把多个感知器合并成为一个更大的网络,即多层感知器MLP一、了解MLPMLP至少由三层构成:第一层:数据集的每个输入特征都有一个节点(神经元) 中间隐藏层 最后一层:每个类标签的节点具体的结构可以如图所示:(来源:百度图片)MLP拥有一个显著的特性:如果网络足够大,就可以表示任意的数学函数,也称为万能逼近特性例如:只有一个...原创 2019-04-25 14:15:02 · 2498 阅读 · 0 评论 -
反向传播和多层感知器OpenCV实现
一、反向传播在梯度下降中有一个问题的关键:如何求得当前代价函数的梯度?简要地介绍反向传播,它是用于估计神经网络中的代价函数梯度的算法,本质上就是函数求导的链式法则,偏导数。首先回想代价函数,它的梯度取决于每个数据样本的真实输出和当前输出之前的差值。如果选择以均方误差作为代价函数,则对应的方程应为: ...原创 2019-04-25 17:18:48 · 527 阅读 · 0 评论