机器学习
文章平均质量分 94
)梦想之深邃(
逆水行舟,不进则退
展开
-
机器学习 (K - mean算法)
机器学习 K-Mean算法根据样本间的某种距离或者相似性来定义聚类,即把相似的(或距离近的)样本聚为同一类,而把不相似的(或距离远的)样本归在其他类。其基本思想是:通过迭代寻找k个聚类的一种划分方案,使得用这k个聚类的均值来代表相应各类样本时所得的总体误差最小。参数说明:μc(i)表示第i个聚类的均值(质心),x(i)为样本数据。c(i):确定所属类别,与最近的质心归为一类;算法步骤:1)随机选取K个质心点(作为分类依据)2)迭代下述过程1)对于每一个样例 i,..原创 2020-05-29 20:04:49 · 778 阅读 · 0 评论 -
机器学习(numpy库)
导入numpy库:import numpy as np创建numpy对象:通过numpy.array来实现numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)参数说明 object 数组或者是嵌套的数组 dtype 元素的数据类型(可选) co...原创 2020-04-01 11:19:54 · 335 阅读 · 0 评论 -
机器学习(神经网络)
一、感知机感知机是基本的处理元素。它具有输入(其输入可以来自外部输入,也可以来自其他感知机)。与每个输入xi 相关联的是一个链接权重(突触权重)wi,而输出y在最简单的情况下是这些输入的加权和(也可以是其他类型)...原创 2020-03-15 23:22:41 · 500 阅读 · 0 评论 -
机器学习(贝叶斯决策定理)
概率刻度:为0-1之间的一个实数,表示一次随机事件中事件发生可能性的大小。(概率≥0,非负)可观测变量:在实验过程中可以观察到的变量;(如投一枚硬币出现正面、反面的情况)在通常情况下,我们是不知道一个未知事件的确切概率的,但在大量实验的基础上我们可以用观测变量的概率分布来间接地表达事件总体的概率分布。如:投一枚硬币1为正面0为反面,9次实验结果为{1,1,1,0,1,0,0,1,1...原创 2020-03-14 20:50:02 · 595 阅读 · 0 评论 -
机器学习(杂项)
一、特征缩放在训练模型的过程中,我们所选取的特征可能会出现数据过大(跨度过大)的情况。过大的数据(区间)可能会导致在梯度下降过程中收敛过慢,这时就需要对特征数据进行适当的缩放操作。缩放方法(收敛到【0,1】【-1,1】& 其他)1)将数据值转化为【0,1】之间:2)将数据值转化为【-1,1】之间:3)均值标准化:u为样本数据的均值,s为样本数据的方差...原创 2020-02-27 16:32:18 · 188 阅读 · 0 评论 -
机器学习(KNN算法&分类问题&手写数字识别)
KNN(K-Nearest Neighbor)最邻近规则分类算法思想:计算待分类样本点到K个离其最近已知类别样本点的距离,其类别属于这K个样本中占主导的部分(少数服从多数),故此算法的核心就是计算待测点与K个已知样本点的距离。这里的距离可以是指欧式距离,也可以使用其他的距离衡量,比如余弦距离、相关度、曼哈顿距离等;在这里K的选取为奇数(不会产生歧义)一定会分别出类别。(K的选取...原创 2020-02-26 14:20:22 · 612 阅读 · 0 评论 -
机器学习(感知机)
人工神经网络模拟生物神经系统对真实世界物体所作出的交互反应,下图为生物神经元的结构图;在生物神经网络中每个神经元与其他的神经元连接,树突接收传递过来的信号,细胞核处理电信号并传递到轴突,如果信号超过一定的阀值则产生兴奋,将信号通过轴突末梢传递到其他神经元。定义阀值函数S(a)={1 a>0; 0 a<=0}这里的a为传递过来的信号总和;...原创 2020-02-25 12:44:58 · 325 阅读 · 0 评论 -
机器学习(决策树)
决策树的构成:一个根结点和若干个内部结点以及叶子结点构成,每一个叶子结点对应着一个分类类别,其他结点对应的一次决策(如下图黄色结点为分类的最后结果,绿色结点为决策结点);适用范围:比较适合分析离散的数据(若是连续的数据可将其离散化进行处理),如下图就是一颗决策树;信息熵:某条信息的信息量的大小与它的不确定性有直接关系,为了弄明白一个(不确定)事情,需要有大量的数据熵就是来度量事...原创 2020-02-08 19:25:31 · 346 阅读 · 0 评论 -
机器学习(多元线性回归模型&逻辑回归)
多元线性回归定义:回归分析中,含有两个或者两个以上自变量,称为多元回归,若自变量系数为1,则此回归为多元线性回归。(特殊的:自变量个数为1个,为一元线性回归)多元线性回归模型如下所示:如上图所示,一元线性回归图形为一条直线。而二元线性回归,拟合的为一个平面。多元线性回归拟合出的图像为以超平面;逻辑回归(分类问题的处理)求解步骤:1)确定回归函数 (通常用Sigm...原创 2020-02-06 16:37:05 · 7118 阅读 · 0 评论 -
机器学习(一元线性回归模型)
模型:一元线性回归模型回归分析:建立方程模拟两个或者多个变量之间是如何相互关联,被预测的变量称为因变量(结果),用来进行预测的变量称为自变量(输入参数),当输入参数只有一个(输出1个)时,称为一元回归,反之当输入有多个(输出1个),称为多元回归;一元线性回归模型如下所示:(我们只需确定此方程的两个参数即可)第一个参数为截距,第二个参数为斜率(我们只需根据大量的数据集通过训练求解...原创 2020-01-22 20:50:54 · 5721 阅读 · 0 评论 -
机器学习(二)线性模型
线性模型(一元回归线性模型,多元线性回归模型)由d个属性描述的示例Xi={x1,x2,.....,xd},其中Xi为X中的第i个个示例,xd表示示例Xi在第d个属性的取值;线性模型即通过线性函数来进行预测的函数,即 f(X)=w1x1+w2x2+.....+wdxd +b,写成向量形式 f(X)=w^T X+b;(注L这里的w与b通过数据集合学习求解得出)简单的,对于f(x)=wx...原创 2019-10-17 13:00:43 · 869 阅读 · 0 评论 -
机器学习(一)基本概念
一、基本概念:数据集(data set)是记录数据的集合,每条记录是关于一个或对象的描述,称之为一个示例(instance),反应事件或者对象的某一方面的特性称之为属性(attribute)或者特征(feature),其值称之为属性值(attribute value),由不同属性张成的空间称之为属性空间(attribute space),在属性空间上的每一个点对应一个坐标向量,称之为特...原创 2019-10-18 10:26:05 · 212 阅读 · 0 评论