机器学习
文章平均质量分 71
AI_王布斯
这个作者很懒,什么都没留下…
展开
-
机器学习-马尔可夫模型与隐马尔可夫模型
马尔可夫模型马尔可夫过程是满足无后效性的随机过程。假设一个随机过程中,tnt_ntn时刻的状态XnX_nXn的条件分布,仅仅与其前一个状态xn−1x_{n-1}xn−1有关,即P(xn∣x1,x2...xn−1)=P(xn∣xn−1)P(x_n|x_1,x_2...x_{n-1}) = P(x_n|x_{n-1})P(xn∣x1,x2...xn−1)=P(xn∣xn−1),则称之为马可夫过程,时间和状态的取值都是离散的马尔可夫过程称之为马可夫链。隐马尔可夫模型隐马尔可夫模型是对含有原创 2021-09-16 09:33:53 · 1339 阅读 · 0 评论 -
机器学习-特征归一化
要消除数据特征之间的量钢的影响,要对特征进行归一化处理,使得不同指标之间具有可比性。对数值类型的特征做归一化可以将所有的特征都统一到一个大致相同的数值区间内。最常用的方法主要有以下两种:1,线性函数归一化,,(Min-Max Scaling)。它对原始数据进行线性变换使得结果映射在[0,1]的范围内,实现原始数据的等比缩放。归一化的公式如下所示:Xnorm=X−Xmin/Xmax−XminX_ {norm}=X - X_{min} /X_{max}-X_{min}Xnorm=X−Xmin/Xmax原创 2021-09-10 18:44:19 · 5298 阅读 · 0 评论 -
机器学习-模型评估与优化
一、模型评估1.性能度量错误率与精度错误率和精度是分类问题中常用的性能度量指标,既适用于二分类任务,也适用于多分类任务.错误率(error rate):指分类错误的样本占样本总数的比例,即 ( 分类错误的数量 / 样本总数数量)精度(accuracy):指分类正确的样本占样本总数的比例,即 (分类正确的数量 / 样本总数数量)精度=1−错误率精度 = 1 - 错误率精度=1−错误率查准率、召回率与F1得分错误率和精度虽然常用,但并不能满足所有的任务需求。例如,在一次疾病检测中,我们更关注原创 2021-09-04 18:26:59 · 1705 阅读 · 0 评论 -
机器学习-朴素贝叶斯
朴素贝叶斯是一组功能强大且易于训练的分类器,它使用贝叶斯定理来确定给定一组条件的结果的概率,“朴素”的含义是指所给定的条件都能独立存在和发生. 朴素贝叶斯是多用途分类器,能在很多不同的情景下找到它的应用,例如垃圾邮件过滤、自然语言处理等.贝叶斯定理贝叶斯定理由英国数学家托马斯.贝叶斯 ( Thomas Bayes)提出,用来描述两个条件概率之间的关系,定理描述为:P(A∣B)=P(A)P(B∣A)P(B) P(A|B) = \frac{P(A)P(B|A)}{P(B)}P(A∣B)=P(B)P(A)P原创 2021-09-02 19:24:42 · 207 阅读 · 0 评论 -
机器学习-集成学习
集成学习的概念集成学习 (ensemble learning) 通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统(multi-classifier system) 、基于委员会的学习(committee-based learning) 等.下图显示出集成学习的一般结构:先产生一组个体学习器,再用某种策略将他们结合起来,个体学习器由一个现有的学习算法从训练数据产生,例如 C4.5 决策树算法、 BP 神经网络算法等,此时集成中只包含同种类型的个体学习器,例如"决策树集成"中全是决策树"神经原创 2021-09-01 12:13:35 · 425 阅读 · 0 评论 -
机器学习-感知机
什么是感知机?感知机(Perceptron),又称神经元(Neuron,对生物神经元进行了模仿)是神 经网络(深度学习)的起源算法,1958年由康奈尔大学心理学教授弗兰克·罗森布拉 特(Frank Rosenblatt)提出,它可以接收多个输入信号,产生一个输出信号。其中,x1和x2称为输入,w1和w2为权重,θ为阈值,y为输出。神经元更为通用的表达式:感知机的功能作为分类器/回归器,实现自我学习实现逻辑运算,包括逻辑和(AND)、逻辑或(OR)组成神经网络神经元作为分类器/回归器原创 2021-08-29 11:30:36 · 289 阅读 · 0 评论 -
机器学习-逻辑回归
什么是逻辑回归?逻辑回归(Logistic Regression) 虽然被称为回归,但其实际上是分类模型,常用于二分类。逻辑回归因其简单、可并行化、可解释强而受到广泛应用。二分类(也称为逻辑分类)是常见的分类方法,是将一批样本或数据划分到两个类别,例如一次考试,根据成绩可以分为及格、不及格两个类别,这就是逻辑分类,将连续值映射到两个类别中。逻辑函数逻辑回归是一种广义的线性回归,其原理是利用线性模型根据输入计算输出(线性模型输出值为连续),并在逻辑函数作用下,将连续值转换为两个离散值(0或1),其表达式原创 2021-08-28 17:36:53 · 103 阅读 · 0 评论 -
机器学习-决策树
决策树1.什么是决策树?决策树是一种常见的机器学习方法,其核心思想是相同(或相似)的输入产生相同(或相似)的输出,通过树状结构来进行决策,其目的是通过对样本不同属性的判断决策,将具有相同属性的样本划分到一个叶子节点下,从而实现分类或回归. 以下西瓜分类的决策树模型图。在上述示例模型中,通过对西瓜一系列特征(色泽、根蒂、敲声等)的判断,最终我们得出结论:这是否为一个好瓜. 决策过程中提出的每个判定问题都是对某个属性的“测试”,例如“色泽=?”,“根蒂=?”. 每个测试的结果可能得到最终结论,也可能需要原创 2021-08-21 21:28:04 · 500 阅读 · 0 评论 -
机器学习-梯度下降
梯度下降一、梯度下降的定义梯度(gradient)是一个向量(矢量,有方向),表示某一函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向(此梯度的方向)变化最快,变化率最大.损失函数沿梯度相反方向收敛最快(即能最快找到极值点).当梯度向量为零(或接近于零),说明到达一个极值点,这也是梯度下降算法迭代计算的终止条件.这种按照负梯度不停地调整函数权值的过程就叫作“梯度下降法”.通过这样的方法,改变权重让损失函数的值下降得更快,进而将值收敛到损失函数的某个极小值.通过损失函数,我们将“寻原创 2021-08-20 19:51:05 · 943 阅读 · 0 评论 -
机器学习-误差的来源
误差的来源误差的两个来源-偏差和方差随着模型复杂度的提升会带来带来一些误差,而误差(Error)的主要来源了有两个方向,偏差(Bias)和方差(Variance)。Error反映的是整个模型的准确度,Bias反映的是模型在样本的输出与真实值之间的误差,即模型本身的精准度,Variance反映的是模型每一次的输出结果与模型输出期望之间的误差,即模型的稳定性。上图可以很直观的反映,误差(error)与偏差(Bias)和方差(Variance)之间的关系。只有当variance和bias两个都很小的时候原创 2021-08-19 17:45:59 · 583 阅读 · 0 评论 -
线性回归_代码示例
线性回归-代码示例导入所需要的包。import numpy as np #数据转换的包import matplotlib.pyplot as plt #绘图用的包from pylab import mpl #处理中文的包实现中文显示。# matplotlib没有中文字体,动态解决plt.rcParams['font.sans-serif'] = ['Simhei'] # 显示中文mpl.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号原创 2021-08-18 12:45:04 · 75 阅读 · 0 评论