![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
小松萘
厉害的人可真多啊
展开
-
香农熵及决策树建立方法
目录数据编码编码压缩信息熵编码与概率信息与压缩例决策树基本思想ID3算法:信息增益C4.5算法:信息增益率推荐阅读:通信的数学理论数据编码编码在网络中进行信息传递,所有信息都是01010的二进制编码格式,例如这样一封信,信中只有狗,猫,鱼,鸟四个词信的所有内容就是这4个词的组合。第一封信写着"狗猫鱼鸟",第二封信写"鱼猫鸟狗"。信件需要二进制编码,在互联网传递。两个二进制位就可以表示四个词汇。狗 00猫 01鱼 10鸟 11所以,第一封信"狗猫鱼鸟"的编码是00011011,第二原创 2020-12-10 16:53:23 · 565 阅读 · 1 评论 -
Python - 常用预处理方法
import numpy as npfrom sklearn.linear_model import LinearRegressionimport pandas as pdimport pywtimport matplotlib.pyplot as pltdef snv(data_x): #标准正态变换 m = data_x.shape[0] n = data_x.shape[1] data_std = np.std(data_x, axis=1) data_a原创 2020-11-01 17:43:21 · 603 阅读 · 0 评论 -
近红外光谱预处理方法及模型建立
光谱预处理方法基线校正一阶导数用于扣除斜线和曲线背景,基本公式如下xi为第i个样品的光谱,g为窗口宽度二阶导数提高光谱分辨率,基本公式如下平滑处理由光谱仪得到的光谱信号中既含有有用信息,同时也叠加着随机误差,即噪声。信号平滑是消除噪声最常用的一种方法,其基本假设是光谱含有的噪声为零均值随机白噪声,若多次测量取平均值可降低噪声提高信噪比。常用的信号平滑方法有移动平均平滑法和Savitzky-Golay卷积平滑法。主要系数为窗口宽度g,设定过大容易失真,设定过小效果不明显移动平滑对窗口原创 2020-11-01 17:43:03 · 5160 阅读 · 0 评论 -
统计学习 - 贝叶斯估计及应用
我现在觉得贝叶斯是哲学+数学贝叶斯估计 用来 决策:贝叶斯决策贝叶斯估计 用来 分类:贝叶斯分类器…目录基础概念与原理统计推断频率学派与贝叶斯派贝叶斯公式从最大似然估计(MLE)到最大后验概率估计(MAP)概率与似然基础概念与原理统计推断统计推断,是指统计学中研究如何根据样本数据去推断总体数量特征的方法。统计推断可能使用如下三种信息:一 总体信息,即总体分布或所属分布族的信息。譬如“总体视察指数分布”或“总体是正态分布”。二 样本信息,即从总体抽取的样本的信息。三 先验信息,即在原创 2020-10-18 18:21:15 · 4040 阅读 · 2 评论 -
KD 树 K个查找 python实现
import heapqimport numpy as npfrom sklearn.preprocessing import StandardScalerclass Node(): # KD 树节点 def __init__(self): self.father = None self.left = None self.right = None self.feature = None self.spli原创 2020-10-08 17:22:19 · 173 阅读 · 0 评论 -
近红外光谱预测苹果糖度
近红外光谱检测近红外光谱区是指波长在780 ~ 2526nm范围内的电磁波,是分子振动光谱倍频和合频吸收谱,主要是由于分子振动的非谐振性使分子振动从基态向高能级跃迁时产生的。波长范围可分为近红外短波780 ~ 1100nm、中波900 ~ 1700nm、长波1100 ~ 2500nm和全波780 ~ 2500nm等四种。近红外光谱检测方式可分为漫反射式、透射式和漫透射式三种。本次需要建立的是苹果糖度和近红外光谱的模型,适用于长波漫反射。光谱和糖度的预处理本次实验中,光谱预处理方法并不能显著提升模原创 2020-07-26 11:51:42 · 7509 阅读 · 3 评论 -
从感知机开始的神经网络学习(感知机-->神经网络 -->BP神经网络 --> 卷积神经网络)
目录感知机目的原理两种形式原始对偶感知机目的将线性可分的数据集分为两类。设数据集标签值yi=+−1y_{i}=+-1yi=+−1 ,最终求出一个超平面S:wx+b=0S:wx+b=0S:wx+b=0 满足yi(wxi+b)>0y_{i}(wx_{i}+b)>0yi(wxi+b)>0原理定义损失函数:误分类点到超平面的距离和使用距离和的目的:使损失函数为(w,b)(w,b)(w,b) 的连续可导函数—> 便于使用梯度下降法损失函数进化:1∥w∥∑i误分类∣w原创 2020-08-05 01:27:10 · 541 阅读 · 0 评论