机器学习
文章平均质量分 79
刘根生
蔡文姬没有文
展开
-
零基础入门NLP之搭建中文分词工具
1 文本分析的基本过程分词就是中学学的断句:举个例子来说明:假设我们输入一句话:北京欢迎你。则有可能的断句为:北,京,欢,迎,你北京,欢,迎,你北京,欢迎,你 等等如果没有语料库的话就是这样的枚举。分词我们可以根据语料库里面的次来分,比如语料库里面有[北京,欢迎,你,欢,迎]则上面列出的就是我们可能的分词结果用程序来是实现就是需要的语料库:https://gi...原创 2020-04-28 20:34:50 · 454 阅读 · 0 评论 -
xgboost、随机森林和逻辑回归的优缺点
转载自https://www.nowcoder.com/ta/review-ml/review?query=&asc=true&order=&page=99Xgboost:优缺点:1)在寻找最佳分割点时,考虑传统的枚举每个特征的所有可能分割点的贪心法效率太低,xgboost实现了一种近似的算法。大致的思想是根据百分位法列举几个可能成为分割点的候选者,然后从候选者...转载 2020-04-20 21:12:35 · 16353 阅读 · 0 评论 -
lstm网络python代码实现
LSTM的宏观讲解推荐这篇博客,以动图的形式展示特别容易理解https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/82922386LSTM的输入、输出、遗忘门的控制推荐这篇博客。本篇的代码也是基于这篇博客的https://zybuluo.com/hanbingtao/note/581764import numpy as...原创 2020-04-02 22:31:23 · 6326 阅读 · 1 评论 -
深度学习入门之感知器(原理+代码)
感知器的原理:感知器的原理相当简单,当线性可分的时候就是中学的时候学过的y=kx+b,只不过中学的时候k和b都是给出的,给我们x让我们去求y,看看y是在这条直线的上方还是下方。而现在没有给我们k和b,给我们了一大堆(x,y),让我们根据这一大堆x和y找出一条直线,这条直线最好能把这一大堆数据划分为两类,并且要求这条直线两边的点最好离这条直线远一点(支持向量机),因为这些点离这条直线远了,一些点被误...原创 2020-03-30 14:17:21 · 918 阅读 · 1 评论 -
1SGD、Momention原理
(1)SGD为随机梯度下降算法,每一次迭代计算数据集的小批次的梯度,然后对参数进行更新。随机梯度下降算法比较简单在这里不展开说,关于随机梯度下降算法公式的推导就是运用链式求导法则一顿求偏导,使得数据预测值和真实值的差最小。(2)参考了物理中动量的概念,考虑到前几次的梯度,但是前几轮的梯度叠加在当前计算中会有一定的衰减。可以使最优解的曲线更加的平滑,其原理使移动平均加权公式为(和c++中的动态规...原创 2020-03-03 14:06:12 · 1194 阅读 · 0 评论 -
关于深度学习的一点理解
参考大神的文章https://www.zybuluo.com/hanbingtao/note/476663感觉逐渐入门了深度学习,在这写点现阶段自己关于对神经网络和反向传播算法的理解。简单的神经网络通常有三层:输入层,隐藏层,输出层。如果不考虑复杂的数学公式推导的话,其实没有多少东西,只要弄清每层的输入输出,每层的连接方式,其实并没有多困难,输入输出比较容易弄清楚,输入层的输出就是隐藏层的输入...原创 2019-11-02 21:14:24 · 1275 阅读 · 4 评论 -
根据工作年限预测工资python代码实现
写在前面:感知器有一个问题,当面对的数据集不是线性可分的时候,『感知器规则』可能无法收敛,这意味着我们永远也无法完成一个感知器的训练。为了解决这个问题,我们使用一个可导的线性函数来替代感知器的阶跃函数,这种感知器就叫做线性单元。线性单元在面对线性不可分的数据集时,会收敛到一个最佳的近似值。此篇文章涉及到的主要知识点是线性单元模型的实现,与感知器对比,只有激活函数的不同。本段代码中的线性函数是f...原创 2019-10-31 19:58:00 · 1627 阅读 · 0 评论 -
感知器python代码
感知器属于机器学习的入门算法了,具体的理论知识不细讲了。只说下里面涉及到的核心知识:权重更新公式:w=wi+▲wi b=b+▲b其中▲wi=n(t-y)x b=n(t-y)n是学习效率,t是label即真实的输出,y是感知器的输出值。我现阶段认为机器学习最重要的是建立模型对模型进行训练。我们建立模型。代码如下:def train(self, input_vecs...原创 2019-10-31 19:22:13 · 624 阅读 · 0 评论 -
安装Tensorflow出现错误提示conda activate tensorflow-cpu Could not find conda environment: tenso
解决办法:输入命令查找自己安装的python版本python --version输入anaconda search -t conda tensorflow查找与自己python版本对应的tensorflow输入pip installtensorflow==1.2.0(选择对应版本进行安装)如果安装不成功要卸载掉以前的版本,系统默认安装的是1.9.0版本pip uninstall...原创 2019-10-21 15:41:25 · 1570 阅读 · 0 评论 -
k均值算法原理详细讲解以及matlab代码实现
有研究生物电信号处理和机器学习的欢迎加我qq429500506共同交流学习进步。最近更新文章的频率太低了,主要原因是不想为了发文章而发文章,想潜心研究,写好文章,顺便想说一句开源万岁,最近一个月虽然一直在研究脑电信号特征提取和分类的算法,虽然待在实验室的时间不短,但是效率很低,归根结底还是因为自己没有明确的计划,紧迫感不足,每研究透一点点就想休息一下犒劳一下自己,再加上出国留学的可能性比较大,...原创 2019-05-20 11:15:10 · 1762 阅读 · 0 评论 -
PCA降维算法原理及代码实现(python和matlab)
欢迎转载:转载请注明出处,谢谢。常见的数据降维算法有:奇异值分解(SVD)、主成分分析(PCA)、因子分析(FA)、独立成分分析(ICA)。PCA降维的基本思想:通过计算数据矩阵的协方差矩阵,然后得到协方差矩阵的特征值、特征向量、选择特征值最大(即方差最大)的K个特征所对应的特征向量组成的矩阵,这样可以将数据矩阵转换到新的空间当中,实现数据特征的降维。PCA降维有两种思路:一种是特征值...原创 2019-04-19 19:46:44 · 11581 阅读 · 3 评论 -
FASTICA独立成分分析matlab代码实现
%求数据的独立成分%输入参数:Z建模数据(矩阵 n*m维,m为样本个数,n为变量个数)% perica提取信息含量(一个百分数)%输出参数:W分解矩阵(矩阵 n*q维,n为变量个数,q为独立成分个数)% SL独立成分(矩阵 m*q维,m为样本个数,q为独立成分个数)% XS为X的估计值(矩阵 m*n维,m为样本个数,n为变量个数)% ...原创 2019-04-18 14:39:59 · 8479 阅读 · 4 评论 -
Adaboost算法原理以及matlab代码实现(超详细)
一、AdaBoost简介 Boosting, 也称为增强学习或提升法,是一种重要的集成学习技术, 能够将预测精度仅比随机猜度略高的弱学习器增强为预测精度高的强学习器,这在直接构造强学习器非常困难的情况下,为学习算法的设计提供了一种有效的新思路和新方法。其中最为成功应用的是,Yoav Freund和Robert Schapire在1995年提出的AdaBoost算法。 Ad...转载 2019-03-07 19:53:07 · 14394 阅读 · 3 评论 -
脑电信号特征提取常用算法(共空间模式CSP、小波变换DWT、功率谱密度PSD、AR模型)
1 共空间模式CSP原理:共空间模式(CSP)是一种对两分类任务下的空域滤波特征提取算法,能够从多通道的脑机接口数据里面提取出每一类的空间分布成分。公共空间模式算法的基本原理是利用矩阵的对角化,找到一组最优空间滤波器进行投影,使得两类信号的方差值差异最大化,从而得到具有较高区分度的特征向量。具体原理及代码见https://blog.csdn.net/MissXy_/article/deta...原创 2019-03-05 20:46:49 · 30672 阅读 · 2 评论