机器学习
k+
这个作者很懒,什么都没留下…
展开
-
从人脸识别到情感分析,这有50个机器学习实用API
http://baijiahao.baidu.com/s?id=1602771737270790677&wfr=spider&for=pc转载 2019-03-19 15:08:54 · 164 阅读 · 0 评论 -
线性回归
残差平方和 预测值 真实值 差异原创 2019-05-08 11:23:36 · 96 阅读 · 0 评论 -
梯度下降
小 学习率 0.01大 迭代次数 32 64 128原创 2019-05-08 13:07:35 · 72 阅读 · 0 评论 -
逻辑回归
似然函数 最大值X i ji 第i个数据j 第j维特征原创 2019-05-08 16:02:28 · 98 阅读 · 0 评论 -
支持向量机
https://blog.csdn.net/qq_35992440/article/details/80987664http://www.360doc.com/content/18/0805/10/11935121_775817898.shtml转载 2019-05-14 13:40:03 · 59 阅读 · 0 评论 -
主成分分析 PCA 线性判别分类LDA
降维就是一种对高维度特征数据预处理方法。降维是将高维度的数据保留下最重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法。PCA的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。PCA的工作就...原创 2019-05-15 09:29:27 · 2872 阅读 · 0 评论 -
SVM
https://blog.csdn.net/v_july_v/article/details/7624837https://blog.csdn.net/liugan528/article/details/79448379https://blog.csdn.net/sinat_35512245/article/details/549842511、LR是参数模型,SVM是非参数模型。2、从目标...原创 2019-05-15 09:45:28 · 105 阅读 · 0 评论 -
KNN DBSCAN k-MEANS
DBSCAN基于密度的聚类算法.(他聚类方法大都是基于对象之间的距离进行聚类,聚类结果是球状的簇)。基于密度的聚类是寻找被低密度区域分离的高密度区域定义:基于密度的带有噪声的空间聚类,可用于异常值监测,通俗来说就是基于密度的聚类算法!簇的定义:簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并且可以在噪声的空间数据库中发现任意形状的聚类原理:该算法利用基于密度的聚类的思...原创 2019-05-15 09:59:04 · 1384 阅读 · 0 评论 -
神经网络笔记
神经网络总流程1.计算分值(分值越高就表明分类结论)2.计算损失函数(一般损失函数+正则化惩罚)3.正则化惩罚(可以看作是对损失函数的惩罚项,一般有两种方法,L1和L2,W的平方w2,为了惩罚那些虽然分值一样但是,关注的点和实际点有很大出路,例如1,0,0,0和0.25,0.25,0.25,0.25,惩罚越小就越认可,目的也是通过loss值,使得权重更均衡。其实1,0,0,0也是一种过拟合的...原创 2019-05-15 20:37:00 · 2070 阅读 · 0 评论 -
决策树
https://blog.csdn.net/jiaoyangwm/article/details/79525237转载 2019-05-11 11:16:36 · 805 阅读 · 0 评论 -
基于深度学习的自然语言处理
CBOW 表示可以通过求单词表示向量和或者通过将一个单词词袋向量乘以一个每一行对应于一个稠密单词表示的矩阵(这样的矩阵也叫作嵌入矩阵( embedd i ngmatricy ))来得到。网络中每行神经元的值可以看作是一个向量全连接层可以看作是从四维到六维的线性变换。全连接层实现了一个向量与矩阵的乘法, h=xW由线性变换产生的向量称为层。最外层的线性变换产生输出层,其他线性变换产生隐...原创 2019-04-09 20:00:35 · 1774 阅读 · 0 评论 -
python 自然语言处理实战
Jibea词性标注北大词性标注集宾州词性标注集关键词提取算法 TF/IDFTextBank算法LSA(SVD奇异值分解)LDA(贝叶斯)原创 2019-04-15 18:46:28 · 2196 阅读 · 0 评论 -
机器学习 数学基础
连续 可导 可微函数连续不一定的函数可微(例子:y=|x|)函数连续不一定函数可导 (例子:y=|x|当x=0时 y不可导) `函数可导必然连续;不连续必然不可导函数可导不一定连续满足下列条件之一的函数必定可积:(1) 连续(2) 不连续,但间断点是第一类的而且只有有限多个。2. 反函数标准模拟法。模拟连续型随机变量,产生服从连续型分布律随机数的数学方法3. 二项分...原创 2019-03-12 19:39:05 · 170 阅读 · 0 评论 -
机器学习实战numpy
from numpy import array# 数组mm = array((1,1,1))pp = array((1,2,3))print(pp+mm)# 每个元素*2pp*2# 每个元素平方pp**2# 访问pp[1]# 数组jj = array([[1,2,3],[1,1,1,]])print(jj[0])print(jj[0][1])# 矩阵方式...翻译 2019-03-12 21:59:58 · 142 阅读 · 0 评论 -
协方差矩阵理解
协方差理解https://blog.csdn.net/ngmanhei/article/details/47109057距离度量方式(马氏距离,欧式距离,曼哈顿距离)马氏距离欧式距离曼哈顿距离余弦距离(余弦相似性)...原创 2019-03-26 19:12:06 · 174 阅读 · 0 评论 -
TensFlow
自编码器 无监督学习,提取最有用,最频繁高阶特征原创 2019-04-04 21:51:38 · 564 阅读 · 0 评论 -
数据处理 sklearn
contour和contourf都是画三维等高线图的,不同点在于contourf会对等高线间的区域进行填充import numpy as npimport matplotlib.pyplot as pltfrom matplotlib.colors import ListedColormapx=np.array([1,2])y=np.array([1,2])z=np.array([[...原创 2019-04-08 21:55:54 · 154 阅读 · 0 评论 -
深度学习
https://blog.csdn.net/ping550/article/details/56480155https://github.com/aymericdamien/TensorFlow-Exampleshttp://blog.csdn.net/koala_tree知乎:https://www.zhihu.com/people/dashuxianshengGitHub:https:...转载 2019-03-28 09:27:54 · 61 阅读 · 0 评论 -
机器学习实战总结
K-近邻算法优点:精度高 对异常值不敏感 无数据输入假定缺点:复杂度高适用范围:数值型 标称型收集数据准备数据 距离计算所需要的数据。最好结构化分析数据训练算法 不适合测试算法 计算错误率使用算法2. 决策树优点:计算复杂度不高 输出结果易于理解 可以处理不相关特征数据缺点:过度匹配收集数据准备数据 只适用于标称型,数值型离散化分析数据训练算法 构造树的数...原创 2019-04-07 14:01:13 · 165 阅读 · 0 评论 -
机器学习常见
泛化能力机器学习模型在训练数据集上表现出的误差叫做训练误差在任意一个测试数据样本上表现出的误差的期望值叫做泛化误差机器学习既需要降低训练误差,又需要降低泛化误差。泛化是机器学习本身的核心。简单说,泛化就是在训练数据集上训练好的模型,在测试数据集上表现如何。泛化误差就是所学习到的模型的风险函数或期望损失正则化是我们用来防止过拟合的技术。由于我们没有任何关于测试扰动的先验信息,所以通常我们...原创 2019-04-07 16:38:05 · 181 阅读 · 0 评论 -
attention RNN LSTM Gru gate dropout 隐马尔可夫链
attention注意力机制即 Attention mechanism在序列学习任务上具有巨大的提升作用,在编解码器框架内,通过在编码段加入Attention模型,对源数据序列进行数据加权变换,或者在解码端引入Attention 模型,对目标数据进行加权变化,可以有效提高序列对序列的自然方式下的系统表现。原文:https://blog.csdn.net/guohao_zhang/article...原创 2019-04-07 22:14:37 · 1316 阅读 · 0 评论 -
情感分析 综述
情感分析或观点挖掘是对人们对产品、服务、组织、个人、问题、事件、话题及其属性的观点、情感、情绪、评价和态度的计算研究。该领域的开始和快速发展与社交媒体的发展相一致,如评论、论坛、博客、微博、推特和社交网络,因为这是人类历史上第一次拥有如此海量的以数字形式记录的观点数据。早在 2000 年,情感分析就成为 NLP 中最活跃的研究领域之一。它在数据挖掘、Web 挖掘、文本挖掘和信息检索方面得到了广泛的...原创 2019-05-13 16:14:55 · 7223 阅读 · 1 评论