机器学习
文章平均质量分 93
sakura小樱
这个作者很懒,什么都没留下…
展开
-
主流机器学习代码[xgb, lgb, Keras, LR]
文章目录LR(线性回归)LightBGM二分类多分类XGB二分类Keras二分类多分类转自:https://www.jianshu.com/p/35d92c0f452a# 通用的预处理框架import pandas as pdimport numpy as npimport scipy as sp# 文件读取def read_csv_file(f, logging=False...转载 2019-10-25 11:38:39 · 679 阅读 · 0 评论 -
深度学习----NLP-TextCNN文本分类解读
文章目录1简介2.参数与超参数3.Embedding Layer4.Convolution Layer5.Max-Pooling Layer6.SoftMax 分类 Layer7.小的变种8 . Text CNN 的tf实现9. 与 LeNet 作比较10. TextCNN 论文中的网络结构1简介TextCNN 是利用卷积神经网络对文本进行分类的算法,由 Yoon Kim 在 “Convol...原创 2019-01-15 10:41:37 · 1331 阅读 · 0 评论 -
深度学习----NLP-TextRank算法详解
文章目录1. PageRank算法2. TextRank算法提取关键词3. TextRank算法提取关键词短语4. TextRank生成摘要5. 共现矩阵 ~~~~~~~~ 今天要介绍的Tex原创 2019-01-04 10:47:20 · 4578 阅读 · 0 评论 -
深度学习----NLP-ELMO算法模型解剖
文章目录简介Bidirectional 语言模型(1) forward language model(前向语言模型) and (2)backword language model(2)biLM(bidirectional language model)过程图线性组合总结论文地址:https://arxiv.org/pdf/1802.05365.pdf简介 ...原创 2018-12-24 17:03:40 · 2133 阅读 · 1 评论 -
深度学习----NLP-fastext原理细解
文章目录@[toc]1. 前言2. FastText原理2.1 模型架构2.2 层次SoftMax2.3 N-gram子词特征3. fastText和word2vec的区别4. 总结出处: https://www.cnblogs.com/huangyc/p/9768872.html1. 前言自然语言处理(NLP)是机器学习,人工智能中的一个重要领域。文本表达是 NLP中的基础技术,文本分类则...转载 2018-12-24 15:58:22 · 2270 阅读 · 0 评论 -
梯度消失与梯度膨胀,以及6种解决措施
我无意中看到一篇公众号,挺不错,就写下来了1.梯度消失根据链式法则,如果每一层神经元对上一层的输出的偏导乘上权重结果都小于1的话,那么即使这个结果是0.99,在经过足够多层传播之后,误差对输入层的偏导会趋于0。这种情况会导致靠近输入层的隐含层神经元调整极小。2.梯度膨胀根据链式法则,如果每一层神经元对上一层的输出的偏导乘上权重结果都大于1的话,在经过足够多层传播之后,误差对输入层的偏导会趋于无穷...转载 2018-11-27 18:46:54 · 3710 阅读 · 1 评论 -
机器学习----多项式核/RBF核对异或(XOR)拟合SVM代码
1、SVM 在 sklearn 中采用 sklearn.svm.SVC 设置参数:1.1 sklearn.svm.SVC 方法1.2 主要调节的参数 (加粗的文字)2 使用多项式核模拟svm3 基于RBF核方法对异或(XOR)问题的分类Sklearn中SVM方法详解 1、SVM 在 sklearn 中采用...转载 2019-03-01 15:36:25 · 3601 阅读 · 0 评论 -
人工智能论文合集
机器学习、NLP、Python、数学。。最全的AI学习资源都在这了!! AI科技大本营 2018-08-20 12:07 关注文章 资料整理 收集这些资源的作者 ,Robbie Allen,Infini...原创 2018-08-20 19:16:04 · 6158 阅读 · 1 评论 -
深度学习----现今主流GAN原理总结及对比
1.DCGAN2.WGAN3.WGAN-GP (improved wgan)4.LSGAN5.BEGAN: (不是EBGAN)GaN(第三代器件)特性的总结BEGAN1.DCGAN【github】地址 :https://github.com/Newmu/dcgan_code  theano ;https://github.co...原创 2018-08-13 14:23:18 · 41265 阅读 · 8 评论 -
【总目录】人工智能、机器学习、深度学习总结大全----目录.未完待续...
数学必知必会原创 2018-07-13 18:57:47 · 5184 阅读 · 4 评论 -
机器学习----Xgboost与GBDT
•符号:第i个训练示例 •模型:如何进行预测 线性模型:(包括线性/逻辑回归) 预测分数可以有不同的解释 取决于任务 线性回归:是预测得分 逻辑回归:预测概率 该实例是积极的 其他……例如在排名中可以是排名分数 •参数:我们需要从数据中学习的东西 线性模型:...原创 2018-08-03 12:32:30 · 342 阅读 · 0 评论 -
项目实战----基于协同过滤的电影推荐系统
一、数据整理二、观察用户-电影矩阵三、协同过滤推荐3.1、基于电影的协同过滤3.2、基于用户的协同过滤推荐3.3、基于SVD的协同过滤网页版—点击这里一、数据整理 数据及介绍 MovieLens是推荐系统常用的数据集 MovieLens数据集中,用户对自己看过的电影进行评分,分值为1-5. MovieLens包括两个大小不同的库。...原创 2019-03-01 15:38:16 · 5964 阅读 · 3 评论 -
机器学习----K最近邻(KNN)
一、什么是K近邻 K最近邻(k-Nearest Neighbour,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 用官方的话来说,所谓K近邻算法,即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的...原创 2018-06-23 19:45:46 · 748 阅读 · 0 评论 -
机器学习----统计学习方法-3(手写稿算法总结)
一、基础理解二、决策树三、ROC\AUC四、朴素贝叶斯五、逻辑斯蒂回归和最大熵模型六、支持向量机与核函数七、序列最小最优算法(SMO)八、EM算法和高斯混合模型一、基础理解 二、决策树 三、ROC\AUC 四、朴素贝叶斯五、逻辑斯蒂回归和最大熵模型 六、支持向量机与核函数 七、序列最小最...原创 2018-07-31 17:31:49 · 360 阅读 · 0 评论 -
深度学习----NLP结巴分词词性大全
jieba为自然语言语言中常用工具包,jieba具有对分词的词性进行标注的功能,词性类别如下:格式词性解释Ag形语素形容词性语素。形容词代码为 a,语素代码g前面置以A。a形容词取英语形容词 adjective的第1个字母。ad副形词直接作状语的形容词。形容词代码 a和副词代码d并在一起。an名形词具有名词功能的形容词。形容词代码 a和名词...原创 2019-01-04 11:40:13 · 899 阅读 · 0 评论 -
深度学习----CVPR2018最佳论文提名Deep Learning of Graph Matching解读
        ~~~~~~~~        作为一种常用的图数据处理技术,图匹配在计算机翻译 2019-01-04 18:06:07 · 4261 阅读 · 4 评论 -
liunx安装python3.X环境及opencv安装问题
文章目录1.检测Python版本2.安装Python3版本1、可利用linux自带下载工具wget下载2、下载完成后到下载目录下3、解压4、区分目录5、gcc编译6、保留与否7、再建立新版本python的链接`8、查看版本1.检测Python版本 ~~~~~~~~~ ...原创 2019-09-06 15:21:59 · 552 阅读 · 0 评论 -
opencv+海康威视实时rtsp视频流链接
文章目录1、首先对于无线或有线设备链接2、对于无线设备另一种链接——旧版3、判断rtsp是否正确用opencv对接海康威视rtsp流的路径问题困扰我了两天,网上的rtsp大部分都不一样,我试了很多次,都没成功的,但最后我还是搞清楚了对于不同的海康威视产品,有不同的写法。1、首先对于无线或有线设备链接新版和旧版通用的统一写法有:rtsp://admin:admin@192.168.0.111...原创 2019-08-30 09:59:36 · 7789 阅读 · 2 评论 -
线性回归统计指标 SSE、MSE、RMSE、MAE、R-square
文章目录@[toc]一、SSE(和方差)二、MSE(均方差)三、RMSE(均方根)四、MAE(平均绝对误差)五、R-square(确定系数)SSE(和方差、误差平方和):The sum of squares dueto errorMSE(均方差、方差):Meansquared errorRMSE(均方根、标准差):Root mean squared errorR-square(确定系数)...原创 2019-07-10 10:58:17 · 18990 阅读 · 0 评论 -
深度学习----NLP-TextRank的textrank4zh模块源码解读
文章目录1. textrank4zh模块源码解读2 textrank4zh模块的使用2.1 textrank4zh模块的安装2.2 textrank4zh的使用实例1)提取关键词、关键短语和关键句2)展示textrank4zh模块的三种分词模式的效果TextRank算法是一种文本排序算法,由谷歌的网页重要性排序算法PageRank算法改进而来,它能够从一个给定的文本中提取出该文本的关键词、关键...原创 2019-06-19 09:40:30 · 2227 阅读 · 0 评论 -
金书------LiYu's personal knowledge wiki
原文地址:https://sthsf.github.io/wiki/#Algorithm-DeepLearning-Tensorflow学习笔记 About 关于这个wiki 短中长期计划 Algorithm ...翻译 2019-03-29 14:26:31 · 497 阅读 · 0 评论 -
人工智能 = 人工智障(史上最全的人工智能机器学习、深度学习教程合集目录)
文章目录机器学习激活函数和函数偏差(bias)感知器回归梯度下降生成学习反向传播深度学习最优化和降维长短期记忆(LSTM)卷积神经网络(CNN)递归神经网络(RNN)强化学习生成对抗网络(GAN)多任务学习NLP深度学习和NLP词向量编码器-解码器Python实战案例Scipy和numpyscikit学习TensorflowPyTorch数学线性代数概率论微积分我将这篇文章分为四个部分:机器学习...转载 2019-03-25 11:49:37 · 939 阅读 · 0 评论 -
交叉熵与KL散度(相对熵)总结比较
文章目录关于交叉熵在loss函数中使用的理解信息论1 信息量2 熵3 相对熵(KL散度)4 交叉熵机器学习中交叉熵的应用1 为什么要用交叉熵做loss函数?2 交叉熵在单分类问题中的使用3 交叉熵在多分类问题中的使用参考: ~~~~~ https://blog.csdn.net...原创 2019-03-12 10:58:16 · 1657 阅读 · 3 评论 -
深度学习----词向量历史和发展现状解说
小编看了大量的文档,觉得一下文章写得最好词向量发展篇:https://blog.csdn.net/m0_37565948/article/details/84989565内容:共现矩阵-SVD-NNLM-Word2Vec-Glove-ELMoBERT词向量发展进程https://blog.csdn.net/miangangzhen/article/details/85318096wor...原创 2019-03-07 14:43:39 · 1986 阅读 · 0 评论 -
jieba分词原理
文章目录一、 jieba系统简介二、 jieba系统框架三、jieba分词原理四、jieba分词过程结巴分词基础:https://blog.csdn.net/Sakura55/article/details/84752000一、 jieba系统简介"结巴"中文分词:做最好的Python中文分词组件。特点:支持三种分词模式支持繁体分词支持自定义词典MIT授权协议涉及算法:&nb...原创 2019-03-07 09:50:31 · 3056 阅读 · 0 评论 -
深度学习----42个机器学习与深度常用面试题简结
欢饮访问我的主页:https://blog.csdn.net/Sakura55或者我的目录页:https://blog.csdn.net/Sakura55/article/details/80678611#font_color0099ff_size4_face_1881、为什么随机森林能降低方差?随机森林的预测输出值是多课决策树的均值,如果有n个独立同分布的随机变量xi,它们的方差都为σ...原创 2019-03-01 16:08:56 · 984 阅读 · 0 评论 -
深度学习----命名实体识别(CRF及变种)
<h1 class="entry-title"> <a href="http://www.52nlp.cn/%e4%b8%80%e6%96%87%e8%af%a6%e8%a7%a3%e6%b7%b1%e5%ba%a6%e5%ad%a6%e4%b9%a0%e5%9c%a8%e5%91%bd%e5%90%8d%e原创 2019-02-13 15:42:23 · 5489 阅读 · 1 评论 -
深度学习----Stanford nlp安装以及环境变量配置问题
文章目录PART1:安装Stanford NLPPART2:安装过程问题1)安装包问题2)路径设置3)环境变量PART3:词性标注测试官网下载:https://stanfordnlp.github.io/CoreNLP/index.html#download      ~~~~~~  &原创 2019-02-15 11:04:41 · 3427 阅读 · 5 评论 -
深度学习----Transformer模型之图示进阶篇
        Google于2017年6月发布在arxiv上的一篇文章《Attention is all you need》,提出解决sequence to sequence问题的transformer模型,用全attention的结构代替了lstm,抛弃了之前传统的encoder-decoder模型必须结合cnn或者rn...转载 2019-01-28 16:54:37 · 10446 阅读 · 0 评论 -
机器学习----深入解剖随机森林算法
1. 随机森林使用背景1.2 随机森林历史          &am原创 2018-08-04 19:18:04 · 1913 阅读 · 1 评论 -
机器学习----难点总结(持续更新)
一、KNN难点1.1、k值的确定一、KNN难点1.1、k值的确定原创 2018-07-15 16:34:45 · 5184 阅读 · 4 评论 -
机器学习----Apriori算法(关联规则)
上来一个公式 一、概念①支持度:P(A ∩ B),既有A又有B的概率 ②置信度: P(B|A),在A发生的事件中同时发生B的概率 p(AB)/P(A) 例如购物篮分析:牛奶 ⇒ 面包 例子:[支持度:3%,置信度:40%] 支持度3%:意味着3%顾客同时购买牛奶和面包 置信度40%:意味着购买牛奶的顾客40%也购买面包 ③如果事件A中包含k个元素,那么称这个事件A为k项集事件...原创 2018-07-10 16:34:00 · 2608 阅读 · 1 评论 -
机器学习----集成学习
一、 集成学习概述二、集成学习分类2.1、 集成学习之boostingboosting之Adaboost2.2、集成学习之baggingbagging之随机森林2.3、bagging之Stacking三、集成学习之评定方法3.1、平均法3.2、投票法3.3、学习法四、小结五、拓展前向分步算法 &n...原创 2018-07-16 20:00:00 · 802 阅读 · 0 评论 -
机器学习----聚类分析(Kmeans聚类算法)
机器学习算法的分类一、什么是聚类分析物以类聚,人以群分 二、相似度与距离度量原创 2018-07-03 16:02:26 · 7034 阅读 · 0 评论 -
L1和L2简单易懂的理解
一、正则化(Regularization) ~~~~~~~~机器学习中几乎都可以看到损失函数后面会添加一个额外项,常用的额外项一般有两种,一般英文称作ℓ1ℓ1-norm和ℓ2ℓ2-norm,原创 2018-07-09 20:48:29 · 21170 阅读 · 0 评论 -
机器学习----距离分类
一、欧式距离二、曼哈顿距离三、切比雪夫距离四、闵可夫斯基距离(闵式距离)五、马氏距离六、标准欧式距离七、汉明距离八、杰卡顿距离集中常见的距离 一、欧式距离           &原创 2018-07-02 15:42:38 · 1063 阅读 · 0 评论 -
机器学习----回归模型
一、回归模型的分类 知识点 二、多元线性回归 正则化三、非线性回归可转变为线性回归 四、回归模型评估指标 五、分类回归树...原创 2018-07-01 18:14:42 · 355 阅读 · 0 评论 -
机器学习----朴素贝叶斯介绍
一、什么是贝叶斯             &amp原创 2018-07-01 16:37:35 · 400 阅读 · 0 评论 -
机器学习----SVM支持向量机
一、什么是SVM先看思维导图: ● 左边是求解基本的SVM问题 ● 右边是相关扩展 一张图解决问题 SVM支持二分类,不适用于多分类 二、原理SVM方法是通过一个非线性映射p,把样本空间映射到一个高维乃至无穷维的特征空间中(Hilbert空间),使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题.简单地说,就是升维和线性化.升维,就是...原创 2018-07-01 15:04:15 · 482 阅读 · 0 评论 -
机器学习----朴素贝叶斯详解
一、概率基础知识         &amp原创 2018-07-08 10:51:19 · 699 阅读 · 0 评论