统计与机器学习
文章平均质量分 79
一条赖皮狗
这个作者很懒,什么都没留下…
展开
-
基于HMM和规则相结合的中文地名识别方法
基于机器学习和规则相结合的中文地名识别方法 命名实体识别是自然语言处理中的一个常见任务,方法也越趋于成熟。本人最近正在做事件抽取相关工作,对于事件中地址元素的识别稍有经验,所以写下本文,以对前面工作做一个总结。1、词库的整理 中国地名毕竟有限,所以我们选择爬取中国统计局2016年统计用区划代码和城乡划分代码中的地名作为基本地名词库,补充到分词器中。分词器选择Hanlp。原创 2018-02-02 11:49:46 · 2646 阅读 · 1 评论 -
java中多线程
参考博客:https://www.cnblogs.com/wxd0108/p/5479442.html引言 如果对什么是线程、什么是进程仍存有疑惑,请先Google之,因为这两个概念不在本文的范围之内。 用多线程只有一个目的,那就是更好的利用cpu的资源,因为所有的多线程代码都可以用单线程来实现。说这个话其实只有一半对,因为反应“多角色”的程序代码,最起码每个角色要给...转载 2018-03-06 11:26:48 · 145 阅读 · 0 评论 -
SignatureDef的作用
SignatureDef的作用 本篇文章主要讲解SignatureDef接口的作用概述SignatureDef的主要作用是定义输出和输入接口协议。他在构建SaveModel时,被封装到二进制文件中。SignatureDef结构SignatureDef包含三个部分:input:封装着TensorInfo信息的字典outputs :和上面一样,封装着TensorInf...原创 2018-03-16 16:03:47 · 4853 阅读 · 0 评论 -
概率无向图模型
概率无向图模型 前面我们所讲的朴素贝叶斯,贝叶斯网络,马尔科夫模型,隐马尔科夫模型都属于概率有向图模型。概率无向图模型和概率有向图模型处理方法有少许不同,本文单独介绍。 马尔科夫随机场是一种著名的概率无向图模型,李航的书中直接将两者划为了等号。 本文首先介绍概率无向图模型的定义,然后介绍概率无向图模型的因子分解。马尔科夫随机场的定义 马尔科夫随机场是一种著名的...原创 2018-03-02 15:40:54 · 2851 阅读 · 0 评论 -
PCA的数学原理
原文链接:http://blog.csdn.net/shulixu/article/details/52894413 PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。。网上关于PCA的文章有很多,但是大多数只描述了PCA的分析过...转载 2018-03-01 18:12:25 · 166 阅读 · 0 评论 -
生成式模型 vs 判别式模型
生成式模型 vs 判别式模型 有监督机器学习方法可以分为生成方法和判别方法(常见的生成方法有混合高斯模型、朴素贝叶斯法和隐形马尔科夫模型等,常见的判别方法有SVM、LR等),生成方法学习出的是生成模型,判别方法学习出的是判别模型。那么他们之间的真正区别和优缺点是什么了?1、判别式模型 假设有一批训练数据(xi,yi)" role="presentation" style=原创 2018-02-05 15:47:02 · 285 阅读 · 0 评论 -
概率图模型
概率图模型 自然语言处理中一个常见任务是根据已知状态来对感兴趣的未知状态进行预测和推断,比如序列标注问题。概率图模型提供了一种描述框架,将学习任务归结于计算变量概率的分布1、概念图模型的定义 在概率模型中,利用已知变量推测未知变量的分布称为“推断”(inference),其核心是如何基于可观测变量推测出未知变量的条件分布。具体的说,假定所关心的变量集合为Y" role="原创 2018-02-02 19:02:51 · 446 阅读 · 0 评论 -
tensorflow之Saving and Restoring翻译(一)
Saving and Restoring 这篇文档说明了如何保持和加载tensorflow的变量和模型保存和加载变量Tensorflow的变量被你的程序所管理,它是一种最好的方式,用于表达共享和持久化状态。本章节说明了如何保存和加载变量。注意:Estimators会自动的保存和加载变量(模型存放在参数model_dir所指定的目录) tf.train.Saver类提供了保存...翻译 2018-03-14 17:12:42 · 363 阅读 · 0 评论