- 博客(10)
- 收藏
- 关注
转载 python 的日志logging模块学习
1.简单的将日志打印到屏幕 import logginglogging.debug('This is debug message')logging.info('This is info message')logging.warning('This is warning message') 屏幕上打印:WARNING:r
2017-05-12 16:17:42 487
转载 自动和半自动知识提取
知识库的建立,在NLP领域是常见的工作内容。我目前也在做一个HR的系统,需要建立技能的知识库,查了一些资料,做一些总结。 正如动物依靠对环境和食物的认知来维持生存、人类依靠知识和技能来扮演社会角色一样,计算机应用程序和系统也依赖特定的“知识”来完成特定的功能。近些年,包括互联网搜索系统、自动导航系统、自动问答系统、机器翻译系统、语音识别系统等在内的智能系统取得了巨大进展,其背后是更深、更广、更新
2017-05-11 21:17:45 1865
翻译 CNN情感分析(文本分类)
这篇文章翻译至denny britz的博客,本来想自己用TensorFlow实现CNN情感分析,看过denny的github后,就决定不浪费时间了。当然,会在他的基础上做一些改进。一、数据预处理 这个情感分析的数据集来自Rotten Tomatoes的电影评论,总共10662个样本,一半正例,一半负例,词汇的数目大概2万个。 任何机器学习能够得到很好的执行,数据预处理都很重要。首先,简单介
2017-05-10 22:58:09 23090 10
原创 LDA小结及在gensim中的应用
首先,感谢Rickjin的《LDA数学八卦》,能兼具如此数学功底和写作功底的人,着实不多。这是我的个人的思路小结,没有数学推导,如果想仔细研究,推荐大家去阅读那篇八卦,写的很精彩。 LDA是NLP领域一个非常重要的非监督算法。一直想仔细研究一番。 看完Rickjin的《LDA数学八卦》,不说理解透彻,这个算法前前后后的思考过程还是比较清晰的。 首先,why?LDA出现的
2017-05-06 23:43:31 2093
原创 Django中引入vue没反应
在Django中引入了vue,但是demo中不能读取message:<!DOCTYPE html><html><head><meta charset="utf-8"><title>Vue</title><script src="https://unpkg.com/vue/dist/vue.js"></script></head><body><div id="app"> <p>{{
2017-05-05 12:36:35 2430 1
原创 条件随机场(CRF)及CRF++安装使用
这个,终于到了要解决命名实体识别的问题,搞自然语言处理,貌似这个绕不开的。CRF,传统的干这活的利器,听名字就是高大上。既然绕不开,那就整整吧。 CRF是用来标注和划分序列结构数据的概率化结构模型。言下之意,就是对于给定的输出,标识序列Y和观测序列X,条件随机场通过定义条件概率P(Y | X),而不是联合概率分布P(X, Y)来描述模型。 很清楚了,这是个判别模型。 CRF也可以看做
2017-05-03 16:47:14 3046
原创 隐马尔可夫模型
隐马尔可夫模型属于概率图模型,细分的话,属于有向图模型。在自然语言处理中,可以用于序列标注、特征选择、机器翻译等任务。 先说一下随机过程和马尔可夫模型。 随机过程又称随机函数,是随时间而随机变化的过程。马尔可夫模型描述了一类重要的随机过程。这些随机变量之间并不是相互独立的,每个随机变量的值依赖于这个序列前面的状态。如果在特定条件下,系统在时间t的状态只与其在时间t-1的状态相关,则该系统
2017-05-03 16:22:29 525
原创 概率图模型
首先,介绍一下概率图的概念。 概率图模型是一种通用化的不确定知识表示和处理方法。它是在概率模型的基础上,使用基于图的方法来表示概率分布。 概率图模型,是一个图,结点表示变量,结点之间的边表示概率关系。根据图模型的边是否有向,概率图模型通常被划分成有向概率图模型和无向概率图模型。 有向图模型分为静态贝叶斯网络、动态贝叶斯网络(隐马尔可夫模型、卡尔曼滤波器等);无向图模型主要
2017-05-03 10:10:52 1190
原创 TensorFlow笔记之变量管理
TenssorFlow中通过变量名称获取变量,主要通过两个函数:tf.get_variable和tf.variable_scopetf.get_variable TensorFlow在创建变量时,它和tf.Variable的功能基本等价的。 例如:v = tf.get_variable("v", shape = [1], initializer = tf.constant_initialize
2017-05-01 22:19:21 648
原创 TensorFlow笔记之常见七个参数
对TensorFlow深度学习中常见参数的总结分析 神经网络中常见的参数有:初始学习率、学习率衰减率、隐藏层节点数量、迭代轮数、正则化系数、滑动平均衰减率、批训练数量七个参数。 对这七个参数,大部分情况下,神经网络的参数选优是通过实验来调整的。 一个想法是,通过测试数据来评判参数的效果,但是这种方法会导致过拟合测试数据,失去评判未知数据的意义。而我们训练神经网络的目的,恰恰是为了预测
2017-05-01 14:58:53 2448
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人