较详细地解读Bert原文及简单的keras调用实现

前言 bert自问世到现在也快一年了,不过我也是最近一段时间才看了下这篇轰动NLP界的文章,说实话,有些地方并不是太好理解,很多博客在当时也没能解答我的一些困惑,不过带着疑问去看原文是必要的。这篇博客主要还是基于bert的原文对其进行一个介绍,希望在这片文章中尽量把我看别人博客时感到困惑的地方说的...

2019-08-04 18:42:49

阅读数 93

评论数 0

关于决策树后剪枝和最大熵模型的一些直观理解

前言: 今天又看了一下李航的“统计学习方法”,每次看到决策树后剪枝和最大熵模型的时候,总觉得有些陌生,就是那种不管看几遍公式推导还是觉得理解不够到位的感觉,今天也不例外。于是我决定跳出公式,更加直观的去理解它们的原理,最后也算是有些新的感悟,就此做一个记录,同时希望能够有缘看到这篇文章的读者,对...

2018-08-12 21:34:41

阅读数 211

评论数 0

用C++调用tensorflow在python下训练好的模型(centos7)

本文主要参考博客https://blog.csdn.net/luoyexuge/article/details/80399265 [1] bazel安装参考:https://blog.csdn.net/luoyi131420/article/details/78585989 [2] 首先介绍下...

2018-07-15 16:51:40

阅读数 2712

评论数 3

用BLSTM+CRF进行序列标注

前言: 2015年,百度几位研究员发表了一篇名为Bidirectional LSTM-CRF Models for Sequence Tagging的论文,意思是用神经网络中的RNN所衍生出的LSTM与CRF相结合来进行序列标注。由于本最近在处理序列标注的问题,所以拜读了一下这篇文章,思想比较朴...

2018-07-06 09:45:54

阅读数 2699

评论数 2

用tensorflow实现word2vec(skip-gram+NEC模型)

前言: 本文的代码主要参考github上的一篇开源的代码“Basic word2vec example”,但是几乎只提取了其中网络搭建的必要部分,并且为了方便自己作为初学者的理解进行了一些语言上简化(并没有简化模型),同时加上了一些自己的批注。 主要目的是学习熟悉tensorflow的使用,同...

2018-06-22 10:56:58

阅读数 569

评论数 0

几道数据结构和算法题的回顾总结

这周做了一些牛客网上剑指offer的题.选取几道个人觉得比较典型,有意思的题拿出来进行分析. 1.链表中环的入口节点 一个链表中包含一个环,请找出这个环的入口节点. 分析:一般答案不那么显然的链表题,大多都可以用这种方法解决:派出两个指针干活.这道题也是如此,具体是派出快慢2个指针同时出发,...

2018-06-03 17:55:14

阅读数 106

评论数 0

simhash的py实现

前言: 这篇博客主要从python(3)代码的角度来讲本人是如何实现simhash的,不足之处还望大家不吝赐教。simhash的算法原理大家可以参考简单易懂讲解simhash算法。值得一提的是文中提到simhash对长文本更加有效,个人从算法原理角度思考过后感觉也是如此。 初始化 首先我们要...

2018-05-26 11:37:09

阅读数 1843

评论数 0

相似query(句子)聚类

相似query(句子)聚类 首先说明一下,这些句子均来自一个特定的领域(如教育,娱乐明星,游戏),且无标签。 先讲一下大体流程。首先对句子分词,并根据word2vec的思想,对句子进行了向量化,接着对高纬度向量表征的句子进行了PCA降维,然后用kmeans对句子进行了聚类,再利用相似度阈值的思...

2018-05-20 10:50:20

阅读数 1601

评论数 2

关键词提取(tf-idf与textRank)

关键词提取(tf-idf与textRank) 一.tf-idf tf-idf提取关键词是一种简单有效的提取关键词的方法.其思想主要在于预先统计在语料中出现的所有词的词频,计算出idf值,然后再针对要提取关键词的文章或句子的每个词计算出tf值,乘起来便是tf-idf值.值越大表示作为关键词的优先...

2018-05-09 16:50:49

阅读数 7219

评论数 0

fasttext简介

fasttext的基础理论 前言简介 fasttext是NLP里,一个非常高效的,基于词向量化的,用于文本分类的模型。虽然其原理比较简单,但是其中涉及到了不少的用于提速和准确率的小技巧。 这篇文章主要从理论的层面(一直想有时间去扒源码来看看来着)介绍这些小技巧,而对于和word...

2018-04-29 10:50:38

阅读数 851

评论数 1

提示
确定要删除当前文章?
取消 删除