# CRF++源码分析——模型的加载#

最新推荐文章于 2021-12-02 17:13:12 发布

置顶

hongchenWang

最新推荐文章于 2021-12-02 17:13:12 发布

阅读量2.5k

点赞数 6

分类专栏： CRF nlp c++ 深度学习-神经网络文章标签： CRF 自然语言 NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hongchenWang/article/details/53338880

版权

CRF++源码分析——模型的加载

接触CRF++有一段时间了，也看了一些CRF++的一些源码，再次打算对CRF++的源码进行分析，整理下以前对CRF++的理解。对CRF++的分析主要分为三部分:
1-模型的训练
2-模型的加载
3-任务的应用

由于模型训练的分析比较复杂，所以我打算放在最后来分析，按2->3->1的顺序来讲。关于CRF++的一些基本知识不再单独讲解，不熟悉的可以参考CRF++自带的说明文档，或者和说明文档比较接近的这篇文章来了解！本文以CRF++中自带样例中的一个（/example/chunking下）来分析。

由于知识储备有限，分析的有问题的地方还请见谅和指教！

CRF++在执行具体任务（对各种序列打标签）之前会将学习到的模型加载到自己的内存中，本模块主要分析CRF++加载模型的过程！

1、特征值

为了下面的讲解方便，我们引入特征值的概念。
我们知道对于Unigram类型的特征模板，产生的特征函数的数量是L.N，对于Bigram类型的特征模板，产生特征函数的数量是L.L.N(其中L是标注集中类别数量，N是从模板中扩展处理的字符串种类)。我们在特征模板与特征函数之间增加一层概念。
设x是特征模板t扩展处理的字符串集X(t)(上边的N表示的是本集合的大小\势）元素,我们将x应用于T(即将T所指定的位置的字符串指定为x)得到T的一个特征值。我们有（Y表示标注集，Y的大小为L）：

特征值是包括特征模板与对应位置字符串组成的二元组,特征模板t生成的特征值集合为 $V (t) = {(t, x) | x \in X (t)} ， | V (t) | = | X (t) | = N$ $V(t)=\{ (t,x)|x\in X(t)\}，|V(t)|=|X(t)|=N$ 。
Unigram特征函数是包括特征模板，对应位置字符串和标注组成的三元组,U特征模板t生成的特征函数的集合 $F (t) = {(t, x, y) | x \in X (t), y \in Y} = {(v, y) | v \in V (t), y \in Y}, | F (t) | = | V (t) | . | Y | = N L$

最低0.47元/天解锁文章

关注

6
点赞
踩
6

收藏

觉得还不错? 一键收藏
4
评论
# CRF++源码分析——模型的加载#

CRF++源码分析——模型的加载接触CRF++有一段时间了，也看了一些CRF++的一些源码，再次打算对CRF++的源码进行分析，整理下以前对CRF++的理解。对CRF++的分析主要分为三部分: 1-模型的训练 2-模型的加载 3-任务的应用由于模型训练的分析比较复杂，所以我打算放在最后来分析，按2-&gt;3-&gt;1的顺序来讲。关于CRF++的一些基本知识不再单独讲解，不熟悉的可...
复制链接

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。