![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
amblue
这个作者很懒,什么都没留下…
展开
-
JSON与XML的比较
<br /><br /> 以前有接触过JSON并没有深入比较XML跟JSON区别,今天看到一篇帖子还不错,转过来一起学习~<br /> ◆可读性<br /> JSON(Java Object Notation) 和XML的可读性可谓不相上下,一边是建议的语法,一边是规范的标签形式,很难分出胜负。<br /> ◆可扩展性<br /> XML天生有很好的扩展性,JSON当然也有,没有什么是XML能扩展,JSON不能的。<br /> ◆编码难度<br /> XML有丰富的编码工具,比如Dom4j、转载 2011-04-26 15:58:00 · 730 阅读 · 0 评论 -
中文trie树
这几天被汉字trie树小折腾了一下。 开始的时候想直接将单字节作为字典树的节点建树,虽然各个树的节点可能只是多字节字符的一部分,但是基本功能也能够支持。后来发现似乎有些问题,比如在做前向最大匹配分词的时候,对于未登录词无法确定当前字符是单字节还是多字节,如果通过编码规则进行判定的话倒也可以,但是跟建树过程南辕北辙。 然后想到了utf16字符编码对所有字符统一采用16位定长处理,这样的话只原创 2011-07-01 10:31:00 · 6376 阅读 · 0 评论 -
判别式模型和生成式模型的区别(discriminative model and generative model)
在NLP和机器学习中经常会遇到这两种显著不同的模型,在学习阶段(训练阶段)和评估阶段(测试阶段)都有不同的表现总结一下它们之间的区别,欢迎补充:1. 二者最本质的区别是建模对象不同 假设有样本输入值(或者观察值)x,类别标签(或者输出值)y 判别式模型评估对象是最大化条件概率p(y|x)并直接对其建模,生成式模型评估对象是最大化联合概率p(x,y)并对其建模。原创 2013-11-29 14:47:53 · 10367 阅读 · 0 评论