- 博客(3)
- 收藏
- 关注
原创 熵相关原理介绍
摘自《统计自然语言处理》宗成庆 熵 熵是信息论的基本概念,贝尔实验室出版的《贝尔系统技术》连载的香农博士的文章《通信教学原理》奠定了信息论的基础。 如果X是一个离散型随机变量,取值空间为R,其概率分布为p(x)=P(X=x),x∈Rp(x)=P(X=x), x\in Rp(x)=P(X=x),x∈R,那么X的熵H(X)定义为H(X)=−∑x∈Rp(x)log2p(x)H(X)=-\sum_{x\in R}p(x)log_2p(x)H(X)=−x∈R∑p(x)log2p(x) 熵又称为自信息(
2020-12-21 15:59:49 3220
原创 统计学习方法_第1章-统计学习方法概论
第1章 统计学习方法概论 统计学习的定义、研究对象与方法 统计学习方法的三要素: 模型、策略和算法 模型选择,包括正则化、交叉验证与学习的泛化能力 介绍生成模型与判别模型 监督学习方法的应用:分类问题、标注问题与回归问题 统计学习 统计学习的方法是基于数据构建统计模型从而对数据进行预测与分析。统计学习由监督学习(supervised learning)、非监督学习(unsupervised learning)、半监督学习(semi-supervised learning)和强化学习(reinforcem
2020-12-15 09:45:30 171
原创 Chinese Treebank简单介绍
CTB中汉语词性划分规则: 汉语被划分为33类 4类动词和谓语性形容词(Verb, adjective) – VC: Copula 系动词 – VE: main verb – VV: Other verb(其他动词) – VA: Predicative adjective(表语形容词) 3类名词 – NR(专有名词) – NT(时间名词) – NN(其他名词) 1类处所词 – LC(处所词),方位:前后里外左右上下 1类代词 – PN(代词) 3类限定词和数词 – DT: Determiner(限定词),
2020-12-14 16:13:49 1536 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人