自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 熵相关原理介绍

摘自《统计自然语言处理》宗成庆 熵 熵是信息论的基本概念,贝尔实验室出版的《贝尔系统技术》连载的香农博士的文章《通信教学原理》奠定了信息论的基础。 如果X是一个离散型随机变量,取值空间为R,其概率分布为p(x)=P(X=x),x∈Rp(x)=P(X=x), x\in Rp(x)=P(X=x),x∈R,那么X的熵H(X)定义为H(X)=−∑x∈Rp(x)log2p(x)H(X)=-\sum_{x\in R}p(x)log_2p(x)H(X)=−x∈R∑​p(x)log2​p(x) 熵又称为自信息(

2020-12-21 15:59:49 3220

原创 统计学习方法_第1章-统计学习方法概论

第1章 统计学习方法概论 统计学习的定义、研究对象与方法 统计学习方法的三要素: 模型、策略和算法 模型选择,包括正则化、交叉验证与学习的泛化能力 介绍生成模型与判别模型 监督学习方法的应用:分类问题、标注问题与回归问题 统计学习 统计学习的方法是基于数据构建统计模型从而对数据进行预测与分析。统计学习由监督学习(supervised learning)、非监督学习(unsupervised learning)、半监督学习(semi-supervised learning)和强化学习(reinforcem

2020-12-15 09:45:30 171

原创 Chinese Treebank简单介绍

CTB中汉语词性划分规则: 汉语被划分为33类 4类动词和谓语性形容词(Verb, adjective) – VC: Copula 系动词 – VE: main verb – VV: Other verb(其他动词) – VA: Predicative adjective(表语形容词) 3类名词 – NR(专有名词) – NT(时间名词) – NN(其他名词) 1类处所词 – LC(处所词),方位:前后里外左右上下 1类代词 – PN(代词) 3类限定词和数词 – DT: Determiner(限定词),

2020-12-14 16:13:49 1536 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除