- 博客(1)
- 资源 (22)
- 问答 (1)
- 收藏
- 关注
贝叶斯模型.docx
该文档包含生成模型、判别模型的区别,高斯判别模型与LR之间的关系,NB以及基于拉普拉斯平滑处理的NB的例子,EM算法流程及例子,最后以一个常见的垃圾邮件分类为例解释说明贝叶斯算法。
2019-06-06
读书笔记之8文本特征提取之word2vec
文本预处理:分词,取出停用词,过滤低频词汇,编码归一化等;
文本向量化:如使用向量空间模型VSM(Vector Space Model)或者概率统计模型对文本进行表示,使计算机能够理解计算,用的方法基于集合论模型。基于代数轮模型。基于频率统计模型等等;
文本特征提取和选择:特征提取对应着特征项的选择和特征权重的计算。
2018-12-03
读书笔记之7TF-IDF算法实现关键词抽取
TF-IDF(term frequency –inverse document frequency)频率—反文档频率,是一种用于咨询检索与咨询探勘的常用加权技术。TF_IDF是一种统计方法,用以评估一字词对于一个文件集成或一个语料库中的其中一份文件的重要程度。字词的重要性随着他在文件中出现的次数呈正比地增加,但同时也会随着它在语料库中出现的频率呈反比地下降。
2018-12-03
读书笔记2之中文分词流程HanLP
本文档简单介绍了中文分词流程,可以细入某个领域进行研究,但是,据了解,中文分词有很多框架了,其中采用C语言的哈工大自然语言处理实验室、有复旦大学的FNLP、有商业公司支持的HanLP、斯坦福大学的....等等,这些都是开源框架,可以查看里面的源码,选择一个框架,首先看他的在社区的活跃度,比如:查看GitHub中的star、再其次看他是否是开源的框架、再其次看易用性、广泛性
2018-08-20
读书笔记1之语法语料库和语义知识库
本文档只是简单的介绍了自然语言处理的语法语料库和语义知识库相关知识。方便以后学习NLP的等等知识。
文档阅读地址:https://mp.csdn.net/postedit/81873670
2018-08-20
创建型-抽象工厂模式(Abstract Factory)
抽象工厂模式(Abstract Factory Pattern):提供一个创建一系列相关或相互依赖对象的接口,而无须指定它们具体的类。抽象工厂模式又称为Kit模式,属于对象创建型模式。
2016-07-10
JAVA设计模式(01):创建型-工厂模式【简单工厂模式】(Simple Factory)
JAVA设计模式(01):创建型-工厂模式【简单工厂模式】(Simple Factory)
2016-05-17
Oracle11g本地连接时怎样指定数据库而不是全局数据库sid?
2015-06-03
TA创建的收藏夹 TA关注的收藏夹
TA关注的人