机器学习
txdyhs
这个作者很懒,什么都没留下…
展开
-
常用中文分词软件
SCWS:基于词频词典的机械中文分词引擎ICTCLAS:最早的中文开源分词项目HTTPCWS:基于http协议的开源中文分词系统,将取代之前的PHPCWS中文分词扩展庖丁解牛分词:仅支持Java语言,且提供lucence(一款流行的Java全文搜索引擎)接口CC-CEDICT:提供一份以汉语拼音为中文辅助的汉英词典,其词典可以用于中文分词,Chrome中文版就是使用这个词典进行中文...原创 2019-02-24 15:19:30 · 2006 阅读 · 0 评论 -
NLP笔记
文本歧义及其清理包括数据再加工、文本清理、特定预处理。标志化处理、词干提取或词形还原、停用词移除csv文件json文件语句分离器inputstring='This is an example sent. The sentence splitter will split ' \ 'on sent markers. Ohh really!!'from n...原创 2019-02-24 15:20:32 · 315 阅读 · 0 评论 -
Sklearn参数详解—贝叶斯
朴素贝叶斯一共有三种方法,分别是高斯朴素贝叶斯、多项式分布贝叶斯、伯努利朴素贝叶斯,在介绍不同方法的具体参数前,我们先看看这三种方法有什么区别。这三种分类方法其实就是对应三种不同的数据分布类型。高斯分布又叫正太分布,我们把一个随机变量X服从数学期望为μ、方差为σ^2的数据分布称为正太分布,当数学期望μ=0,方差σ=1时称为标准正态分布。正太分布概率图伯努利分布又称“零一分布”、“两...转载 2019-02-28 18:41:53 · 8570 阅读 · 0 评论 -
AbuML函数
Help on class AbuML in module abupy.MLBu.ABuML:class AbuML(builtins.object) | AbuML(x, y, df, fiter_type=<EMLFitType.E_FIT_AUTO: 'auto'>) | | 封装有简单学习及无监督学习方法以及相关操作类 | | Methods def...原创 2019-02-20 16:26:12 · 395 阅读 · 0 评论