机器学习
GodBlessTo
这个作者很懒,什么都没留下…
展开
-
新词发现-基于凝固度和自由度
用python实现新词发现程序——基于凝固度和自由度互联网时代,信息产生的数量和传递的速度非常快,语言文字也不断变化更新,新词层出不穷。一个好的新词发现程序对做NLP(自然预言处理)来说是非常重要的。N-Gram加词频最原始的新词算法莫过于n-gram加词频了。简单来说就是,从大量语料中抽取连续的字的组合片段,这些字组合片段最多包含n个字,同时统计每个字组合的频率,按照词频并设置一个阈...转载 2020-04-18 17:58:06 · 1734 阅读 · 0 评论 -
机器学习实战读书笔记-kNN分类算法
kNN算法伪代码:1】计算已知类别数据集中的点与当前点之间的距离2】按照距离递增次序排序3】选取与当前点距离最小的k个点4】确定前k个点所在类别的出现频率5】返回前k个点出现频率最高的类别作为当前点的预测分类源代码实现:def classify0(inX, dataSet, labels, k): dataSetSize = dataSet.shape原创 2017-04-16 17:05:28 · 346 阅读 · 0 评论