![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
跟包叔一起学习
辗转很久,还是写写博客吧。
展开
-
机器学习实施kNN之k-近邻算法--算法步骤
kNN算法步骤 1、计算已知类别数据集中的每个点与当前点之间的距离 2、按照距离递增次序排序 3、选取与当前点距离最小的K 个点 4、确定前K个点所在类别的出现频率 5、返回前K 个点出现频率最高的类别作为当前点的预测分类原创 2016-04-21 01:29:32 · 840 阅读 · 0 评论 -
TF-IDF算法实现关键词抽取
TF-IDF算法是关键词提取算法中基础,并且有效的一种算法,实现简单效果比较明显,在使用中非常广泛。假设现在有一批“短文本“,比如很多条一句话的新闻。现在需要提取这些一句话新闻的关键词。我们可以采取tf-idf算法来实现。TF-IDF(term frequency - inverse document frequency) 是一种统计方法。可以用来评估一个词对于一个文件集或一个语料库中的其...原创 2018-04-13 01:23:52 · 2281 阅读 · 0 评论 -
textrank算法介绍
TextRank算法TextRank算法基于PageRank,用于为文本生成关键字和摘要。其论文是: Mihalcea R, Tarau P. TextRank: Bringing order into texts[C]. Association for Computational Linguistics, 2004.先从PageRank讲起 在浅入浅出:PageRank算法这篇博客中我做过简要的...原创 2018-04-25 13:58:16 · 1850 阅读 · 0 评论