![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
算法
wang_xiaoniao
这个作者很懒,什么都没留下…
展开
-
如何用字典树来判断两篇文章的相似性
目录题目内容解题思路源代码 题目内容 简单讲就是,给你两篇文章,问你这两篇文章是不是同一个人写的。1 具体内容如下图: 解题思路 把dictionary文本里的所有单词读入dic[]中,输出读入时间111 把stop words文本里的所有单词读入stp[]中,输出读入时间222 把artical1文本里的所有单词读入art1[]中,输出读入时间333 把artical2文本里的所有单词读入art2[]中,输出读入时间444 利用dic[],建立关于dictionary的字典树rootdic,(分三步)原创 2020-07-01 09:25:06 · 257 阅读 · 0 评论 -
在利用字典树判断文章相似度的基础上,能否使用ac自动机来优化时间
目录字典树是怎么判断文章相似度的ac自动机是什么使用了ac自动机后会如何匹配添加了ac自动机的代码对比时间 先说结论,我认为不行。 字典树是怎么判断文章相似度的 利用字典树判断两篇文章相似度时,大致思路是这样的。文章中的某个单词(注意,它是一个整体。这个单词中的任意一连续的部分如果在字典树中存在,都不计数)如果在字典树中出现,就令该单词在这篇文章中的出现次数+1。这样可得到每篇文章里各个单词出现的数量,然后判断高频单词是否类似即可。 ac自动机是什么 那么如果使用ac自动机的话,首先什么是ac自动机。ac自原创 2020-07-01 11:24:31 · 275 阅读 · 0 评论