本文是为大家整理的TF-IDF算法主题相关的10篇毕业论文文献,包括5篇期刊论文和5篇学位论文,为TF-IDF算法选题相关人员撰写毕业论文提供参考。
1.[期刊论文]基于TF-IDF算法的分层搜索引擎设计
期刊:《计算机与数字工程》 | 2021 年第 003 期
摘要:随着网络信息的迅速增长以及深层网络结构的广泛应用,人们对于覆盖率广、检索效率高的搜索引擎提出了愈来愈高的要求.据此,论文提出了一种两阶段的搜索引擎设计方案.在第一阶段利用网络爬虫爬取相关的网络信息,并构成词条语料库,在第二阶段基于TF-IDF算法搜索词条语料库,得到与待查询语句最相近的词条.该引擎利用Flask框架构建本地Web界面,实现简洁明了的界面显示与快速的数据传输,且该框架易于维护.实验结果表明,该搜索引擎采用的爬虫技术所形成的语料库覆盖率广,TF-IDF算法具有计算速度快、匹配精度高的特点.
关键词:搜索引擎;网络爬虫;TF-IDF算法;Flask框架
---------------------------------------------------------------------------------------------------
2.[期刊论文]基于改进TF-IDF算法的牛疾病智能诊断系统
期刊:《计算机应用与软件》 | 2021 年第 002 期
摘要:传统的TF-IDF(Term Frequency&Inverse Documentation Frequency)算法提取的关键词不能合理地代表某疾病的症状,降低智能诊断系统的性能.对此,提出一种改进的TF-IDF算法,并将其应用在牛疾病诊断系统中.系统将用户描述的文本内容转换成向量的形式,用TF-IDF算法提取关键症状词,利用余弦定理和可信度计算给出可靠的疾病推荐和治疗方案.实验结果表明,该算法在疾病诊断中准确率和可信度两方面都具有更好的效果.与传统TF-IDF算法相比,平均可信度提高约4%.
关键词:智能诊断;TF-IDF;余弦相似度;VSM
---------------------------------------------------------------------------------------------------
3.[期刊论文]一种基于TF-IDF的朴素贝叶斯算法改进
期刊:《计算机技术与发展》 | 2020 年第 002 期
关键词:朴素贝叶斯;TF-IDF算法;去中心化;位置信息;特征权重
---------------------------------------------------------------------------------------------------
4.[期刊论文]一种结合TF-IDF方法和词向量的短文本聚类算法
期刊:《电子设计工程》 | 2020 年第 021 期
摘要:随着在线社交网络平台(微信、微博等)和APP(网易、学习强国)的快速发展和应用,产生了海量短文本.针对这些海量短文本,传统的文本聚类方法存在聚类性能较差的问题.本文融合TF-IDF方法和词向量,提出了一种短文本聚类方法.首先,使用TF-IDF方法,提取短文本中TF-IDF值靠前的TOP-N关键词作为短文本的特征词集合;其次,在Word2Vec工具的支持下,使用Skip-gram模型在海量语料中训练得到特征词的向量表示;最后,使用WMD距离计算短文本间的相似度.将所提方法应用于4个数据集,实验结果表示,该方法比传统的文本聚类算法具有更好的效果.
关键词:文本聚类;短文本;TF-IDF;词向量;自然语言处理
---------------------------------------------------------------------------------------------------
5.[期刊论文]一种改进TF-IDF的中文邮件识别算法研究
期刊:《现代电子技术》 | 2020 年第 012 期
关键词:TF-IDF算法;邮件识别;卡方统计量;权重分配;邮件分类;仿真分析
----------------------------------------------------