山东大学创新实训项目简介

最新推荐文章于 2022-05-16 18:03:36 发布

rui1791577934

最新推荐文章于 2022-05-16 18:03:36 发布

阅读量518

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/rui1791577934/article/details/106717331

版权

该项目运用NLP技术与机器学习算法，从热门网站爬取数据，进行分词、关键词提取、情感分析和热度分析，构建预测模型预测关键词热度趋势，通过ELK栈提升数据处理效率，最终实现软件或网站的交互展示和系统管理。

摘要由CSDN通过智能技术生成

项目背景

我们计划使用NLP相关知识对数据集进行分词，关键词提取，模型训练、情感分析、热度分析对论坛内容进行关键词的提取和不同关键词热度分析并得到合理的预测模型，利用得到的预测模型模型预测不同时间段内热度较高的关键词来进行数据的关键词热度趋向的分析，并给出对应的建议。（再使用机器学习的算法对不同时间段内需要预测的主题的数据的发展情况和数据的关键词热度趋向分析结果进行联合分析，给出各个时间段的联合分析结果（和建议））。

项目技术路线

信息采集：使用爬虫从热门的web2.0网站爬取内容和ID，获取数据集。
数据预处理：对爬取的数据进行标注分类等数据的预处理，然后把数据集分为训练集、验证集、测试集。
预测模型的建立：在已有数据集的基础上，使用NLP相关知识对数据集进行分词，关键词提取，模型训练、情感分析、热度分析对数据集内容进行关键词的提取和不同关键词热度分析并得到合理的预测模型，利用得到的预测模型模型预测不同时间段内热度较高的关键词来进行趋向的分析。（再使用机器学习的算法对不同时间段内热度较高的关键词数据的发展情况和数据结果趋向分析结果进行联合分析，给出各个时间段的联合分析结果（和建议））。
结果呈现：设计软件或网站UI交互界面并实现后台调度，根据用户的输入，我们的预测模型给出结果，通过后台调度将我们的模型和用户的呈现进行交互，并将结果合理的呈现出来
系统管理：对网站以及训练模型的状态比如任务的调度、系统的状态、网址/关键字的维护等进行通过管理员界面等方式进行观测
ELK构建搜索模块：
a. Redis高

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。