项目名称 😎
网络爬虫搭建热词词库 UI
项目概述 🚀
本项目的目标是提供一个用户界面,通过网络爬虫搭建热词词库,并提供多种功能模块,包括数据爬取、数据可视化处理和扩展功能。
主要功能模块 🛠️
主界面
- 数据爬取: 能够有针对军事网站 dvidshub 中的视频进行爬取,获取相关数据。
- 数据可视化处理:
- 生成热词词云:提供多种形态的热词词云生成,直观展示关键词。
- 实意词提取:从文本中提取实体词,便于深入理解文本的主题。
- 高频词提取:统计文本中的高频词汇,帮助用户快速把握文本关键信息。
- 生成热词词云:提供多种形态的热词词云生成,直观展示关键词。
- 扩展功能:
- OCR 文字识别:应用光学字符识别技术,提取并识别图片中的文字信息。
- 图像增强:借助 ESRGAN 开源库,提供图像增强功能,提高图像质量。
- OCR 文字识别:应用光学字符识别技术,提取并识别图片中的文字信息。
操作指南 📚
-
安装依赖: 在项目根目录下运行以下命令,安装所需依赖。
pip install -r requirements.txt
-
运行程序: 执行以下命令启动程序。
python main.py
-
注意事项:
- 若要使用图像增强功能,需进入 ESRGAN 文件中配置相关环境。
注意事项 🤔
本项目的图像增强功能应用了 ESRGAN 提供的开源库,如需使用该功能,请确保已配置好相关环境。
欢迎使用本项目!如果有任何问题或建议,可以随时发送邮件至 1812760272@qq.com 进行咨询。期待您的反馈,让我们一同打造更好的用户体验!