自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

分享人工智能知识、python、自然语言处理、计算机视觉知识。

  • 博客(872)
  • 资源 (129)
  • 问答 (1)
  • 收藏
  • 关注

原创 计算机毕设-完整代码+论文

计算机毕设-完整代码+论文

2024-04-02 19:06:40 307

原创 毕业设计智能问答系统:机器学习深度学习NLP智能问答系统 代码+论文

毕业设计智能问答系统:机器学习深度学习NLP智能问答系统 代码+论文。

2024-03-31 10:29:05 216

原创 基于随机森林与LSTM神经网络的住宅用电比较分析及预测 代码+论文 完整毕设

基于随机森林与LSTM神经网络的住宅用电比较分析及预测 代码+论文 完整毕设

2024-03-27 18:44:51 362

原创 基于机器学习的用户信用评估违约贷款评估-完整代码数据计算机毕设

基于机器学习的用户信用评估违约贷款评估-完整代码数据计算机毕设

2024-03-22 09:43:15 390

原创 基于机器学习数据分析聚类的早期糖尿病风险预测-毕业设计分享 完整代码数据可直接运行

基于机器学习数据分析聚类的早期糖尿病风险预测-毕业设计分享 完整代码数据可直接运行

2024-02-25 10:30:31 280

原创 毕业设计:InceptionV3卷积神经网络的医学细胞识别(有完整代码数据可直接运行)

毕业设计:InceptionV3卷积神经网络的医学细胞识别(有完整代码数据可直接运行)

2023-12-28 22:50:32 560

原创 Deep Q-Networks (DQN)强化学习实现文本分类

Deep Q-Networks (DQN)强化学习实现文本分类

2024-04-17 13:35:25 227

原创 中文核心计算机视觉项目分享:多通道注意力机制得农业作物图像识别检测-完整代码+论文

中文核心计算机视觉项目分享:多通道注意力机制得农业作物图像识别检测-完整代码+论文

2024-04-17 13:30:14 396

原创 计算机毕设之车牌识别处理操作-灰度处理-边缘检测

计算机毕设之车牌识别处理操作-灰度处理-边缘检测

2024-04-02 19:00:21 120

原创 word2vec+xgboost分类代码+文本分类计算机毕设+论文完整的

word2vec+xgboost分类代码+文本分类计算机毕设+论文完整的

2024-03-31 16:44:13 119

原创 评价指标1. 均方误差(Mean Squared Error,MSE):

评价指标

2024-03-27 18:45:40 462

原创 医疗疾病知识图谱挖掘 实战 计算机毕设

医疗疾病知识图谱挖掘 实战 计算机毕设

2024-03-22 09:31:38 123

原创 机器学习lgbm时间序列预测实战

机器学习lgbm时间序列预测实战

2024-03-21 13:15:54 273

原创 微博情感评论分析系统-完整代码数据 毕业设计

微博情感评论分析系统-完整代码数据 毕业设计

2024-03-19 17:27:30 338

原创 基于机器学习的疾病预测实战

基于机器学习的疾病预测实战

2024-03-19 17:24:09 131

原创 基于机器学习的工业用电量预测完整代码数据

基于机器学习的工业用电量预测完整代码数据

2024-03-10 07:15:38 269

原创 逻辑回归分析

逻辑回归分析

2024-03-10 07:03:05 172

原创 tsne_embedding聚类显示模板

tsne_embedding聚类显示模板

2024-03-03 19:40:27 330

原创 计算机毕设:基于 BP 神经网络的雾霾交通识别系统 完整代码数据GUI系统

计算机毕设:基于 BP 神经网络的雾霾交通识别系统 完整代码数据GUI系统

2024-03-03 19:34:17 252

原创 panda根据多个值筛选行

panda根据多个值筛选行

2024-02-26 14:13:38 51

原创 python画两列数据的折线图

python画两列数据的折线图

2024-02-25 10:48:03 130

原创 共享粒子群算法 优化svm 分类 代码实战

共享粒子群算法 优化svm 分类 代码实战

2024-02-01 17:20:16 904

原创 基于机器学习的网格调参的草莓产量预测 完整代码数据

基于机器学习的网格调参的草莓产量预测 完整代码数据

2024-02-01 17:16:39 168

原创 基于 python 机器学习的中风患者疾病分析预测 完整数据代码可直接运行

基于 python 机器学习的中风患者疾病分析预测 完整数据代码可直接运行

2024-01-22 11:36:48 145

原创 数据分析实战:城市房价分析

数据分析实战:城市房价分析

2024-01-21 22:41:51 1103 2

原创 基于xgboost-LGBM-SVM的病人哮喘病识别检测 数据+代码

基于xgboost-LGBM-SVM的病人哮喘病识别检测 数据+代码

2024-01-21 22:36:56 184

原创 基于聚类和机器学习的疾病医疗保费预测 计算机毕设完整代码数据 (博文底部vx获取)

基于聚类和机器学习的疾病医疗保费预测 计算机毕设完整代码数据 (博文底部vx获取)

2024-01-19 16:30:01 893

原创 图卷积GCN实战基于网络结构图的网络表示学习实战

图卷积GCN实战基于网络结构图的网络表示学习实战

2024-01-19 16:16:59 421

原创 计算机医学信息交叉学科 疾病预测 案例分享完整代码数据可直接运行

计算机医学信息交叉学科 疾病预测 案例分享完整代码数据可直接运行

2024-01-10 10:10:59 391

原创 python实现图像去模糊降噪

python实现图像去模糊降噪

2024-01-10 09:19:41 479

原创 ValueError: Per-column arrays must each be 1-dimensional

data = pd.DataFrame({'x': x, 'y_pred': svm_pred.flatten(), 'y_true': y_test.flatten()})#.iloc[100:200,:]data = pd.DataFrame({'x': x, 'y_pred': svm_pred.flatten(), 'y_true': y_test.flatten()})#.iloc[100:200,:]

2024-01-08 09:05:11 661

原创 如何解决大模型的「幻觉」问题?

如何解决大模型的「幻觉」问题?

2024-01-04 15:20:40 385

原创 python基于flask实现一个文本问答系统

python基于flask实现一个文本问答系统

2024-01-04 15:14:04 811

原创 毕业设计:基于机器学习xgboost lgbm adaboost 的空气质量预测pm2.5‘, ‘so2‘, ‘no2‘ 完整代码数据-可直接运行

毕业设计:基于机器学习xgboost lgbm adaboost 的空气质量预测pm2.5', 'so2', 'no2' 完整代码数据-可直接运行

2024-01-04 15:05:15 692

原创 基于informer实现交通轨迹预测 项目介绍

基于informer实现交通轨迹预测 项目介绍

2024-01-04 14:55:25 512

原创 python将csv表格的某列 用唯一的数字id表示

python将csv表格的某列 用唯一的数字id表示

2023-12-29 17:47:49 334

原创 pytorch 与tf版本在深度学习中的常见问题

【代码】pytorch 与tf版本在深度学习中的常见问题。

2023-12-28 22:57:04 384

原创 列表获取最大值的下标

列表获取最大值的下标

2023-12-27 09:19:32 356

原创 编程python怎么随机画圆

编程python怎么随机画圆

2023-12-19 14:22:37 462 1

原创 大数据背景下的教育培训流动机构分析探究代码

大数据背景下的教育培训流动机构分析探究代码

2023-12-19 14:21:11 400

MalwareClassification数据

MalwareClassification数据

2023-05-14

基于ARMA差分还原的客流量时间序列预测 完整代码数据 毕设

基于ARMA差分还原的客流量时间序列预测 完整代码数据 毕设

2023-03-30

运动时间序列分类(KNN).rar

运动时间序列分类(KNN).rar

2023-03-28

基于py假期旅游数据的可视化分析.rar

基于py假期旅游数据的可视化分析.rar

2023-03-23

基于matlab对一篇诗歌出现字母的统计概率进行哈夫曼编码

实验目的: 对一篇诗歌出现字母的统计概率进行哈夫曼编码 实验要求: - 对一篇诗歌出现字母的统计概率进行哈夫曼编码 - 未知概率进行等长编码 - 求两种方法的平均码长 【实验环境】 操作系统:Windows 10 【实验过程】 一、实验步骤: - 将诗歌保存到文件 - 读取文件内容 - 统计诗歌出现的各个字母的概率 - 根据概率进行哈夫曼编码,得到平均码长

2023-03-06

SpringBoot+SpringJPA+Swagger+Shiro 快速搭建前后端分离的权限管理系统 完整毕设

SpringBoot+SpringJPA+Swagger+Shiro 快速搭建前后端分离的权限管理系统 介绍:这次我们使用 Shiro 快速搭建前后端分离的权限管理系统 利用 JPA 帮我们管理数据库,Swagger Knife4j 帮我搭建 Web 测试环境; 后台基于 SpringBoot JPA Knife4j Shiro 前端基于 VUE ElementUI

2023-03-06

基于python的成绩统计系统

本课设主要设计一个成绩统计系统,要求能录入成绩,并对成绩进行分段人数统计(90-100、80-89、70-79、60-69、0-59共五个段),计算每个段人数的百分比,输出所有成绩中的最高分、最低分和平均分。

2023-03-06

本文使用了基于长短期记忆网络(LSTM)

为对股票价格的涨跌幅度进行预测,本文使用了基于长短期记忆网络(LSTM)的方法。根据股票涨跌幅问题, 通过对股票信息作多值量化分类,将股票预测转化成一个多维函数拟合问题。将股票的历史基本交易信息作为特征输入,利用神经网络对其训练,最后对股票的涨跌幅度做分类预测。数据集为代号 510050 的上证股票,实验结果表明该模型在单纯预测涨跌的情况下有比较好的预测效果。

2023-03-06

车辆识别 车辆识别 车辆识别

车辆识别

2023-02-18

基于spring boot +opencv 实现车牌识别、人脸识别、证件识别等功能 附完整代码 毕业设计.rar

• 这是一个基于spring boot + opencv 实现的项目 • 贯穿样本处理、模型训练、图像处理、对象检测、对象识别等技术点 • 以学习交流为目的,代码注释超多,文档也在逐步完善 • java语言的深度学习项目,在整个开源社区来说都相对较少;拥有完整的训练、检测、识别过程的开源项目更是少之又少!! • 本人目前也正在学习图片识别相关技术,代码及文档持续更新中,大牛请绕路 包含功能 • 蓝、绿、黄车牌检测及车牌号码识别 • 网上常见的轮廓提取车牌算法JAVA实现 • hsv色彩分割提取车牌算法JAVA实现 • harrcascade特征识别算法 JAVA实现 • 基于svm算法的车牌检测训练JAVA实现 • 基于ann算法的车牌号码识别训练JAVA实现 • 人脸检测 接下来将实现人脸识别 • 图片工具: 目前实现了HSV色彩切割,后续将添加更多使用的图片处理工具,用于辅助算法优化 • 证件文字识别

2023-02-11

TensorFlow CNN 卷积神经网络实现人脸性别检测 完整教程 毕业设计

本文主要是实现了根据人脸识别性别的卷积神经网络,并对卷积过程中的提取特征进行了可视化.卷积神经网络最早是为了解决图像识别的问题,现在也用在时间序列数据和文本数据处理当中,卷积神经网络对于数据特征的提取不用额外进行,在对网络的训练的过程当中,网络会自动提取主要的特征。详细设计见md文件。 积神经网络主要特点 权值共享: 在卷积层中可以有多个卷积核,每个卷积核与原始图像进行卷积运算后会映射出一个新的 2D 图像,新图像的每个像素都来自同一个卷积核.这就是权值共享. 池化: 降采样,对卷积(滤波)后,经过激活函数处理后的图像,保留像素块中灰度值最高的像素点(保留最主要的特征),比如进行 2X2 的最大池化,把一个 2x2 的像素块降为 1x1 的像素块. 卷积网络的训练数据(112*92*3 图形) 从 data 目录读取数据,famale 存放女性图片,male 存放男性图片

2023-02-10

基于python face recognition OpenCV 的智慧教室人脸考勤系统 (毕业设计 附完整代码可直接运行)

长期以来,签到考勤是考查学生出勤率与学习情况的重要方式。目前,中小学与高等学校的老师普遍使用人工考勤,这种传统的人工考勤方式效率低下,且往往存在“代签”现象;使用学习通等第三方签到软件则存在远程签到、代签等弊端,不仅给任课老师带来不必要的负担,还浪费了课堂宝贵的上课时间。 为了解决上述问题,本团队开发了一款基于基于人脸识别的考勤设备:智慧教室人脸考勤系统。从教师点名到人脸识别,课堂考勤的升级换代,本质上是身份识别方式的迭代演变。随着技术的成熟,考勤机得到了飞跃式发展,产品形态和应用模式呈现出多元化、智能化的发展态势。对于学校而言,除了考勤效率和安全性能,智能化、在线化、管理精准化等也是考勤机选择的重要考量标准,而人脸考勤系统兼具了这些功能,这也是众多学校与任课老师选择人脸考勤的原因。 人脸考勤系统以人脸为介质,人员经过设备时只需轻轻一瞥,1 秒内即可自动识别人员身份并完成签到,实现对人员的精准管理。无需担心错签或漏签问题,只需要刷脸就能秒速签到,大大提升了学生通行效率和体验。该系统成本低廉,复用性强,对未来学校智慧教室的实现与推广具有巨大积极作用。 目标人群: 包括中小学、高等

2023-02-10

使用Android开发的多功能笔记应用麻雀笔记毕业设计 完整项目代码

本项目为使用Android开发的多功能笔记应用【麻雀笔记】。「麻雀笔记」能够处理的碎片信息已经包括了便签、链接、位置、消费、日子、心情、账户、三省等内容,并且针对不同的类型做出不同的型态呈现,比如用户经常用到的日期信息,输入某一个需要记录的重要日子的内容、具体日期等信息后,还可以得到现在距离该日子还有多少天,或者这个日子已经过去了多少天。

2023-02-09

基于标题的大规模商品实体检索,任务为对于给定的一个商品标题,参赛系统需要匹配到该标题在给定商品库中的对应商品实体 代码参考

基于标题的大规模商品实体检索,任务为对于给定的一个商品标题,参赛系统需要匹配到该标题在给定商品库中的对应商品实体。 输入:输入文件包括若干行商品标题。 输出:输出文本每一行包括此标题对应的商品实体,即给定知识库中商品 ID,只返回最相关的 1 个结果。 团队成绩:评价方式采用准确率,最终成绩排名如下,DeepBlueAI 团队获得了本任务的冠军以及技术创新奖。

2023-02-09

基于opencv caffe的待识别的人脸图像在视频影像中找人 代码 毕业设计

基于opencv caffe的待识别的人脸图像在视频影像中找人 人脸识别实现的选择,我本想使用卷积神经网络训练出人脸识别的模型,输出人脸的位置,但是发现训练的效果不理想,只好换方案了。 最终我使用了 SeetaFaceEngine 的实现方案,只使用其中的 FaceDetection 和 FaceAlignment,并对 FaceAlignment/src/test/face_alignment_test.cpp 做了修改。 实际上这一步是最重要的,人脸识别模型识别率越高,找人的效果越好,需要花费时间反复调优模型。资源所限,还有我的训练集的限制,这里放弃自己训练的模型,改用 SeetaFaceEngine 实现,实际效果上还是堪用的。 核心代码逻辑:FaceDetection 负责人脸位置的识别,FaceAlignment 进行人脸对齐(仿射变换),将对齐后的人脸图片保存,作为后续人脸特征比较时使用。 核心代码:

2023-02-09

机器学习文本分类基于TF-IDF+手写朴素贝叶斯

人工智能大作业,文本分类,TF-IDF+手写朴素贝叶斯。本项目利用分类算法实现对文本的数据挖掘,主要包括:1. 语料库的构建,主要从搜狗语料库、复旦大学中文语料库等搜集文章作为训练集和测试集;2. 语料库的数据预处理;3. 选择分类算法(朴素贝叶斯、支持向量机),训练文本分类器,理解所选的分类算法的建模原理、实现过程和相关参数的含义;4. 对测试集的文本进行分类;5. 对测试集的分类结果利用正确率和召回率进行分析评价。 个人独立实现实验; 文本类别数:≥10 类; 训练集文档数:≥ 50000 篇;每类平均 5000 篇; 测试集文档数:≥ 50000 篇;每类平均 5000 篇; 使用合适的降维方法; 判断停用词表是否合理并作出适当调整; 改进加权方法和其他改进方法; 朴素贝叶斯分类器要手动编写完成。

2023-02-08

使用C++和Python实现的基于卷积神经网络的校园垃圾识别系统实现 毕设

本项目为使用C++和Python实现的基于卷积神经网络的校园垃圾识别系统实现。本项目的基本功能:客户端拥有对常见校园垃圾的识别能力;客户端可以上传识别结果;服务器可以接受并储存终端的识别结果。 功能需求 1.1.1 基本功能 客户端拥有对常见校园垃圾的识别能力 客户端可以上传识别结果 服务器可以接受并储存终端的识别结果 1.1.2 扩展功能 客户端与客户端之间可以进行关于垃圾回收消息的实时交流 服务器可以储存用户信息 浏览器可以实时访问识别结果 1.2 数据需求 1.2.1 C/S 架构客户端数据需求 实时识别的图像数据与字符串形式的识别结果 字符串形式的用户信息 字符串形式的聊天消息 对GUI控件的操作信号 套接字文件 1.2.2 C/S 架构服务器数据需求 字符串形式的识别结果 字符串形式的聊天信息 字符串形式的用户信息 套接字文件 字符串形式的数据库信息 1.2.3 B/S 架构浏览器数据需求 对垃圾识别系统的整体情况的字符串显示 1.3 界面需求 1.3.1 C/S 架构客户端界面需求 当前客户端摄像头图像的呈现 识别按钮与识别结果呈现的文本框 用户信息(用户名

2023-02-08

基于BiLSTM-CRF的命名实体识别 附完整代码.zip

求构造一个命名实体识别(NER)模型,除了基本的预测功能外,能够对测试集进行批量预测并将测试结果保存为文件。中文分词指的是将一个汉字序列切分成一个一个单独的词。中文分词是文本挖掘的基础,对于输入的一段中文,成功的进行中文分词,可以达到电脑自动识别语句含义的效果。它是信息提取、信息检索、机器翻译、文本分类、自动文摘、语音识别、文本语音转换、自然语言理解等中文信息处理领域的基础。 1.1.1 基础任务 实现基于词典的分词算法 实验一资料包下的“Dictionary_based”文件夹中提供了基础词典和分词算法的大致框架。分词算法的核心部分需要大家完成,实验中提供了若干测试样本用以帮助大家判断算法是否正确实现。 实现基于统计学习的分词算法 实验中给出 Bi-LSTM+CRF 模型的基础实现,相关代码及说明文档位于实验一资料包下的“Bi-LSTM+CRF”文件夹下。请根据给定的实验资料中 README.md 文件配置相应实验环境,说明:(1)提供源码 PyTorch 语言编写(可根据个人掌情况用其他语言编写),默认运行版本是 CPU 版本;(2)如希望运行 NPU 版本,大家可跟任课老

2023-02-08

基于Python开发带差分隐私采用协同过滤的推荐系统 毕业设计.gz

本文的主要研究内容如下: • 分析了在推荐系统中加入差分隐私的重要性和必要性,介绍了推荐系统隐私保护的研究背景和目前国内外推荐系统、差分隐私技术以及二者结合产物的研究现状。 • 推荐系统概述。介绍推荐系统的主要分类方法和对于协同过滤推荐算法的研究;介绍了协同过滤算法的主要步骤:收集用户偏好、找到相似的用户或者物品、计算并推荐。 • 差分隐私概述。分析了差分隐私的概念和该模型相对于传统安全模型的优势,研究了差分隐私的性质和常用的实现机制。 • 基于差分隐私的协同过滤推荐系统的设计、实现与测试。基于前面的理论知识,设计了一个使用基于用户的协同过滤的推荐系统,其中相似度采用两种方法计算,并使用差分隐私将推荐结果进行加密。然后将设计出来的系统应用于 MovieLens 的两个不同规模的数据集上进行实验比较和分析,通过测试,找到可以相对较好地平衡推荐结果准确度和隐私保护程度的隐私预算。

2023-02-08

基于 LDA SS-NMF 的交互式文本主题分析可视化分析系统 毕业设计 附完整代码.zip

主要内容是在国内外交互式主题建模的研究基础上,设计一个面向文本分析的交互式主题建模可视化分析系统。系统使用非负矩阵分解(NMF)来作为主题建模的主要算法,并参考了Jaegul Choo等人提出的UTOPIAN主题建模可视化分析系统,对其中的半监督非负矩阵分解(SS-NMF)算法和多种用户交互方式进行了实现及改进。 本系统采用Web技术,后端算法和接口使用Python语言和FastAPI Web框架编写,前端界面使用React&Ant Design框架编写。

2023-02-08

Web课程期末项目之Web 3D 太空模型展示.gz

Explore Space 是一款以宇宙空间为主题,应用了Web 3D、前端机器学习等新颖 Web 技术,前后端功能完备的 Web 应用。 包括以下两大核心功能: 1.适用于教学/科普的模型展示场景 2.基于3D地球的数据可视化Explore Space 是一款以宇宙空间为主题,应用了Web 3D、前端机器学习等新颖 Web 技术,前后端功能完备的 Web 应用。 包括以下两大核心功能: 1.适用于教学/科普的模型展示场景 2.基于3D地球的数据可视化

2023-02-08

基于 python TF-IDF K-means 算法的校园微博热点话题发现系统

微博由于其“短平快”的信息生产能力和快速传播能力,已经广泛流行于高校学生的日常生活中。但微博上的负面舆情信息给社会、学校和个人带来巨大的危害。由于微博的多而快特点,无法依赖人工对相关信息进行收集、筛选和发掘热点话题。因此研究并开发校园微博热点话题发现系统,对高校舆情工作有重要的意义。 本文从微博独有的短文本特征及国内外相关微博研究出发,通过对校园微博进行分类处理后使用 K-means 聚类算法对校园微博短文本聚类,并改进热度计算公式,通过话题热度提取校园微博热点话题,实现对校园微博热点话题的监控。本文通过几个模块设计并实现了校园微博热点话题发现系统,包括微博数据爬取模块、微博数据预处理模块、微博热点话题分析模块、微博热点话题展示模块等模块。最后以广州中医药大学的生活类微博—广中医 I 栋为研究对象,对校园微博各模块功能及相关技术进行介绍,并对相关模块进行测试验证,分析校园微博热点话题特点,总结系统的优点和不足,提出下一步改进的设想。 关键词: 校园微博 K-means 热点话题

2023-02-08

使用Tensorflow实现的MTCNN和MobileFaceNet实现的人脸识别

本教程是教程是介绍如何使用 Tensorflow 实现的 MTCNN 和 MobileFaceNet 实现的人脸识别,并不介绍如何训练模型。关于如何训练 MTCNN 和 MobileFaceNet,请阅读这两篇教程 MTCNN-Tensorflow 和 MobileFaceNet_TF ,这两个模型都是比较轻量的模型,所以就算这两个模型在 CPU 环境下也有比较好的预测速度,众所周知,笔者比较喜欢轻量级的模型,如何让我从准确率和预测速度上选择,我会更倾向于速度,因本人主要是研究深度学习在移动设备等嵌入式设备上的的部署。好了,下面就来介绍如何实现这两个模型实现三种人脸识别,使用路径进行人脸注册和人脸识别,使用摄像头实现人脸注册和人脸识别,通过 HTTP 实现人脸注册和人脸识别。 本地人脸图像识别 本地人脸图像识别就是要通过路径读取本地的图像进行人脸注册或者人脸识别,对应的代码为 path_infer.py。首先要加载好人脸识别的两个模型,一个是人脸检测和关键点检测模型 MTCNN 和人脸识别模型 MobileFaceNet,加载这两个模型已经封装在一个工具中了,方便加载。 然后 add

2023-02-07

基于 word2vec TextRNN 的新闻文本分类.zip

研究内容和数据分析 本实验主要来自天池的一个新人赛,赛题以自然语言处理为背景,要求选手根据新闻文本字符对新闻的类别进行分类,这是一个经典文本分类问题。通过这道赛题可以引导大家走入自然语言处理的世界,带大家接触 NLP 的预处理、模型构建和模型训练等知识点。 赛题以匿名处理后的新闻数据为赛题数据,数据集报名后可见并可下载。赛题数据为新闻文本,并按照字符级别进行匿名处理。整合划分出 14 个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐****的文本数据。 题数据由以下几个部分构成:训练集 20w 条样本,测试集 A 包括 5w 条样本,测试集 B 包括 5w 条样本。为了预防选手人工标注测试集的情况,我们将比赛数据的文本按照字符级别进行了匿名处理。处理后的赛题训练数据如下: 在数据集中标签的对应的关系如下:测指标如下:评价标准为类别 f1_score 的均值,选手提交结果与实际测试集的类别进行对比,结果越大越好。 实验数据分析:在读取完成数据集后,我们还可以对数据集进行数据分析的操作。虽然对于非结构数据并不需要做很多的数据分析,但

2023-02-07

基于Django 框架搭建学习平台系统,实现KNN、ID3、C4.5、SVM、朴素贝叶斯、BP神经网络等算法及流程管理 附代码

基于Django 框架搭建学习平台系统,实现KNN、ID3、C4.5、SVM、朴素贝叶斯、BP神经网络等算法及流程管理 附代码. kNN 简介 kNN 原理 :存在一个样本数据集合,也称作训练集或者样本集,并且样本集中每个数据都存在标签,即样本集实际上是 每条数据 与 所属分类 的 对应关系。 核心思想 :若输入的数据没有标签,则新数据的每个特征与样本集中数据对应的特征进行比较,该算法提取样本集中特征最相似数据(最近邻)的分类标签。 k :选自最相似的 k 个数据,通常是不大于 20 的整数,最后选择这 k 个数据中出现次数最多的分类,作为新数据的分类。 k-近邻算法的一般流程 1.收集数据:可以使用任何方法, 2.准备数据:距离计算所需的数值,最好是结构化的数据格式。 3.分析数据:可以使用任何方法。 4.训练算法:此不走不适用于k-近邻算法。 5.测试算法:计算错误率。 6.使用算法:首先需要输入样本数据和结构化的输出结果,然后运行k-近邻算法判定输入数据分别属于哪个分类,最后应用对计算出的分类之行后续的处理。

2023-02-07

基于Python实现的论坛帖子文本情感分析完整代码+数据 可直接运行 毕业设计.rar

课程项目 文本分类分析 二、项目类容 爬取川大匿名社区SCUinfo在一段时间内的帖子,对其进行情感分类分析,包括情绪分类(积极,消极),帖子内容关联分析等。 三、个人工作完成报告 3.1 工作概述 负责数据收集、预处理以及简单的情感分析 3.2 爬虫方案 scuinfo为动态加载网页,并且有移动端验证,尝试使用scrapy爬取数据失败,需要对爬虫进行大量定制优化,为了提高开发效率,最终使用了之前爬取QQ空间采用的方式:使用selenium库调用firefox浏览器驱动,该再通过代码模拟人为操作浏览器。获取到对应页面数据后,使用etree和xpath选取相应的目标节点数据。 优点:轻松解决网页动态加载,登录验证,移动端验证等问题 缺点:该方式需要一直保持浏览器前台运行,并且只能为单线程模式,爬取效率相对较低 关键代码如下所示:

2023-02-07

基于opencv卷积网络实现人脸检测和性别分类.rar

我们利用 python 里面已有的库来安装 OpenCV。Python 是一种计算机程序设计语言。是一 种动态的、面向对象的脚本语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更 新和语言新功能的添加,越来越多被用于独立的、大型项目的开发。 我们只需要通过 pip 或者 anaconda 安装 OpenCV 包就可以通过导入包并使用。 4.BP 神经网络算法介绍和实践 BP 神经网络通常是指基于误差反向传播算法( Back Propagation, 简称 BP 算法)的多层 前向神经网络 ( Multi-laye Feed-forward Neural Networks, MFNN),它最初是由 Paul Werboss 在 1974 年提 出, 但未在传播,直到 20 世纪 80 年代中期 Rumelhart、Hinton 和 Williams, David Parker 和 Yann Le Cun 重新发现了 BP 算法,同时因此算法被包括在《并行 分布处理》(Parallel Distributed Processing),此算法才广为人知。目前 BP 算法已

2023-02-07

基于TF-IDF,LDA ,DBSCAN算法观影用户的电影推荐聚类分析 附完整代码 毕业设计.zip

tf-idf 的主要思想是:如果某个词或短语在一篇文章中出现的频率(TF)很高,并且在其他文章或者评论中出现很少,则认为此词或者短语具有很好的类别区分能力,适合用来分类。LDA 模型的全称是隐含狄利克雷分配(LDA,LatentDirichletAllocation)。是一种今年来发展起来的一种非常重要的离散数据集合的建模方法。其主要的功能就是可以生成文本的主题分布向量,分析然后挖掘出文本的潜在知识。是一种非常优秀的文本聚类的预处理方法。详细设计见md文件。

2023-02-07

TensorFlow 2.0 + RNN 实现一个古体诗生成器 附完整代码

项目主要包含如下功能: 使用唐诗数据集训练模型。 使用训练好的模型,随机生成一首古体诗。 使用训练好的模型,续写一首古体诗。 使用训练好的模型,随机生成一首藏头诗。 先对项目做个简单展示。项目主要包含如下功能: 使用唐诗数据集训练模型。 使用训练好的模型,随机生成一首古体诗。 使用训练好的模型,续写一首古体诗。 使用训练好的模型,随机生成一首藏头诗。 随机生成一首古体诗: 金鹤有僧心,临天寄旧身。 石松惊枕树,红鸟发禅新。 不到风前远,何人怨夕时。 明期多尔处,闲此不依迟。 水泉临鸟声,北去暮空行。 林阁多开雪,楼庭起洞城。 夜来疏竹外,柳鸟暗苔清。 寂寂重阳里,悠悠一钓矶。 续写一首古体诗(以"床前明月光,"为例): 床前明月光,翠席覆银丝。 岁气分龙阁,无人入鸟稀。 圣明无泛物,云庙逐雕旗。 永夜重江望,南风正送君。 床前明月光,清水入寒云。 远景千山雨,萧花入翠微。 影云虚雪润,花影落云斜。 独去江飞夜,谁能作一花。 随机生成一首藏头诗(以"海阔天空"为例): 海口多无定, 阔庭何所难。 天山秋色上, 空石昼尘连。 海庭愁不定, 阔处到南关。 天阙青秋上, 空城雁渐催。

2023-02-07

自然语言处理(NLP) 使用卷积神经网络(CNN)处理中的文本分类问题完整代码+数据可直接运行

使用卷积神经网络(CNN)处理自然语言处理(NLP)中的文本分类问题。本文将结合TensorFlow代码介绍: 词嵌入 填充 Embedding 卷积层 卷积(tf.nn.conv1d) 池化(pooling) 全连接层 dropout 输出层 softmax 文件测试

2023-02-06

python实现的基于k-NN的人脸识别算法 附完整代码+数据集.rar

python实现的基于k-NN的人脸识别算法 附完整代码+数据集.rar 在信息化高速发展的今天,人们对于一个快速的身分验证方法的需求越来越广泛,从智能手机到门禁,人脸识别似乎成为了一个快速且行之有效的认真途径。本文尝试实现一个基于 k-NN 的人脸识别算法,并从中一窥现代人脸识别技术的完整面貌。 1 综述 1.1 数据集 本实验的数据集采用了剑桥大学 Olivetti Research 实验室 1992 年 4 月到 1994 年 4 月摄制的人脸照片。数据集包含 40 个不同的对象,每一个对象 10 张不同的人脸照片。所有的照片都是在黑暗的背景下拍摄的,同一个对象的照片有些许不同,包括一些光照的不同以及面表情和面部细节的不同。所有的文件都是 pgm 格式的,便于读取。同一个对象的照片存于同一个文件夹中,编号 s1~s40,同一个对象的不同照片分别编号为 1.pgm~10.pgm。 1.2 算法 在本实验中,主要采用了 k-NN 算法对于人脸进行归类识别,并辅以其他的算法来检测识别的性能。k-NN 算法的过程如下: 遍历训练数据集,计算预测样本与其他每一个样本点的距离,按照由近

2023-02-06

基于python pytorch实现人脸性别识别GUI系统 附代码 +报告可作为毕设.zip

大作业提供人脸图像,数据集包括了白种人、黄种人、黑种人等多种种族数据。数据集存在人脸姿态、光照、年龄等多种干扰,具有一定的挑战性。要求实现:基于人脸图像自动识别该人性别,数据集划分要求为:随机选择 40%、10%、50%的数据,分别作为训练、验证和测试集。详细设计见md文件。 大作业提供人脸图像,数据集包括了白种人、黄种人、黑种人等多种种族数据。数据集存在人脸姿态、光照、年龄等多种干扰,具有一定的挑战性。要求实现:基于人脸图像自动识别该人性别,数据集划分要求为:随机选择 40%、10%、50%的数据,分别作为训练、验证和测试集。 ① 要求撰写一份实验报告,报告中说明使用了何种模型及方法,以及对应的测试结果; ② 在训练模型时所参考的学术信息需要给出适当的文献引用; ③ 不允许直接使用开源项目提供的已训练好的模型或已写好的现有代码。 ④ 附加任务(供参考选做):设计界面,可在界面上实现输入数据集中的图像后,显示该人的性别。 二、实验过程

2023-02-06

基于Python和PyQt5库实现的面向英文文献的编辑与检索系统 毕业设计附代码.rar

基本要求 设计图形界面,可以实现英文文章的编辑与检索功能 编辑过程包括: 创建新文件;打开文件;保存文件 查找:输入单词在当前打开的文档中进行查找,并将结果显示在界面中 替换:将文章中给定的单词替换为另外一个单词,再存盘等 对于给定的文章片段(30<单词数量<100),统计该片段中每个字符出现的次数,然后以它们作为权值,对每一个字符进行编码,编码完成后再对其编码进行译码。在 图形界面中演示该过程 对于给定的多篇文章构成的文档集中,统计不同词汇的出现频率,并进行排序,在界面中显示 TOP 20 的排序结果 对于给定的多篇文章构成的文档集中,建立倒排索引,实现按照关键词的检索,并在界面中显示检索的结果(如:关键词出现的文档编号以及所在的句子片段,可以将关键词高亮显示) 1.1.2 扩展要求 界面设计的优化 对于编码与译码过程,可以自行设计其他算法 扩展检索:例如,可以实现多于 1 个关键词的联合检索,要求检索结果中同时出现所有的关键词 优化检索,对于检索结果的相关性排序,例如:包含关键词的数量等信息为依据 可以自行根据本题目程序的实际应用情况,扩展功能 1.2 需要处理

2023-02-06

基于python flask 实现图像相似性匹配系统 毕业设计附完整代码+数据.zip

基于python flask 实现图像相似性匹配系统 毕业设计附完整代码+数据.zip 毕业设计的系统地址也用 flask、gunicorn、supervior 和 nginx 反向代理部署在服务器了,图像搜索引擎地址为http://pyimagesearch.chinadream.org。

2023-02-06

利用神经网络启发的 A算法解决 15 数码问题

摘要 为了解决十五数码问题, 常用的方法是 A 算法, A 算法的好坏完全决定于启发函数 h 的选择. 在 15 数码问题中, 常用的启发函数有错位数和曼哈顿距离, 但这样的启发函数距离真实的代价差距还是很大的. 同时我们可以注意到, 启发函数可以看作当前状态到预测代价的映射, 因此利用神经网络训练启发函数是完全合理的. 实验证明, 在搜索深度比较大的情况下, 神经启发函数比曼哈顿距离找到最优解的速度可能会快上甚至上千倍 代码说明 main.py 程序的入口 board.py 负责一些基本操作: 比如是否为解, 判断可行的移动方向, 移动棋子 utils.py 数据结构类: Node 用于存储最优路径, PriorityQueue 负责探索 f(state)最小的状态 intelligence.py 基本的 A*算法, 曼哈顿距离和判断是否有解的算法 neural_network.py 用于训练和产生神经启发函数 ans/neu_ans[num].txt或man_ans[num].txt 存储使用 neu 和 man 的解(主要是判断 neu 产生的解是最优的), 还记录了

2023-02-06

基于torch transformers 直接加载bert预训练模型计算句子相似度

基于torch transformers 直接加载bert预训练模型计算句子相似度

2023-02-05

数据分析大作业:使用Python相关算法对某地区房地产价值进行分析报告 完整代码+报告

数据分析大作业:使用Python相关算法对某地区房地产价值进行分析报告 完整代码+报告 **1、**房价和哪些因素有关,在之后的中介推销中重点关注 **2、**开发商该如何建造房屋才能让更多的客户来选择购买居住 **3、**预估房屋价值,给房产中介提供合理的房价信息

2023-02-05

工厂选址及其运输问题的现实求解 附python代码和实验报告.rar

问题重述 --- 某品牌汽车有限公司,计划在中国大陆若干地区建设一定数量的工厂,以满足该品牌向四座城市——北京、上海、广州、南京——的销售需求。要求考虑并决策建厂地点,在满足各销地的需求情况下,使建厂的固定成本和运输费用之和最小。 2 问题假设 --- 1. 假设各地工厂每年的产量保持不变。 2. 假设工厂的产量与其占地面积呈正比关系。 3. 假设工厂建设的固定成本与其占地面积呈正比关系。 4. 假设运输费用只包括燃油费与过路费,不考虑车辆购买或租用费用,不考虑司机工资报酬费用。 5. 不考虑运输时间,不考虑运输车辆数量问题。 6. 根据经济学中的边际效益定理,为了最大化利润,每一个城市至多只能修建三座工厂。 7. 为了保证利润最大化,所有工厂总生产量与所有城市总需求量相等。 8. 实际工厂大多位于城市郊区,但城市郊区与市中心的距离和城市之间的距离相比可以忽略,故假设工厂都建于所选城市中心 9. 这四个城市作为中国主要大都市,车牌限购政策已经或者在不久后肯定都会实施,所以忽略需求量的增长,假设未来每年这四个城市的年需求量保持不变。 10. 假设此品牌汽车公司与上海大众实力相当

2023-02-05

基于pythonOpencv 人脸表情情绪框选识别系统 GUI界面 完整项目代码 毕业护设计

使用卷积神经网络构建整个系统,在尝试了 Gabor、LBP 等传统人脸特征提取方式基础上,深度模型效果显著。在 FER2013、JAFFE 和 CK+ 三个表情识别数据集上进行模型评估。 环境部署 基于 Python3 和 Keras2(TensorFlow 后端),具体依赖安装如下(推荐使用 conda 虚拟环境)。 cd FacialExpressionRecognition conda create -n FER python=3.6 source activate FER conda install cudatoolkit=10.1 conda install cudnn=7.6.5 pip install -r requirements.txt 如果你是 Linux 用户,直接执行根目录下的 env.sh 即可一键配置环境,执行命令为 bash env.sh。 数据准备 数据集和预训练模型均已经上传到百度网盘,链接给出,

2023-02-05

基于python实现的生成对抗网络GAN进行人脸生成矫正 完整代码教程

这篇文章主要介绍了生成对抗网络(Generative Adversarial Network),简称 GAN。 GAN 可以看作是一种可以生成特定分布数据的模型。 首先固定 Generator,训练 Discriminator。 输入:真实数据 $x$,Generator 生成的数据 $G(z)$ 输出:二分类概率 从噪声分布中随机采样噪声 $z$,经过 Generator 生成 $G(z)$。$G(z)$ 和 $x$ 输入到 Discriminator 得到 $D(x)$ 和 $D(G(z))$,损失函数为 $\frac{1}{m} \sum_{i=1}^{m}\left[\log D\left(\boldsymbol{x}^{(i)}\right)+\log \left(1-D\left(G\left(\boldsymbol{z}^{(i)}\right)\right)\right)\right]$,这里是最大化损失函数,因此使用梯度上升法更新参数:$$\nabla_{\theta_{d}} \frac{1}{m} \sum_{i=1}^{m}\left[\log D\left

2023-02-05

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除