深度学习实战(进阶)
文章平均质量分 92
专栏面向已经了解深度学习基础知识的读者,旨在帮助读者深入学习深度学习的更高级概念、算法、方法和技术,掌握构建更加复杂和强大的深度学习模型所需的知识和技能。该专栏包括空洞卷积神经网络、BERT、transformer、GPT、注意力机制、生成模型、T5等模型的高阶知识。
微学AI
人工智能高级研发者,名校硕士学历毕业,拥有10项AI领域发明专利,主攻深度学习实战案例、机器学习实战案例、大模型实战项目,研究方向包括:深度学习应用技巧,Pytorch搭建模型,机器学习经典模型,计算机视觉,自然语言处理,知识图谱,大模型实战(包括:ChatGLM、通义千问、百川、LLaMA、书生等开源模型的微调技巧、Qlora微调、提示词工程、思维链、RAG技术、LangChain框架、智能体应用项目、大模型私有化部署)。项目主要运用于医疗健康、政府文档、教育、金融、生物学、物理学、企业管理等领域。
展开
-
深度学习实战93-基于BiLSTM-CRF模型的网络安全知识图谱实体识别应用
在信息时代,网络安全已成为维护国家安全、保护个人隐私和保障企业利益的重要基石。随着网络攻击手段的日益复杂多变,传统的防护措施逐渐显得力不从心。网络安全知识图谱作为一种先进的数据组织形式,通过实体、属性和关系三元组的形式描述网络空间中的各类实体及其相互作用,为网络安全分析提供了强大的支撑。它不仅能够帮助安全分析师快速理解攻击模式、追踪威胁源,还能促进知识共享,提高响应速度,从而有效提升网络安全防御的智能化水平。在自然语言处理领域,序列标注任务如命名实体识别(NER)是构建高质量知识图谱的关键技术之一。原创 2024-09-21 13:46:24 · 586 阅读 · 0 评论 -
深度学习实战92-关于多尺度深度特征融合模型的个人信用风险预测与应用
随着全球金融市场的不断扩张和互联网技术的迅猛发展,信贷业务已成为推动经济增长的关键力量之一。个人信贷产品,如消费贷款、房贷、车贷等,因能够满足不同人群的即时资金需求而日益普及。然而,信贷机构在享受市场繁荣的同时,也面临着一个核心难题:如何有效预测个人信用风险,以控制不良贷款率,确保资产质量与业务稳健。在个人信用风险预测领域,模型的评估是确保其准确性和可靠性的重要步骤。原创 2024-09-19 16:48:16 · 826 阅读 · 0 评论 -
机器学习实战23-基于手动搭建的神经网络模型对旅客上座率预测项目的研究
大家好,我是微学AI,今天给大家介绍一下机器学习实战23-基于手动搭建的神经网络模型对旅客上座率预测项目的研究。本文围绕基于神经网络模型的旅客上座率预测模型研究项目展开。首先介绍项目背景,阐述了准确预测旅客上座率的重要性。接着详细讲解了运用到的神经网络模型原理,为读者呈现其工作机制。文中给出了旅客上座率数据样例,增强了读者对实际数据的直观感受。原创 2024-09-12 19:26:10 · 1386 阅读 · 0 评论 -
深度学习实战91-利用时空特征融合模型的城市网络流量预测分析与应用
在数字化时代,城市网络流量作为衡量信息交流活跃度的关键指标,其有效管理和预测对于优化网络资源配置、提升用户体验具有重要意义。随着物联网、5G通信技术的飞速发展,城市网络流量呈现出前所未有的复杂性与动态性,这对传统的流量管理与预测方法提出了严峻挑战。本部分旨在探讨基于时空特征融合的城市网络流量预测项目的背景,分析当前预测现状,指出存在的问题,并强调时空特征融合的必要性。在当今数据驱动的时代,准确预测城市网络流量对于优化网络资源分配、提升用户体验及减少运营成本至关重要。原创 2024-09-19 08:48:53 · 738 阅读 · 0 评论 -
深度学习实战90-基于多尺度混合注意力卷积神经网络的关系抽取模型
在信息爆炸的时代,每天都有海量的文本数据产生,包括社交媒体、新闻报道、学术文献等。如何从这些非结构化或半结构化的数据中高效地提取有用信息,成为大数据时代的核心挑战之一。关系抽取作为自然语言处理(NLP)领域的一个重要分支,旨在识别文本中实体之间的语义关系,如“人-职位”、“公司-总部位置”等。这种能力对于知识图谱构建、信息检索、问答系统、智能推荐等多个应用场景至关重要。通过关系抽取,我们可以将文本中的隐含知识转化为结构化的数据形式,为后续的信息利用提供便利,极大提升数据的价值。原创 2024-09-14 14:09:49 · 529 阅读 · 0 评论 -
深度学习实战89-基于改造后的长短期记忆网络LSTM 的猪肉价格预测模型研究
大家好,我是微学AI,今天给大家介绍一下深度学习实战89-基于改造后的长短期记忆网络LSTM 的猪肉价格预测模型研究。本文围绕基于改造后的长短期记忆网络 LSTM 的猪肉价格预测模型展开研究。首先介绍项目背景,阐述进行猪肉价格预测的重要性。接着详细讲解改造后的 LSTM 模型原理,为预测提供理论基础。原创 2024-09-13 09:55:46 · 577 阅读 · 0 评论 -
深度学习实战88-基于注意力机制优化的WGAN-BiLSTM模型应用于信用卡欺诈识别方法
大家好,我是微学AI,今天给大家介绍一下本文介绍了基于注意力机制优化的WGAN-BiLSTM模型应用于信用卡欺诈识别方法。该文章详细阐述了该模型的架构,包括其独特设计及优势。展示了相关公式以深入理解其原理,同时给出了代码实现过程,便于实际应用。对所用数据集进行了全面介绍,包括其结构特点。原创 2024-09-12 14:17:58 · 874 阅读 · 0 评论 -
深度学习实战87-高中数学自适应测试系统研究与应用研发,前后台页面设计
大家好,我是微学AI ,今天给大家介绍一下深度学习实战87-高中数学自适应测试系统研究与应用研发,前后台页面设计。高中数学自适应测试系统旨在通过精准评估学生能力,用最少的题目发现其薄弱环节,并提供定制化的学习计划,帮助学生快速提升成绩。同时,系统结合了AI大模型实现自动判卷、生成报告,减轻教师负担,并支持个性化作业布置,使教学更加高效。学生可以清晰了解自身学习状态,教师也能获得精准的学生画像,实现差异化教学。原创 2024-09-10 08:49:32 · 169 阅读 · 0 评论 -
深度学习实战86-高中数学问答大模型介绍、支持将批量的latex数学公式生成pdf的过程详解
MathGPT是一个基于人工智能的高中数学教材智能问答系统,它结合了自然语言处理、数学知识图谱、机器学习模型、LaTeX和PDF生成技术等多种先进技术。实时互动:MathGPT能够实时响应学生的提问,提供详细的解答和步骤解析,模仿了传统课堂中的师生互动,但提供了更加即时和个性化的响应。个性化学习:通过分析学生的学习进度和问答记录,MathGPT能够为学生提供个性化的学习资源和练习题目,帮助他们针对性地加强薄弱环节。用户友好。原创 2024-08-26 17:28:16 · 775 阅读 · 0 评论 -
深度学习实战85-AI文本检测之识别判断是AI创作的内容还是人类创作的内容,你的论文是否是大模型生成的呢?
大家好,我是微学AI,今天给大家介绍一下深度学习实战85-AI文本检测之识别判断是AI创作的内容还是人类创作的内容,你的论文是否是大模型生成的呢?本文将基于RoBERTa模型的AI文本检测技术,旨在识别文本是否由AI生成。RoBERTa模型通过动态掩码机制、更大规模的数据集、去除NSP任务等改进,提升了模型的鲁棒性和泛化能力。原创 2024-08-12 15:58:13 · 274 阅读 · 0 评论 -
深度学习实战84-数学公式和中文混合高精度识别实战,实现数学题目以及公式识别系统(latexOCR)
本文详细介绍了数学公式识别系统的核心代码实现,不仅展示了如何利用深度学习技术解决实际问题,还深入探讨了其背后的数学原理。这一系统不仅为数学公式的学习和研究提供了便利,也为数字化时代的信息处理开辟了新的可能。未来,随着技术的不断进步,我们期待看到更多创新的应用涌现,让数学之美更加普及和易于理解。原创 2024-07-28 11:40:16 · 277 阅读 · 0 评论 -
计算机视觉的应用14-目标检测经典算法之YOLOv1-YOLOv5的模型架构与改进过程详解,便于记忆
大家好,我是微学AI,今天给大家介绍一下计算机视觉的应用14-目标检测经典算法之YOLOv1-YOLOv5的模型架构与改进过程详解,便于记忆。YOLO(You Only Look Once)是一种目标检测深度学习模型。想象一下,传统的目标检测方法就像侦探一样,需要仔细观察整个场景,逐个研究每个细节来找出目标。但YOLO却跟超级英雄一样,只需要一眼扫过整个画面,就能立即捕捉到所有的目标。YOLO可以实现如此高效的目标检测,是因为它将目标检测问题转化为了一个回归问题。它通过一个神奇的神经网络,在一次前向传播中,原创 2023-09-13 16:28:20 · 1797 阅读 · 0 评论 -
深度学习实战83-人脸检测识别技术MTCNN模型介绍与项目实战分析
MTCNN模型:一种级联卷积神经网络,专为高效人脸检测设计,包含PNet、RNet和ONet三个阶段,分别用于生成候选区域、细化边界框和最终识别。Siamese network:双流网络架构,用于计算图像间的相似度,特别适用于人脸识别和验证任务。损失函数:多种损失函数对比,如center loss用于聚类中心的优化,softmax loss用于分类,L-softmax和A-softmax则是softmax的变体,增强模型的区分能力。原创 2024-07-18 17:18:47 · 913 阅读 · 0 评论 -
大模型的实践应用25-LLama3模型模型的架构原理,以及手把手教你搭建LLama3模型
大家好,我是微学AI,今天给大家介绍一下大模型的实践应用25-LLama3模型模型的架构原理,以及手把手教你搭建LLama3模型。LLaMA 3 是Meta公司开发的最新一代大规模语言模型,其架构在很大程度上继承了LLaMA 2的设计,但对某些关键组件进行了改进和优化。原创 2024-07-06 11:14:24 · 168 阅读 · 0 评论 -
深度学习实战82-新的研究方向:大模型与图模型结合生成大型图模型,大图模型相关挑战和机遇的观点
大家好,我是微学AI,今天给大家介绍一下深度学习实战82-新的研究方向:大模型与图模型结合生成大型图模型,大图模型相关挑战和机遇的观点。随着人工智能的飞速发展,大型模型已成为人工智能领域最新的突破性成就。在图方面,大型模型尚未取得与自然语言处理和计算机视觉等其他领域相同的成功水平。为了促进大型图模型的应用,我将介绍开发大型图模型相关的挑战和机遇。原创 2024-06-28 16:40:35 · 310 阅读 · 0 评论 -
深度学习实战81-基于大模型的Chatlaw法律问答中的知识图谱融合思路,数据集说明、以及知识图谱对ChatLaw的影响介绍
大家好,我是微学AI,今天给大家介绍一下深度学习实战81-基于大模型的Chatlaw法律问答中的知识图谱融合思路,数据集说明、以及知识图谱对ChatLaw的影响介绍。基于大模型的Chatlaw法律问答系统融合了知识图谱,以提高法律咨询服务的可靠性和准确性。Chatlaw通过结合知识图谱与人工筛选,构建了一个高质量的法律数据集来训练模型。这种模型利用不同的专家来解决各种法律问题,优化了法律答复的准确性。原创 2024-06-28 15:43:07 · 339 阅读 · 0 评论 -
深度学习实战80-基于大模型的RAG新思路,构建多种RAG的应用,包括PlanRAG、RichRAG、Multi-Meta-RAG、R^2AG、InstructRAG、SynCheck.
大家好,我是微学AI,今天给大家介绍一下深度学习实战80-基于大模型的RAG新思路,构建多种RAG的应用,包括PlanRAG、RichRAG、Multi-Meta-RAG、R^2AG、InstructRAG、SynCheck、FoRAG、StackRAG Agent。这些方法都利用了自然语言处理NLP技术来增强强化学习算法的性能。原创 2024-06-25 17:39:15 · 110 阅读 · 0 评论 -
深度学习实战79-ChatTTS实现有感情有笑声的语音,本地部署运行,无法分辨是人还是机器的语音
大家好,我是微学AI,今天给大介绍一下深度学习实战79-ChatTTS实现有感情有笑声的语音,本地部署运行,难以分辨是人还是机器的语音。ChatTTS是文本转语音模型,例如LLM助手对话任务。它支持英文和中文两种语言。ChatTTS模型代码已经开源,但是很多人启动不起来,会遇到各种的问题,我将在这篇文章中给出详细代码进行实现过程,几步就可以搞定。文章的最后已经打包好的安装包,解压文件,文件中找到exe文件,需要通过管理员运行,运行完成会出现ChatTTS的界面,这时表示启动成功。原创 2024-06-11 17:34:20 · 171 阅读 · 0 评论 -
深度学习实战78-基于LSTM+CNN+注意力机制Attention模型实现某城市的空气质量分析与预测
大家好,我是微学AI,今天给大家介绍一下深度学习实战78-基于LSTM+CNN+注意力机制Attention模型实现某城市的空气质量分析与预测。 在现代城市化进程中,空气质量问题日益凸显,成为影响居民健康和城市可持续发展的重要因素。为了更有效地管理和改善空气质量,本研究提出了一种结合长短期记忆网络(LSTM)、卷积神经网络(CNN)和注意力机制(Attention)的深度学习模型,用于城市空气质量的分析与预测。原创 2024-05-16 22:28:08 · 431 阅读 · 0 评论 -
深度学习实战77-基于CNN+BiLSTM的异常用电行为的识别算法研究与实战
大家好,我是微学AI,今天给大家介绍一下深度学习实战77-基于CNN+BiLSTM的异常用电行为的识别算法研究与实战。 在智能电网的快速发展背景下,电力系统的安全稳定运行显得尤为重要。异常用电行为,如非法窃电、设备故障导致的非正常耗电等,不仅影响电网的经济效益,还可能威胁电网的安全。因此,开发一种高效准确的异常用电行为识别算法具有重要的实际意义。原创 2024-05-08 17:57:43 · 251 阅读 · 0 评论 -
深度学习实战76-基于目标检测YOLOv5模型的迁移学习使用方法,YOLOv5的原理与结构
大家好,我是微学AI,今天给大家介绍一下深度学习实战76-基于目标检测YOLOv5模型的迁移学习使用方法,YOLOv5的原理与结构。YOLOv5(You Only Look Once version 5)是一种先进的目标检测算法,基于深度学习的单阶段目标检测模型。它的主要原理是通过一次前向传播就同时预测图像中所有目标的位置和类别,大大提高了检测速度。YOLOv5继承了YOLO系列的高效性和实时性,采用了 CSPDarknet53作为基础网络结构,结合 Mish 激活函数、SPP(空间金字塔池化)。原创 2024-05-07 17:37:12 · 760 阅读 · 0 评论 -
深度学习实战75-SwinTransformer模型的算法原理与结构,并利用pytorch框架搭建
大家好,我是微学AI,今天给大家介绍一下深度学习实战75-SwinTransformer模型的算法原理与结构,并利用pytorch框架搭建。SwinTransformer是一种基于Transformer架构的新型视觉模型,它在传统的Transformer中引入了空间局部性(Swin)的概念,以解决Transformer在处理图像数据时的计算效率和性能问题。原创 2024-04-09 12:51:59 · 733 阅读 · 0 评论 -
深度学习实战74-基于Transformer的ViT模型的搭建与实际应用,ViT模型的原理介绍
大家好,我是微学AI,今天给大家介绍一下深度学习实战74-基于Transformer的ViT模型的搭建与实际应用,ViT模型的原理介绍。Vision Transformer (ViT)是一种基于Transformer架构的深度学习模型,专门用于计算机视觉任务。与传统的卷积神经网络不同,ViT将输入图像分割成固定大小的 patches,并将每个patch转化为线性嵌入向量,然后通过添加位置编码以保留空间信息。这些patch向量序列随后被送入Transformer的encoder层进行处理,其中包含自注意力机制原创 2024-04-03 11:34:43 · 334 阅读 · 0 评论 -
深度学习实战73-基于多模态CLIP模型的实战项目,CLIP模型的架构介绍与代码实现
大家好,我是微学AI,今天给大家介绍一下深度学习实战73-基于多模态CLIP模型的实战项目,CLIP模型的架构介绍与代码实现。多模态CLIP(Contrastive Language-Image Pre-training)模型是一种深度学习模型,其核心设计理念是通过大规模的对比学习训练,实现图像与文本之间的跨模态对齐和理解。该模型的独特之处在于其能够联合处理并理解图像和文本两种不同类型的输入数据,从而在多种应用场景中展现强大的性能。原创 2024-04-01 15:37:47 · 632 阅读 · 0 评论 -
深度学习实战72-图神经网络(GNN)与相关算法在线上教育领域中实际应用
大家好,我是微学AI,今天给大家介绍一下深度学习实战72-图神经网络(GNN)与相关算法在线上教育领域中实际应用。本文我们将探讨图神经网络(GNN)在职业教育领域的应用,首先明确GNN研究的背景和意义,指出其在处理复杂知识体系、学习者兴趣和课程资源方面的优势。并分析了线上教育推荐算法的研究现状,包括基于内容的推荐、协同过滤和混合推荐算法,以及图神经网络在这一领域的应用现状。原创 2024-03-25 11:21:51 · 213 阅读 · 0 评论 -
深度学习实战71-利用pytorch框架搭建VAE(变分自编码器),用于生成与训练数据相似的新数据
大家好,我是微学AI,今天给大家介绍一下深度学习实战71-利用pytorch框架搭建VAE(变分自编码器),用于生成与训练数据相似的新数据。在我的深度学习实战课程里面,还没讲到变分自编码器(Variational Auto Encoder,简称VAE),今天就给大家详细介绍一下VAE是什么?VAE是一种深度学习模型,它在无监督学习的背景下被广泛使用,特别是在生成模型中。VAE能够学习给定数据的潜在表示,并且能够基于这些潜在表示生成新的数据样本,这些样本与训练数据相似。原创 2024-03-08 16:54:58 · 437 阅读 · 0 评论 -
深度学习实战70-数学教材智能问答MathGPT模型与题目latex的pdf生成技术
大家好,我是微学AI ,今天给大家介绍一下深度学习实战70-数学教材智能问答MathGPT模型与题目latex的pdf生成技术,本文利用MathGPT数学大模型实现的数学教材智能问答系统。该系统结合了自然语言处理和数学知识图谱,能够理解用户的数学问题,并提供准确的答案和解析,随时随地请老师24小时在线回答学生的问题,以最低成本把老师请回家。此外,MathGPT还具备将问题和答案自动转化为LaTeX格式,并生成PDF文件的功能,方便用户打印和学习。原创 2024-01-29 16:54:51 · 619 阅读 · 0 评论 -
深度学习实战69-语义分割任务实战中Unet模型的搭建、结构说明与模型训练全过程
大家好,我是微学AI,今天给大家介绍一下深度学习实战69-语义分割任务实战中Unet模型的搭建、结构说明与模型训练全过程,U-Net是一种专为医学图像分割设计的卷积神经网络。它由Olaf Ronneberger等人在2015年提出,并迅速在生物医学图像分析领域获得广泛应用。U-Net模型的特点是其独特的“U”形结构,这种结构使得模型在保持高分辨率特征的同时,能够进行有效的上下文信息融合。原创 2024-01-17 16:39:46 · 658 阅读 · 0 评论 -
深度学习实战68-人脸图像的性别识别与年龄区间识别,用机器判断你的年龄
大家好,我是微学AI,今天给大家介绍一下深度学习实战68-基于FairFace模型的人脸图像的性别识别与年龄区间识别,用机器判断你的年龄,人脸图像的性别识别与年龄区间识别项目是一种计算机视觉技术,旨在通过分析人脸图像中的特征来推断人的性别和年龄区间。本文基于FairFace模型,在多个领域中有广泛的应用,包括社交媒体分析、人群统计、市场调研、人机交互等。通过准确识别人脸图像中的性别和年龄信息,该项目可以为各种应用场景提供有价值的数据分析和决策支持。原创 2023-12-19 16:49:58 · 412 阅读 · 0 评论 -
深度学习实战67-基于Stable-diffusion的图像生成应用模型的搭建,在Kaggle平台的搭建部署,解决本地没有算力资源问题
大家好,我是微学AI,今天给大家介绍一下深度学习实战67-基于Stable-diffusion的图像生成应用模型的搭建,在Kaggle平台的搭建部署,解决本地没有算力资源问题。稳定扩散模型(Stable Diffusion Model)是一种用于图像增强和去噪的计算机视觉算法。它通过对输入图像进行扩散过程来改善图像质量,使其更加清晰、平滑,并去除噪声。该模型的核心思想是在图像上应用偏微分方程,通过不断迭代更新像素值,以达到图像平滑和去噪的效果。具体来说,稳定扩散模型基于热传导方程,其中像素的变化速度取决于其原创 2023-12-15 18:54:37 · 472 阅读 · 1 评论 -
深度学习实战66-基于计算机视觉的自动驾驶技术,利用YOLOP模型实现车辆区域检测框、可行驶区域和车道线分割图
大家好,我是微学AI,今天给大家介绍一下深度学习实战65-基于计算机视觉的自动驾驶技术,利用YOLOP模型实现车辆区域检测框、可行驶区域和车道线分割图。本文我将介绍自动驾驶技术及其应用场景,并重点阐述了基于计算机视觉技术下的自动驾驶。自动驾驶技术是一种利用人工智能和计算机科学实现无人驾驶的技术,通过感知技术、定位技术、规划技术和控制技术等多个方面的技术来实现汽车的运动控制和路线规划。原创 2023-12-07 17:27:05 · 2077 阅读 · 0 评论 -
深度学习实战65-人脸检测模型LFFD的搭建,LFFD模型的架构与原理的详细介绍
大家好,我是微学AI,今天给大家介绍一下深度学习实战64-人脸检测模型LFFD的搭建,LFFD模型的架构与原理的详细介绍。LFFD(Light and Fast Face Detector)模型是一种用于人脸检测的深度学习模型,其设计旨在实现轻量级和快速的人脸检测。本文将详细介绍LFFD模型的定义、优点、原理、结构、训练过程和预测过程。原创 2023-12-07 16:02:37 · 282 阅读 · 0 评论 -
深度学习实战64-黑白照片着色的模型应用,快速部署实现黑白图片快速上色的功能
大家好,我是微学AI,今天给大家介绍一下深度学习实战64-黑白照片着色的模型应用,快速部署实现黑白图片快速上色的功能。图片上色是一个具有多模态不确定性和高度不适定性的挑战性问题。直接训练深度神经网络通常会导致错误的语义颜色和低色彩丰富度。虽然基于Transformer的方法可以提供更好的结果,但它们通常依赖于手工设计的先验知识,具有较差的泛化能力,并引入颜色渗透效应。为了解决这些问题,我们提出了DDColor,一种具有双解码器的端到端图像着色方法。我们的方法包括一个像素解码器和一个基于查询的颜色解码器。原创 2023-12-06 12:57:06 · 377 阅读 · 0 评论 -
深度学习实战63-利用自适应混合金字塔网络实现人脸皮肤美颜效果,快速部署与实现一键美颜功能
大家好,我是微学AI,今天给大家介绍一下深度学习实战63-利用自适应混合金字塔网络实现人脸皮肤美颜效果,快速部署与实现一键美颜功能。在本文中,我将介绍一种新颖的自适应混合金字塔网络(ABPN),该网络可以实现对超高分辨率照片的快速局部修饰。该网络主要由两个组件组成:一个上下文感知的局部修饰层(LRL)和一个自适应混合金字塔层(BPL)。原创 2023-12-02 12:04:01 · 323 阅读 · 0 评论 -
深度学习实战62-强化学习在简单游戏领域的应用,利用强化学习训练Agent程序的代码和步骤
大家好,我是微学AI,今天给大家介绍一下深度学习实战62-强化学习在简单游戏领域的应用,利用强化学习训练Agent程序的代码和步骤。本文介绍了如何利用强化学习构建智能体程序,而无需使用启发式算法。通过玩游戏并尝试最大化获胜率,我们可以逐渐完善Agent程序的策略。强化学习是一种机器学习方法,Agent程序通过与环境进行交互来学习最优策略,并通过奖励信号来调整行为。本文将详细介绍利用强化学习训练Agent程序的代码和步骤。原创 2023-12-01 11:27:17 · 358 阅读 · 0 评论 -
深度学习实战61-基于知识图谱与BiLSTM网络实现疾病相关智能问答系统,并支持数据扩展
大家好,我是微学AI,今天给大家介绍一下深度学习实战61-深度学习在医疗领域的应用:疾病相关智能问答系统,并支持数据扩展。本文将详细介绍如何使用Py2neo这个Python库来构建一个医疗领域知识图谱,并将数据导入Neo4j图数据库。我们将提供一些医疗领域的数据样例,并展示如何用代码实现知识图谱的创建和查询。同时,利用pytorch框架搭建BiLSTM网络实现疾病相关智能问答系统。原创 2023-11-27 14:47:28 · 365 阅读 · 0 评论 -
深度学习技巧应用30-深度学习中的GPU的基本架构原理与应用技巧
大家好,我是微学AI,今天给大家介绍一下深度学习技巧应用30-深度学习中的GPU的基本架构原理与应用技巧,GPU是一种专门用于处理大量并行操作的硬件设备,它的架构设计主要是为了图形渲染。然而,由于其并行处理能力,现在广泛应用于深度学习、科学计算等领域。主要的GPU制造商如NVIDIA和AMD,GPU(图形处理单元)的架构原理和应用技巧是一个广泛且复杂的主题,本文章将提供一个简明扼要的概述。原创 2023-11-25 15:27:40 · 798 阅读 · 1 评论 -
深度学习实战60-基于深度学习模型搭建人脸识别系统,用最简单的方式实现人脸识别。
大家好,我是微学AI,今天给大家介绍一下深度学习实战60-基于深度学习模型搭建人脸识别系统,用最简单的方式实现人脸识别。本项目是一个基于人脸识别技术的应用项目。它旨在构建一个可靠、高效的人脸识别系统,以应用于安全、身份验证和人员管理等领域。项目的核心原理包括人脸检测、对齐、编码和特征匹配。为了实现该系统,使用了face_recognition库,他是深度学习模型的人脸识别库,具有简洁易用的接口。项目的实现包括环境配置、人脸数据库构建和人脸检测与识别。在数据库构建阶段,需要收集人脸图片、进行预处理、编码和标签原创 2023-11-17 11:16:27 · 552 阅读 · 0 评论 -
深度学习实战59-NLP最核心的模型:transformer的搭建与训练过程详解,手把手搭建与跑通
大家好,我是微学AI,今天给大家介绍一下深度学习实战59-NLP最核心的模型:transformer的搭建与训练过程详解,手把手搭建与跑通。transformer是一种基于自注意力机制的深度学习模型,由Vaswani等人在2017年的论文《Attention is All You Need》中提出。它最初被设计用来处理序列到序列任务,如机器翻译,但现在已经广泛应用于各种NLP任务。下面我们将详细介绍其网络结构。原创 2023-11-14 17:11:10 · 955 阅读 · 0 评论 -
深度学习实战58-Baichuan-13B(百川大模型)搭建与模型代码详细讲解,以及复现
get_interleave(n): 这个函数用于获取插值,首先判断n是否为2的整数次幂,如果是,则直接调用_get_interleave_power_of_2(n)函数,否则,找到最接近的2的整数次幂,然后利用递归调用_get_interleave(n)函数获取插值。_fill_with_neg_inf(t): 这个函数接收一个张量作为输入,然后将其所有元素都填充为负无穷大。这个函数主要用于创建一个值全为负无穷大的张量。原创 2023-11-08 19:55:59 · 642 阅读 · 0 评论