- 博客(104691)
- 资源 (6)
- 收藏
- 关注
原创 【AI大模型应用开发实战】逐步推导反向传播计算原理 Backpropagation step by step
不过,输出层的大小将为 10,因为我们有从 0 到 9 的 10 个可能的标签。当训练网络时,我们输入一个数字为零的图像,我们希望第一个神经元值接近于尽可能接近 1,其余尽可能接近 0。在我们的玩具网络中,我们只有一组权重。由于权重均为正,并且输入本身为正,因此神经元的结果也为正,在这种情况下,RELU 是恒等函数。简而言之,反向传播计算梯度下降以最小化成本函数,但由于神经网络中层的排列方式使它们成为复合函数,反向传播只不过是计算链式法则后的链式法则以获得导数的值成本函数相对于网络各层深处的权重。
2024-03-21 00:19:34 1278
原创 【AI大模型应用开发实战】神经网络核心算法原理与学习过程
随着计算机技术的飞速发展,人工智能逐渐成为了当今科技领域的热门话题。人工智能旨在让计算机能够模拟人类的思维方式,从而实现智能化的决策和行为。在这个过程中,神经网络作为一种模拟人脑神经元连接的计算模型,成为了实现人工智能的关键技术之一。yfw⋅xbyfw⋅xbE12∑i1nyi−ti2E21∑i1nyi−ti2反向传播:δiLyi−tif′ziLδiLyi−ti。
2024-03-19 18:01:05 1181 6
原创 【模型精调LoRA】LoRA 低秩适应微调的工作原理和代码实现示例 What is LoRA? Low-Rank Adaptation for finetuning LLMs EXPLAINED
LoRA 是一种有效的大模型微调技术,可以提高推理效率并保持良好的性能。LoRA 在许多下游任务中都取得了良好的效果,包括文本分类、机器翻译和问答。
2024-03-11 12:59:38 1211
原创 【ChatGPT模型精调训练】AI 大模型精调 Fine-Tuning (微调)训练图文代码实战详解
选择预训练模型:选择一个在类似任务上已经训练好的模型作为起点。数据准备:准备并预处理你的数据集,使其适合模型的输入格式。微调:在你的特定数据集上继续训练模型,调整模型的权重。评估:评估微调后模型的性能。应用:将微调后的模型部署到实际应用中。Fine-Tuning(精调)是指在预训练模型的基础上,对模型进行微调,使其适应特定任务。预训练模型通常在大量无标签数据上进行训练,以学习通用的语言表示。通过 Fine-Tuning,我们可以在较小的标签数据集上训练模型,以便模型能够更好地解决特定任务。
2024-03-09 11:39:09 807 1
原创 模型架构选择:从传统NLP到Transformer
自然语言处理(NLP)是人工智能的重要分支,旨在使计算机能够理解、解释和生成人类语言。随着互联网的发展和数据量的激增,NLP技术在文本分类、机器翻译、情感分析、问答系统等多个领域得到了广泛应用。然而,NLP任务的复杂性和多样性对模型架构提出了巨大挑战。传统的NLP模型架构,如基于规则的方法、统计模型、词袋模型等,虽然在早期取得了一定的成果,但随着数据规模和任务复杂度的增加,这些方法逐渐暴露出其局限性。为了应对这些挑战,研究人员不断探索新的模型架构,从传统的RNN、CNN,到近年来备受瞩目的Transform
2024-03-02 11:23:32 125
原创 问答推荐系统的设计与实现
在当今信息爆炸的时代,用户面临着海量的数据和知识,如何快速准确地获取所需信息成为一个巨大的挑战。问答推荐系统作为一种智能化的信息服务工具,旨在解决这一问题。它结合了问答系统的精准性和推荐系统的个性化特点,为用户提供高质量、定制化的信息服务。问答推荐系统的出现不仅改变了传统的信息获取方式,还推动了人工智能、自然语言处理和机器学习等技术的发展。从早期的基于规则的问答系统,到如今的基于深度学习的智能问答推荐系统,这一领域经历了巨大的变革。
2024-02-07 11:22:01 136
原创 第二章:AI大模型的基础知识2.1 机器学习与深度学习基础2.1.3 神经网络的基本结构
自从人工智能(AI)成为可能的研究领域以来,研究人员一直在尝试模拟生物神经网络中的行为,从而产生可编程的计算机系统。人类大脑中的神经元被认为是执行计算的基本单位,这些单位以非常高效的方式组合在一起,形成复杂的网络来处理信息。自然界中的生物神经网络已经存在数百万年,并且已经演变成了一种非常强大和高效的信息处理系统。因此,模仿生物神经网络并将其应用到计算机系统中可能是一个重大飞跃。人工神经网络(ANN)是一种由简单的处理单元(neurons)组成的网络,它们是通过可训练的连接相互连接的。
2024-02-01 15:00:57 258
原创 AI大模型应用入门实战与进阶:构建你的第一个大模型:实战指南
AI大模型是指具有大量参数和复杂结构的人工智能模型。这些模型通常需要大量的计算资源和数据来进行训练,以实现高性能的预测和生成能力。近年来,随着计算能力的提高和数据量的增加,AI大模型在各种任务中取得了显著的成果,如自然语言处理、计算机视觉和强化学习等。模型压缩与加速:随着模型规模的增加,计算资源和存储需求也在不断增加。未来的研究需要关注如何压缩和加速大模型,以适应更多的应用场景。数据效率与迁移学习:当前的大模型通常需要大量的数据和计算资源进行训练。
2024-01-28 03:18:50 1399 1
原创 【ChatGPT核心原理实战】《提示工程指南》 | Prompt Engineering Guide
提示工程是一个较新的学科,应用于开发和优化提示词(Prompt),帮助用户有效地将语言模型用于各种应用场景和研究领域。掌握了提示工程相关技能将有助于用户更好地了解大型语言模型的能力和局限性。研究人员可利用提示工程来提高大语言模型处理复杂任务场景的能力,如问答和算术推理能力。开发人员可通过提示工程设计和研发出强大的技术,实现和大语言模型或其他生态工具的高效接轨。本指南介绍了提示词相关的基础知识,帮助用户了解如何通过提示词和大语言模型进行交互并提供指导建议。
2024-01-05 01:17:04 1145 1
原创 凸优化与Hessian矩阵:理解算法的核心
在现代科学和工程领域中,优化问题无处不在。从机器学习算法的训练到金融市场的投资决策,从物理系统的能量最小化到工程设计的性能最大化,优化方法在各个领域都扮演着至关重要的角色。其中,凸优化因其独特的性质和广泛的应用,成为了优化理论中最重要的分支之一。凸优化问题具有良好的数学性质,通常可以保证找到全局最优解。这使得凸优化成为许多实际问题的首选建模方法。然而,要高效地解决凸优化问题,我们需要深入理解其背后的数学原理,特别是Hessian矩阵的作用。Hessian矩阵作为函数二阶导数的表示,为我们提供了关于函数局部曲
2023-12-25 01:01:22 385 2
原创 【AI写作】怎样使用AI写作每天赚钱?——文本生成的艺术《AI写作的未来》使用 AI 写作和每天产生被动收入的终极指南
在当今数字时代,内容创作已成为一种极具潜力的赚钱方式。随着人工智能技术的飞速发展,AI写作工具的出现为内容创作者提供了前所未有的机遇。这些工具不仅能够提高写作效率,还能帮助创作者生产高质量、多样化的内容,从而实现每天稳定的被动收入。本文将深入探讨如何利用AI写作工具来创造持续的收入流,为读者提供一个全面的指南。AI写作工具主要基于自然语言处理(NLP)和机器学习技术。文本生成:使用深度学习模型(如GPT系列)生成连贯、流畅的文本。语义理解:分析输入的提示或主题,理解上下文和意图。
2023-12-25 00:53:02 58
原创 【ChatGPT核心原理实战】手动求解 Transformer:分步数学示例 | Solving Transformer by Hand: A Step-by-Step Math Example
手动求解 Transformer:分步数学示例Understanding Transformers: A Step-by-Step Math Example — Part 1了解 Transformer:分步数学示例 — 第 1 部分I understand that the transformer architecture may seem scary, and you might have encountered various explanations on…我知道变压器架构可能看起来很可怕,并且
2023-12-22 02:23:09 2988 6
原创 AI架构师必知必会系列:强化学习在金融领域的应用
在金融领域,如何制定最优决策以实现收益最大化和风险最小化一直是一个核心问题。传统的金融决策方法主要依赖于统计模型和专家经验,但在面对日益复杂多变的金融市场时,这些方法往往难以适应和优化。近年来,随着人工智能技术的快速发展,强化学习作为一种智能决策方法受到了金融领域的广泛关注。
2023-12-05 01:14:23 303
原创 AI Maas人工智能大模型即服务时代:大模型即服务的未来发展系列
随着人工智能技术的不断发展,尤其是自然语言处理(NLP)、计算机视觉(CV)等领域的突破性进展,人工智能大模型即服务(AI Maas)正在成为行业的热点和未来发展趋势。AI Maas是指通过云计算、大数据等技术手段,将预训练好的海量人工智能大模型以服务化的方式提供给企业和个人用户使用,用户无需关注底层技术实现,只需要通过API接口就可以方便快捷地使用人工智能的能力,极大降低了人工智能应用开发的门槛和成本。
2023-11-04 03:03:35 509
原创 人工智能大模型技术基础系列之:分布式模型存储与加载
随着人工智能技术的快速发展,大规模语言模型(Large Language Models, LLMs)如GPT-3、BERT、T5等在自然语言处理领域取得了突破性进展。这些模型通常包含数十亿甚至上千亿个参数,为了有效地存储、加载和推理如此庞大的模型,分布式技术成为了不可或缺的解决方案。本文将深入探讨大模型分布式存储与加载的核心技术,包括模型并行、张量并行、流水线并行等关键概念,以及它们在实际应用中的实现方法和优化策略。
2023-11-01 02:41:00 257
原创 芯片 Chip 制造技术之:深紫外光刻 Lithography 与极紫外 Lithography 光刻
在当今数字时代,芯片已成为现代电子设备的核心组件,支撑着从智能手机到超级计算机的各种应用。芯片制造技术的进步直接影响着电子产品的性能、功耗和成本。其中,光刻技术作为芯片制造的关键环节,一直是半导体行业研究和投资的重点领域。光刻技术的本质是利用光学成像原理,将集成电路设计图形通过光学系统投影到涂有光刻胶的晶圆上,从而实现纳米级精度的图形转移。随着摩尔定律的不断推进,传统光刻技术面临着分辨率极限的挑战。
2023-09-24 01:58:10 2346 7
原创 以贝叶斯网络进行股票价格预测 Stock Price Prediction based on Bayesia Network
在当今瞬息万变的金融市场中,准确预测股票价格一直是投资者、分析师和研究人员的终极目标。传统的股票预测方法,如技术分析和基本面分析,虽然广泛应用,但往往难以应对市场的高度不确定性和复杂性。近年来,随着人工智能和机器学习技术的快速发展,一种基于概率图模型的方法——贝叶斯网络(Bayesian Networks)在股票价格预测领域展现出了巨大的潜力。贝叶斯网络作为一种强大的概率推理工具,能够有效地处理不确定性和复杂依赖关系,这恰恰是股票市场的典型特征。
2023-08-31 11:40:07 1044 7
原创 CMGAN 跨模式异构图注意网络统一多模式理解和预测人类移动系统
随着移动互联网、物联网和边缘计算等新兴技术的不断涌现,如何使得人类的移动生活更加便捷、高效地满足需求已经成为越来越多企业和开发者关注的重点。在这样的背景下,统一多模式理解(UAM)和预测性行为(Predictive Behavior)等概念及技术也逐渐被提出,并得到越来越多应用。而在这个过程中,如何能够把不同形式的数据集成到统一的“个人行为”数据模型中,从而形成一个“通用意识”,并对该“通用意识”做出准确的预测,成为当前人类移动预测领域的热门研究课题之一。
2023-08-31 11:30:11 451 9
原创 基于机器学习(Machine Learning)的图像识别技术基本概念、术语、算法原理
在当今数字化时代,图像识别技术已经成为人工智能和计算机视觉领域中最重要的研究方向之一。随着机器学习,特别是深度学习技术的快速发展,基于机器学习的图像识别技术取得了突破性进展,在各个领域都有广泛的应用。从自动驾驶汽车识别路况,到医疗影像分析辅助诊断,再到安防系统中的人脸识别,图像识别技术正在改变我们的生活方式和工作方式。本文将深入探讨基于机器学习的图像识别技术,包括其基本概念、关键术语、核心算法原理以及实际应用。
2023-08-03 02:30:37 1917 9
原创 【AI大模型企业级应用开发实战】企业级应用集成AI大模型的架构,包括大模型概述、集成实践、技术架构设计及应用场景《AI大模型应用架构(ALLMA)白皮书》
随着大模型浪潮的兴起,生产力将发生质的变化,从而引发生产力和生产关系的重塑。随着模型能力的提升和使用成本的降低,基于大模型构建应用将成为主流趋势。然而,应用层能否与大模型高效交互,将成为产品方案探索效率和效果的关键因素。因此,在模型之上的工程架构中,必须构建一套完整的大模型交互管道(Interface),将应用层(Application) 和模型层(Model)进行串联,为诸如Prompt Engineering、Fine-Tuning和模型评估等关键环节提供全面支持,以实现产品方案探索的降本增效 ....
2023-06-30 03:08:09 9227 35
原创 【AI写作】怎样使用AI写作每天赚钱?—— 使用 AI 写作和每天产生被动收入的终极指南
关键词:人工智能写作,人工智能文案,内容生成软件,自动化写作工具,人工智能赚钱人工智能写作是利用人工智能技术为各种目的生成内容。人工智能文案通常涉及使用自动写作工具或内容生成软件,这些软件使用自然语言处理和机器学习算法来创建人类可读且准确的内容。人工智能写作可用于生成博客文章、文章、网络副本、新闻稿以及其他类型的内容。人工智能写作还可用于制作广告、营销文案和其他类型的文案。人工智能写作可以通过自动创建内容来帮助公司节省时间和金钱。公司可以用AI写作快速准确地生成内容。
2023-03-17 21:50:17 26935 1
原创 十年技术进阶路:让我明白了三件要事。关于如何做好技术 Team Leader?如何提升管理业务技术水平?
如何做好技术 Team Leader?导读:作为一个技术TL(Team Leader),除了自身技能,还会面临诸多团队管理上的困难和挑战。如何定义和明确团队的目标?怎样建立优秀的工程文化?让团队长期发挥战斗力和创新能力的核心是什么?曾子曰:吾日三省吾身,反思是人类进化出来的一项异常宝贵的能力。一 招聘第一原则:宁缺毋滥。以下一些方面,基本上是缺一不可:coding 能力对技术的热情能简明扼要地沟...
2022-10-29 10:31:09 9280 10
原创 Deep QNetworks (DQN)原理与代码实例讲解
以下是《Deep Q-Networks (DQN)原理与代码实例讲解》这篇技术博客文章的正文部分:Deep Q-Networks (DQN)原理与代码实例讲解1. 背景介绍1.1 问题的由来在传统的
2024-09-21 03:17:50 150
原创 长短期记忆网络 (Long ShortTerm Memory)
长短期记忆网络 (Long Short-Term Memory)关键词:长短期记忆网络, LSTM, 循环神经网络, 梯度消失, 梯度爆炸, 门控机制, 时序数据1. 背景介绍1.1 问题的由来
2024-09-21 03:14:00
原创 AI人工智能代理工作流AI Agent WorkFlow:AI代理性能监控指标与分析技术
AI人工智能代理工作流AI Agent WorkFlow:AI代理性能监控指标与分析技术作者:禅与计算机程序设计艺术 / Zen and the Art of Computer Programming关键词:AI代理、工作流、性能监控、指标体系、分析技术
2024-09-21 03:12:40 58
原创 Hive原理与代码实例讲解
1. 背景介绍1.1 问题的由来随着数据量的爆炸式增长,传统的数据处理方式已经无法满足现代企业对数据处理的需求。在这种背景下,Hive应运而生。Hive是一个基于Hadoop的数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,可以将SQL语句转换为MapReduce任
2024-09-21 03:07:46 191
原创 KMeans 聚类 (KMeans Clustering)
K-Means 聚类 (K-Means Clustering)关键词:K-Means聚类算法分群分析无监督学习数据分割
2024-09-21 03:04:43 25
原创 AI 深度神经网络计算艺术之道
关键词:深度神经网络,计算艺术,AI,算法原理,数学模型,代码实例,实际应用场景,工具和资源1. 背景介绍1.1 问题的由来人类一直以来都在尝试模拟大脑的工作方式。早在1943年
2024-09-21 03:03:36 211
原创 Decision Trees 原理与代码实战案例讲解
Decision Trees 原理与代码实战案例讲解关键词:1. 背景介绍1.1 问题的由来决策树(Decision Tree)作为机器学习领域的一种基础算法,主要用于解决分类和回归问题。随着大数据时代
2024-09-21 03:02:47 275
原创 YOLOv3原理与代码实例讲解
YOLOv3原理与代码实例讲解关键词:1. 背景介绍1.1 问题的由来随着计算机视觉技术的迅速发展,物体检测成为了一个重要的研究领域,旨在自动识别图像或视频中的物体。在过去的几十年里,物体检测技术经历了从基于规则的系统到基于
2024-09-20 13:05:12 527
原创 Transformer大模型实战 语言相似性的影响
Transformer大模型实战:语言相似性的影响关键词:Transformer:一种用于自然语言处理任务的深度学习架构,尤其擅长处理序列数据,如文本翻译、问答、文本生成等。语言相似性
2024-09-20 13:00:33 549
原创 Transformer大模型实战 SentenceBERT模型和特定领域的BERT 模型
Transformer大模型实战:Sentence-BERT模型和特定领域的BERT模型关键词:Transformer大模型Sentence-BERT模型特定领域的BERT模型
2024-09-20 12:58:24 613
原创 Text Generation原理与代码实例讲解
Text Generation原理与代码实例讲解关键词:文本生成、神经网络、生成模型、深度学习、语言模型、自回归生成、注意力机制、双向生成、强化学习、变分自编码器、生成对抗网络、序列到序列模型、循环神经网络、长短时记忆网络、Transformer、多模态生成、文本风格转换、文本摘要、对话生成、故事创作、诗歌生成、
2024-09-20 12:54:44 579
原创 Spark Streaming原理与代码实例讲解
Spark Streaming原理与代码实例讲解关键词:Apache SparkSpark Streaming数据流处理基于事件的处理时间窗口聚合持续查询
2024-09-20 12:52:44 770
原创 职业规划方案:在AI大模型与电商领域的职业发展路径——资深程序员创立一个 一个人的公司,实现财富自由 具体详尽的可落地的计划和执行步骤
创业是一条充满挑战但也充满机会的道路,作为一名资深程序员,您拥有丰富的技术背景和行业经验,这将成为您创业的重要优势。以下是一个具体详尽的可落地的计划和执行步骤,帮助您创立一个“一人公司”,实现财富自由。通过制定明确的短、中、长期目标,并细化到具体的行动计划和测量指标,您可以逐步提升自身的专业能力、管理能力和行业影响力。目标:成为AI与电商领域的资深专家或创业者,引领行业发展,具备战略视野和领导力。选择AI大模型与电商业务的交叉领域,如推荐系统、智能客服等,深入研究。
2024-09-20 12:48:19 198
原创 从零开始大模型开发与微调:站在巨人肩膀上的预训练模型BERT
从零开始大模型开发与微调:站在巨人肩膀上的预训练模型BERT1. 背景介绍1.1 问题的由来随着深度学习技术的飞速发展,预训练模型成为了自然语言处理(NLP)领域的一股强大力量。BERT(Bidirection
2024-09-20 12:46:21 421
原创 transformer 原理与代码实例讲解
Transformer 原理与代码实例讲解关键词:自注意力机制(Self-Attention)多头注意力(Multi-Head Attention)前馈神经网络(Feed-forward Neural Network)
2024-09-20 12:41:27 720
原创 Robotics and Control Systems 原理与代码实战案例讲解
Robotics and Control Systems 原理与代码实战案例讲解关键词:机器人技术控制理论
2024-09-20 12:36:46 843
原创 从RAG到Agent的转变:工具接口:与外部环境进行交互,使用工具来辅助任务执行
从RAG到Agent的转变:工具接口:与外部环境进行交互,使用工具来辅助任务执行1. 背景介绍1.1 问题的由来在当今的自动化和智能化时代,任务执行方式正经历着深刻的变革。从基于规则的专家系
2024-09-20 12:33:54 897
ClickHouse 高性能、可扩展和低成本的OLAP数据库 陈光剑 20230912
2023-09-14
Will AI Fix Work? 工作节奏超过了我们的跟上能力 人工智能有望创造一种全新的工作方式
2023-05-17
THE AI INDEX REPORT 人工智能指数报告 Measuring trends in Artificial Inte
2023-04-06
Kotlin Coroutines by Tutorials (1st Edition)
2021-04-28
Principles of programming languages by Gilles Dowek (auth.) (z-lib.org).pdf
2021-04-28
A Brief History of Artificial Intelligence
2021-04-28
An introduction to functional programming through lambda calculus.PDF.zip
2019-09-22
《Kotlin项目实战开发》第3章+类型系统与可空类型
2017-09-30
2024 年可以实现 AGI 吗?
2024-01-02
TA创建的收藏夹 TA关注的收藏夹
TA关注的人