- 博客(29)
- 收藏
- 关注
原创 一篇文章搞懂残差网络算法
残差网络是一种特殊的深度神经网络,它通过引入“残差块”(Residual Block)来允许梯度直接传播到网络的更深层。残差块通常包含一个或多个跳跃连接(Skip Connection),跳跃连接能够绕过一些层,直接将输入数据加到后面的层上。这种结构使得网络能够学习残差映射,而不是直接学习原始映射。
2024-06-22 16:03:37
288
1
原创 一篇文章搞懂动量算法
动量算法是一种在梯度下降算法基础上引入了“动量”概念的优化算法。在梯度下降算法中,模型的参数更新是通过计算当前梯度和学习率的乘积来进行的。而动量算法在此基础上引入了历史梯度的加权和,使得模型的参数更新更加平滑和稳定。
2024-06-22 15:55:21
1010
原创 一篇文章搞懂退火算法
模拟退火是一种用于求解最优化问题的算法,它通过模拟物理退火过程来找到问题的全局最优解或近似最优解。算法在搜索过程中允许接受一些较差的解,以跳出局部最优解,这称为“退火”。
2024-05-16 08:56:00
1779
原创 一篇文章搞懂机器学习算法
机器学习是一种让计算机利用数据而非显式指令来进行学习和改进的技术。它涉及计算机科学、统计学、数学和许多其他领域。机器学习算法使用统计技术分析数据,从中学习,并基于学到的知识进行预测或决策。
2024-05-16 08:46:07
862
原创 大模型在自动驾驶领域的应用
大型深度学习模型,如卷积神经网络(CNN)和递归神经网络(RNN),可以用于处理来自摄像头和传感器的图像和点云数据,以识别和跟踪这些对象。5. **端到端学习**:端到端学习是一种新兴的自动驾驶技术,它试图通过单个大型神经网络直接从传感器输入映射到车辆控制输出。6. **持续学习和适应**:由于交通环境和规则可能随时间变化,自动驾驶系统需要持续学习和适应。7. **数据挖掘与分析**:自动驾驶车辆会产生大量的数据,大型模型可以用于数据挖掘和分析,以改进系统性能,识别潜在问题,并优化维护计划。
2024-05-05 20:53:25
546
原创 如何评判一个算法的好坏,你知道吗
1. **时间复杂度**:评估算法执行所需时间的量度,通常用大O符号表示。7. **适用性**:算法是否适用于特定的应用场景和约束条件,比如实时系统、分布式系统或嵌入式系统等。5. **可读性和可维护性**:算法的实现是否容易理解,是否容易修改和扩展。3. **正确性**:算法是否能够正确地解决问题,包括是否对所有可能的输入都能给出正确的结果。8. **稳定性**:算法在多次运行时结果的稳定性,即对于相同的输入是否总是产生相同的输出。10. **灵活性**:算法是否能够适应不同的环境和参数变化。
2024-04-29 20:56:18
605
原创 一篇文章让你搞懂动态规划算法
它通过将问题分解为相对简单的子问题,并存储这些子问题的解(即重叠子问题的解),来避免计算重复的子问题,从而减少计算量。2. **多维动态规划**:这类问题的状态和多个子问题有关,通常需要用表格或矩阵来存储状态,如0-1背包问题、编辑距离问题等。1. **线性动态规划**:这类问题的状态只和相邻的子问题有关,如最长公共子序列(LCS)、最长递增子序列(LIS)等。- **最优子结构**:一个问题的最优解包含其子问题的最优解。- **边界条件**:问题的边界情况,也是递归算法的终止条件。
2024-04-29 20:52:39
278
原创 一篇文章让你搞懂联邦学习算法
联邦学习是一种机器学习设置,其中多个客户端(例如,移动设备或整个组织)协作训练模型,而不需要将数据集中存储。相反,每个客户端使用其本地的数据来训练本地模型,并通过加密的方式将模型的更新(梯度或权重)发送到服务器。服务器聚合这些更新以构建全局模型,而无需访问任何客户端的原始数据。
2024-04-28 20:29:21
618
1
原创 一篇文章告诉你什么是深度学习
深度学习是机器学习的一个子领域,它模仿了人类大脑中神经网络的工作方式,通过层次化的方式表示数据和概念。深度学习利用多层神经网络(也称为深度神经网络)来学习数据的层次表示。每一层都对前一层的输出进行更复杂的表示,通过这种方式,深度学习模型能够从原始数据中自动提取特征,并进行分类或回归。
2024-04-28 20:14:10
449
1
原创 一篇文章搞懂强化学习
强化学习是机器学习的另一个重要分支,它与监督学习和无监督学习的主要区别在于,强化学习是通过智能体(agent)与环境的交互来学习的,智能体在环境中采取行动(action),并根据行动的结果来调整自己的行为策略(policy),以最大化累积的奖励(reward)。强化学习算法可以分为基于值(valuebased)的方法和基于策略(policybased)的方法,以及模型无关(modelfree)和模型相关(modelbased)的方法。5. 奖励(Reward):对智能体行动的即时反馈,表示行动的好坏。
2024-04-27 20:38:42
767
原创 一篇文章搞懂监督学习算法
在实际应用中,需要根据具体问题来选择合适的监督学习算法,并考虑到数据的质量和数量、模型的复杂度以及计算资源等因素。监督学习是机器学习的一个重要分支,它通过训练数据集来建立一个模型,并用这个模型对新的数据进行预测。在监督学习中,每个样本都有一个对应的标签或目标值,模型通过学习这些样本来预测新样本的标签。监督学习的基本原理是通过一个训练过程,让算法从带有标签的数据中学习到特征与标签之间的关系。6. 模型部署:将训练好的模型部署到实际应用中,用于预测新数据的标签。1. 数据收集:收集大量的带有标签的数据。
2024-04-27 20:29:02
493
原创 淘金铲卷王英伟达又出王炸产品,淘金带头大哥OpenAi又是第一个免费尝鲜
H200是首款采用HBM3e内存的GPU,提供了141吉字节的内存和4.8太字节每秒的带宽,比前一代的H100 Tensor Core GPU的内存容量和带宽都有显著提升。它提供了大型共享内存空间,使得开发者能够构建超大模型。一台DGXH200里面有32块Grace Hopper超级芯片,一块3万5,那就是120万美金,195tb的显存,这显存真是大的感人,保守点一季按50美金算,差不多就是100万美金。想要不天天吃内存不足的苦,看着这19.5tb,这可是TB级的显存,想舔不好,想要,太幸福了吧!
2024-04-26 12:14:40
581
1
原创 用于物体检测的 DEtection TRansformer (DETR) 与 YOLO
然而,重要的是要认识到,DETR 的新版本(称为RT-DETR(https://arxiv.org/abs/2304.08069)或实时 DETR)于 2023 年发布,声称与所有类似规模的 YOLO 检测器相比,在速度和准确性方面都具有卓越的性能。原始论文的模型架构随着时间的推移而发生变化,通过添加不同的手工特征来提高模型的准确性。然后,具有最高置信度分数的预测被认为是“当前”预测,并且与“当前”预测具有高于特定阈值(例如,0.5)的 IoU 的具有较低置信度分数的所有其他预测被标记为冗余并且压制。
2024-04-25 15:11:06
924
1
原创 一篇文章让你搞懂什么是NLP中的句式分析
自然语言处理(NLP)中的句式分析(Syntactic Analysis),也称为句法分析,是对句子结构的分析,它旨在确定句子的语法结构以及句子中词语之间的语法关系。- 成分句法分析(Constituency Parsing):将句子分解为子句、短语和单词的过程,通常表示为树状结构,称为解析树(parse tree)。2. 词性标注(Part-of-Speech Tagging, POS Tagging):为句子中的每个词语分配一个词性(如名词、动词、形容词等)的过程。这有助于理解词语在句子中的作用。
2024-04-24 19:56:52
481
原创 大语言模型是如何进行句式分析的
1. 预训练(Pre-training):模型在大量文本数据上进行预训练,以学习语言的统计信息和模式。尽管这些模型在进行句式分析时并不生成显式的句法分析树,但它们通过在预训练阶段学习大量语言数据,能够有效地理解和生成遵循语法规则的文本。在实际应用中,如果你需要显式的句法结构,可以使用专门针对句法分析任务微调的模型,或者将大型语言模型与传统的句法分析器结合使用。这些模型在进行句式分析时,并不直接生成传统的句法分析树,而是通过训练来学习语言的模式和结构,从而能够在处理自然语言时隐式地理解句子的语法结构。
2024-04-24 18:54:13
462
原创 你知道大模型训练用到了哪些算法吗
1. 梯度下降算法(Gradient Descent):这是最基础的优化算法,用于最小化损失函数,包括批量梯度下降(Batch Gradient Descent)、随机梯度下降(Stochastic Gradient Descent, SGD)和小批量梯度下降(Minibatch Gradient Descent)。12. 数据并行和模型并行:在大模型训练中,由于模型尺寸巨大,需要采用并行技术来分布式地训练模型,包括数据并行和模型并行两种方式。这是我的个人微信,欢迎添加,找我讨论AI相关的内容。
2024-04-23 15:49:56
746
原创 你知道蚂蚁集团60k高薪的ai产品岗的一面面试题长啥样吗?
辅导的学员分享的蚂蚁集团ai产品直属领导面的面试题:1、你什么时候开始做c端方向的ai产品的?2、你认为 大模型语料采集和清洗应该注意什么?
2024-04-23 15:12:27
327
原创 揭示大模型背后的秘密:探索智能语料采集的算法世界
爬虫算法通常基于一定的种子URL,通过递归访问和解析网页内容,提取出有用的文本信息。6. 机器翻译算法:用于将采集到的多语言文本数据进行自动翻译,以统一语料库的语言。5. 数据清洗和预处理算法:用于对采集到的文本数据进行清洗和预处理,如去除噪音、分词、词性标注等。3. 文本分类算法:用于对采集到的文本数据进行自动分类,如新闻分类、情感分析等。4. 聚类算法:用于对采集到的文本数据进行自动聚类,以发现潜在的主题和类别。7. 数据去重和筛选算法:用于对采集到的文本数据进行去重和筛选,以去除重复和无用的数据。
2024-04-20 18:46:35
655
原创 你知道大语言模型内部用到了哪些数学函数吗
均方误差(MSE)是回归问题中常用的损失函数,它计算预测值与真实值之间的平方差的平均值。Softmax函数将任意实数向量转换为概率分布,它的输出是一个向量,其中每个元素都在(0,1)区间内,且所有元素之和为1。卷积运算通过在输入数据上滑动一个小的窗口(或称为卷积核),并将窗口内的元素与卷积核内的权重相乘,然后求和,以生成输出的特征图。1. 矩阵乘法:在大模型训练中,矩阵乘法用于计算神经网络中的权重与输入的乘积。在实际应用中,还可能根据模型的具体需求和数据的特性,使用其他更高级或特定的数学工具和函数。
2024-04-18 12:14:24
638
原创 如何利用大模型进行孟德尔随机化研究
在进行此类研究时,应遵循科学研究的伦理原则,确保数据的隐私和安全,并获取适当的伦理批准。同时,应考虑到数据的代表性,避免偏见,并确保研究结果的透明度和可重复性。遗传数据:获取相关遗传变异的GWAS(全基因组关联研究)数据,这些数据通常来自大型生物数据库,如UK Biobank。因果估计:应用大模型进行因果估计,例如,使用深度学习模型来估计遗传暴露与结局之间的关联,同时控制可能的混杂因素。利用大模型处理和整合不同来源和格式的数据,确保数据的一致性和可比性。解释模型的结果,并考虑可能的混杂和反向因果关系。
2024-04-18 11:52:46
436
原创 javaacript自带库用到的算法有哪些
不过,具体的算法实现可能会因浏览器厂商和版本而异。`Array.prototype.indexOf()` 和 `Array.prototype.lastIndexOf()`:同样使用线性搜索来查找数组中的特定元素。`JSON.stringify()` 和 `JSON.parse()`:这两个方法使用递归算法来处理JavaScript对象和JSON数据之间的转换。`Math` 对象中的方法,如`Math.pow()`(指数运算)、`Math.sqrt()`(平方根运算)等,背后都使用了相应的数学算法。
2024-04-17 21:16:47
302
1
原创 java语言的自带库用到的算法有哪些
HashMap`, `TreeMap`, `LinkedHashMap`, `Hashtable`: 提供不同的哈希表实现,用于键值对存储。`Collections.sort()`: 对集合进行排序,对于基本数据类型使用快速排序,对于对象使用稳定的、自适应的、迭代归并排序。`HashSet`, `TreeSet`, `LinkedHashSet`: 提供不同的集合实现,用于存储不重复的元素。`BigInteger`, `BigDecimal`: 用于高精度的数学运算。
2024-04-17 21:09:28
309
1
原创 大语言模型训练的第一步:语料采集
确定模型的目的和应用领域。例如,通用语言模型的目标可能是理解和生成多种任务和领域的文本。基于目标,确定所需的语料库类型、大小和多样性。
2024-04-15 14:19:46
2027
1
原创 浅谈数学三剑客在人工智能中的应用
线性代数主要用于文本等输入的向量化,微积分主要用于模型内部参数的调整,包括函数类型、权重、个数的调整,概率论与数理统计主要用于对比预测值和实际值,从而生成指标评价算法和模型的优劣,形成反馈,用于优化算法和模型,是一个闭环的动作.接下来我们详细说明下每个学科在人工智能领域的用途.
2024-04-15 12:21:26
2178
原创 深度学习最常用的10种算法
生成器生成数据,而判别器尝试区分生成的数据和真实数据。1. 卷积神经网络(CNN):特别适用于处理具有网格结构的数据,如图像(2D网格)和视频(3D网格)。8. 卷积神经网络(CNN):特别适用于处理具有网格结构的数据,如图像(2D网格)和视频(3D网格)。9. 变分自编码器(VAE):是自编码器的一种扩展,它通过最大化数据的边际对数似然的下界来进行训练。4. 门控循环单元(GRU):是LSTM的一种简化版本,具有更少的参数。2. 循环神经网络(RNN):能够处理序列数据,如时间序列数据、语音、文本等。
2024-04-15 11:52:57
1247
原创 你知道火爆全网、开启Ai第二春的Chatgpt大模型是怎么训练出来的吗
随着科技的发展,人工智能(AI)逐渐成为我们日常生活中不可或缺的一部分。其中,深度学习模型尤其引人注目,而“大模型”更是近年来的热门话题。但是,什么是“大模型”呢?为何它如此重要?如何研发一个大模型呢?本文将带您探索大模型的神奇世界。
2024-04-13 16:34:20
909
高效MySQL查询加速指南:索引策略、查询优化、性能调优,助力数据库管理员和开发者突破性能瓶颈
2024-05-06
MATLAB编程高效实战:涵盖核心数学、科学计算、数据可视化及算法应用,助力工程师与研究人员的必备函数代码集
2024-05-06
C语言编程实战:文件操作基础,掌握fopen、fprintf、fread、fwrite等核心函数,实现高效数据存储与检索
2024-05-06
掌握数据库核心技能:课程设计实战指南,深入解析MySQL、Oracle关键技术,助力学生轻松应对课程设计挑战
2024-05-06
Python编程基础: 掌握核心概念、语法与技巧,涵盖数据类型、控制结构、函数、模块等,适用于初学者及希望夯实基础的开发者
2024-05-06
《Python视频处理实战:moviepy加速短视频》, 知识领域:Python编程与多媒体处理, 技术关键词:Python
2024-05-05
《Python短视频字幕批量提取手册》:涵盖Python编程、moviepy、pytesseract库应用,助你高效实现视频字幕
2024-05-05
短视频MD5批量修改工具:Python编程技巧应用,文件哈希值一键快速变更,实现内容唯一性校验
2024-05-05
《Python短视频封面批量处理:ffmpeg与Pillow实战教程》, 知识领域:Python编程, 技术关键词:Python
2024-05-05
《Python文件批量重命名实战教程:os模块应用,高效办公技巧》,知识领域:Python编程,技术关键词:Python,os模
2024-05-05
esp8266wifi模块教程: 《嵌入式编程与网络通信:C语言操作ESP8266 WiFi模块》-涵盖嵌入式系统、网络编程、
2024-05-03
《Python文本挖掘实战:词频统计高效教程》-计算机科学·Python编程·文本分析·数据预处理
2024-05-03
《机器学习评估:Python混淆矩阵实战》-涵盖模型评估、分类算法,助力精准度与召回率分析,适用于数据科学和人工智能领域
2024-05-03
《机器学习实战:Python随机森林回归》-涵盖数据分析、算法应用,助力精准预测与决策,适用于金融、科研及商业领域
2024-05-03
《前端开发实践:JavaScript打造响应式滑动窗口》-涵盖交互设计、事件处理、DOM操作,助力网页交互与用户界面优化
2024-05-03
《Python气象建模:WRF集成指南》-涵盖气象学、编程与数据处理,助您高效实现天气预报与气候研究
2024-05-03
深度学习实战:Python构建卷积神经网络(CNN)图像识别教程
2024-05-03
DHT11温湿度传感器使用教程:轻松掌握环境监测关键技术
2024-05-03
《Python机器学习实战:随机森林分类器教程》,覆盖编程、机器学习、随机森林算法、分类预测等领域,适用于数据科学家、开发者、学
2024-05-03
高效C++学生成绩管理系统:教育技术+C++17编程+数据管理+教务自动化
2024-04-28
大型多领域预训练模型数据集:自然语言处理+NLP预训练+多领域数据集+语言模型优化
2024-04-25
SunO AI:AI语音合成+多语言支持+C/C++实现+x86架构优化+混合精度量化
2024-04-25
前端响应式组件:Web开发+响应式设计+数据展示与管理
2024-04-25
计算机科学+并发编程+多线程+高性能处理
2024-04-25
使用JAVA开发一个商品管理系统
2024-04-17
Python开发环境搭建+PyCharm+下载安装配置教程+入门指南
2024-04-15
数据库学习-mysql安装配置教程
2024-04-15
大模型算法学习-数学基础-线性代数篇,让你在学习大模型算法之前,打好线性代数模块的数学基础
2024-04-15
大模型算法学习指南,让你1个月入门大语言模型算法开发,一毕业就月薪10万
2024-04-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人