- 博客(322)
- 收藏
- 关注
原创 通义万相 2.1 + 蓝耘算力,AI 视频生成的梦幻组合
例如,在我生成 “在繁华都市街头举行盛大派对” 这样复杂场景的视频时,如果没有蓝耘提供的强大算力,视频生成的时间可能会成倍增加,甚至可能因为算力不足而无法完成。看到有趣之处,她嘴角不自觉上扬,眼眸里闪烁着愉悦的光芒,发出清脆的笑声,打破了房间的宁静。偶尔,她会停下滑动的手指,歪着头思考片刻,然后在评论区迅速敲下自己的想法,点击发送后,又满怀期待地等待着他人的回复,眼神中满是专注与投入。我打算生成一个 “在古老的城堡中,镜头从城堡的大门缓缓推进,穿过长长的走廊,最后停在一间摆满珍宝的房间” 的视频。
2025-05-18 23:57:23
372
原创 蓝耘元生代AIDC OS体验:用ComfyUI玩转AI抠图,免费高效实现专业级效果,快来体验吧~
通过蓝耘元生代AIDC OS + ComfyUI,我们可以免费、高效地实现专业级抠图,摆脱对PS等工具的依赖。未来,随着AI模型的优化,抠图技术将更加智能,甚至可能结合3D建模、视频编辑等更复杂的应用场景。我们拭目以待~如果你也想体验免费AI抠图,不妨试试这个方案!方案一:无代码一键部署??官网链接方案二:针对有代码能力的??GitHub资源你对AI抠图有什么看法?欢迎在评论区交流!??
2025-05-18 23:53:07
619
原创 突破网页数据集获取难题:Web Unlocker API 助力 AI 训练与微调数据集全方位解决方案
Web Unlocker API是基于Bright Data的代理基础设施开发的,具备三个关键组件:请求管理、浏览器指纹伪装和内容验证。通过这些功能,它能够自动化处理所有网页解锁操作,包括CAPTCHA验证、浏览器指纹识别、自动重试机制以及请求头和cookies的定制。当你需要抓取像亚马逊这样具有高防护的网站数据时,这些功能尤为关键。你只需发送包含目标网站的API请求,系统就会返回干净的HTML/JSON响应。
2025-05-18 23:48:19
537
原创 模拟投资大师思维:AI对冲基金开源项目详解
"ai-hedge-fund"是一个概念验证(POC)目,旨在探索使用人工智能进行股票交易决策的可能性。该项目由15个不同的 AI 智能体(Agent)成,这些智能体模拟了著名投资者的思维模式或专注于特定的金融分析领域。项目仅供教育和研究目的,不用于实际交易或投资活动。系统采用了多种大型语言模型(LLM),包括 OpenAI、Groq、Anthropic 和 Deepseek 模型,通过这些 AI 技术,系统能够分析股票数据并生成投资建议。
2025-05-18 23:43:44
653
原创 打造智能聊天体验:前端集成 DeepSeek AI 助你快速上手
基于 Vue 3 + TypeScript + Element Plus 开发的 AI 聊天助手,集成了 DeepSeek 的 API 服务。提供打字机模式和流式输出两种对话模式,支持多种 AI 模型切换。
2025-05-18 23:40:04
427
原创 开源大模型与闭源大模型
开源大模型和闭源大模型各有优缺点,适合不同的应用场景和需求。开源模型在透明性、社区协作和教育资源方面具有优势,而闭源模型则在商业化、控制和支持方面表现更佳。选择哪一种模式取决于具体的应用需求和商业目标。无论哪种模式,推动AI技术的透明和负责任发展,都是未来的关键方向。
2025-05-18 23:36:07
672
原创 如何使用服务器训练AI模型
登录网站之后,你可以根据你的自身情况来挑选合适的显卡,注意这里是按照小时进行计费的,大家要根据自己的经济水平来进行选择,另外,这个网站应该是可以进行学生认证的,认证之后应该有对应的优惠,如果小伙伴感兴趣的话可以认证一哈。大家好,这里是,之前有小伙伴反馈说自己的电脑只有cpu,没有GPU,也想要体验一下使用gpu训练模型,或者有的小伙伴反馈说自己所在的实验室提供了linux的服务器,但是不怎么会用,本期我们就来说说如何使用服务器来训练自己的模型。输入你的用户名和密码,这个时候即可登录。
2025-05-18 23:23:37
695
原创 大模型系列|垂直大模型的几种训练策略(一)
那么这个比例多少比较合适呢?但是困难的是,原有数据保持分布的采样,你拿到的模型是个黑盒,别人并没有给你原始的数据分布,更何况海涉及到了惊细的清洗。第二,在落后的显卡上去训练,需要考虑更多的分布式问题,而将来迁移到高端显卡上的时候,在老显卡上累积的经验能直接用上的不多。首先,不知道他们对金融数据是如何清洗和保证数据质量的,个人觉得他们500B的金融数据质量可能是低于500B的通用数据的质量的,这个对模型最后能力的局限有比较大的影响,通用数据和金融数据必须是用同样的标准做了高质量清洗和质量控制的。
2025-05-18 23:19:57
474
原创 大模型加速微调和训练,不得不掌握的方法,代码解析和应用示例
通过本文可以了解:LoRA模型加速原理、peft包使用、Autocust自动混合精度、Accelerate和deepspeed加速、多GPU分布式训练等大模型加速训练和微调的方法和代码应用示例。近期大模型层出不穷,大家对于大模型的微调也在跃跃欲试,像斯坦福的[1], 清华的[2],中文的[3],让我这样的普通玩家也能训练自己的微调模型。在微调和推理的时候仍然需要加速,有哪些方法可以加速微调呢?
2025-05-18 23:10:02
646
原创 人工智能大模型时代,八种常见的“数据标注”方法
你知道的数据标注都有哪些?数据标注(Data Annotations)是指对收集到的、未处理的原始数据或初级数据,包括语音、图片、文本、视频等类型的数据进行加工处理,并转换为机器可识别信息的过程。矩形框标注是一种的简单处理方式,常用于等。多边形标注是指在静态图片中,使用多边形框,标注出不规则的目标物体,相对于矩形框标注,同时对于不规则物体,也更具针对性。语义分割是指根据物体的属性,,以帮助训练图像识别模型,常应用于自动驾驶、人机交互、虚拟现实等领域。关键点标注模板最大的应用即是。
2025-05-18 23:06:04
365
原创 金融大模型到底靠不靠谱?
一个“技术问题”,导致巴菲特的伯克希尔-哈撒韦公司股价暴跌近 100%。想必很多小伙伴已经感受过了这则铺天盖地的消息,所带来的亿点点震撼。而根据事后的消息来看,这个大故障是纽交所的合并报价系统(CTA)在更新软件时出现了问题。许多专家都对此做了分析,有人认为是 CTA 软件在进行版本更新时出现了数据一致性问题;也有人提出最大的问题应该是出现在了数据库。①人工智能/大模型学习路线②AI产品经理资源合集③200本大模型PDF书籍④超详细海量大模型实战项目⑤LLM大模型系统学习教程。
2025-05-16 22:01:42
927
原创 蓝耘平台介绍:算力赋能AI创新的智算云平台
蓝耘平台凭借高性能算力、灵活的资源配置及用户友好的设计,成为AI开发者与企业的重要工具。无论是科研探索还是产业落地,其“降本提效”的核心优势显著,适合作为入门级算力平台或企业级算力解决方案。未来随着算力需求的爆发式增长,蓝耘在智算云服务领域的潜力值得期待。
2025-05-16 21:30:52
740
原创 终于有人把多模态大模型讲这么详细了
多模态大型语言模型(Multimodal Large Language Models, MLLM)的出现是建立在大型语言模型(Large Language Models, LLM)和大型视觉模型(Large Vision Models, LVM)领域不断突破的基础上的。这里给大家总结了多模态大模型的结构,训练,评估方法以及幻觉问题的解决办法,通俗易懂!!
2025-05-16 21:26:43
903
原创 深度求索(DeepSeek):以AI之力重塑医疗未来
当DeepSeek的算法开始理解细胞凋亡的数学表达,当智能体能够模拟药物在血管中的湍流扩散,我们正在见证医疗范式的根本性转变。这不是机器取代医生的故事,而是人类智慧与人工智能的共进化史诗。从三甲医院到偏远村卫生室,从新药实验室到家庭健康终端,DeepSeek持续用技术突破拓展医疗普惠的边界。在这条用代码构建生命防线的道路上,每一次算法的精进,都在为人类健康共同体增添新的希望注脚。
2025-05-16 21:21:51
746
原创 数字人技术的核心:AI与动作捕捉的双引擎驱动(210)
AI 与动作捕捉技术的深度融合,正在重构数字人的 “生命体征”。随着 5G、AR/VR 技术的普及,数字人将从单一功能载体进化为具备自主意识的虚拟生命体,成为连接物理世界与数字空间的超级入口。未来的数字人不仅是技术的集合体,更是人类情感与智慧的数字化延伸。我们正站在一个新的时代起点上,见证着数字人技术带来的变革与创新。在这个虚实共生的新纪元中,数字人将与我们的生活、工作、娱乐深度融合,创造出无限可能的未来。
2025-05-16 21:16:15
592
原创 如何搭建基于大模型的智能知识库
基于RAG与LLM的知识库作为目前最有潜力的企业端大模型应用之一,从技术角度可以看到,建设方案已经完备;从业务角度,最终的应用效果和业务价值还需要观察,并通过业务侧的反馈不断地促进建设方案的进一步优化,比如增加对多模态知识的处理能力等。让我们共同期待这类应用普及那一天的到来。
2025-05-16 21:03:34
821
原创 大模型获取embdding
以qwen为例:本文将使用 Hugging Face 的库来完成这些步骤。这是一个非常流行且功能强大的库,用于处理各种预训练语言模型。
2025-05-16 20:59:00
84
原创 大模型的快速部署与高效推理——GGUF格式模型介绍与使用教程
在人工智能领域,大型语言模型的发展日新月异,它们在自然语言处理、机器翻译、智能助手等多个领域展现出了前所未有的能力。然而,随着模型规模的不断扩大,这些庞大的神经网络模型在存储、传输和加载上面临着一系列挑战。传统的文件格式在处理这些庞大的数据集时显得力不从心,不仅效率低下,而且兼容性和扩展性也难以满足日益增长的需求。在这样的背景下,GGUF(GPT-Generated Unified Format)应运而生。
2025-05-16 20:54:29
898
原创 大模型实操 ——LoRA、QLoRA微调大模型实战技巧分享
换句话说,Adam优化器在内存中为每个模型参数存储两个附加值,即如果我们正在训练一个7B参数的模型,那使用Adam就能够在训练的过程中跟踪额外的14B参数,相当于在其他条件不变的情况下,模型的参数量翻了一番。另外,值得注意的是,我的实验中包括两个算术基准测试。在之前的实验中,采用的参数是 r=8,alpha=16,这导致了2倍的扩展。可能大家都想学习AI大模型技术,也想通过这项技能真正达到升职加薪,就业或是副业的目的,但是不知道该如何开始学习,因为网上的资料太多太杂乱了,如果不能系统的学习就相当于是白学。
2025-05-16 20:49:51
507
原创 大模型+电力预测?
自ChatGPT问世以后,大模型非常的火,不出意外的话,电力系统方向又打算搞事情了。大模型+电力任重道远。最近听说了一些关于大模型+风光功率预测、负荷预测、电价预测的想法,初步分析下,很遗憾的是,个人得出结论是不可行。简单来说,如果强行使用大模型来做电力预测,本质上可能只是一厢情愿的希望大模型去预测一个噪声罢了。
2025-05-16 20:45:15
475
原创 基于AI的智能开发环境—Trae在Web开发中的应用实战与性能评估【Trae项目实战】
Trae 是一款与 AI 深度集成的开发工具,提供智能问答、代码自动补全和基于 Agent 的 AI 自动编程能力,极大提升开发效率。它具备完备的 IDE 功能,如代码编写、项目管理和源代码管理等,同时还具备强大的 AI 助手,能够提供智能问答、实时代码建议、代码片段生成等服务。开发者可以通过自然语言与 AI 协作,从 0 到 1 开发项目,AI 会根据需求自动生成代码或创建文件。
2025-05-16 15:36:56
539
原创 免费又强大!谷歌Gemini 2.5 Pro超详细使用指南(含AI Studio设置保姆级教程)
作为谷歌最新的大模型,Gemini 2.5 Pro能力十分爆表:超强能力: 在推理、数学、科学和编码方面表现优异,尤其擅长Web开发。多模态大师: 能理解文本、图像、视频、音频甚至PDF文件!超长上下文: 支持高达100万token的输入窗口,处理海量信息不是梦。高级功能: 支持函数调用、结构化输出、联网搜索和代码执行。知识新鲜: 知识库截止到2025年1月。完全免费: 目前在AI Studio、Gemini API和Gemini官网/App中可以免费使用(有一定频率限制)。
2025-05-16 15:16:25
870
原创 什么是大模型?一图全面了解大模型,附国内外知名大模型及240余家大模型清单!
AI大模型是“大数据+大算力+强算法”结合的产物,是一种能够利用大数据和神经网络来模拟人类思维和创造力的人工智能算法。它利用海量的数据和深度学习技术来理解、生成和预测新内容,通常情况下有数百亿乃至数万亿个参数,可以在不同的领域和任务中表现出智能。
2025-05-16 15:03:12
912
原创 优云智算:借助强大镜像社区,开启AI算力新纪元!
在当今数字化时代,云计算已成为推动企业创新与发展的强大动力。它以其卓越的成本效益,为企业节省了大量硬件投资与运维成本,让资源按需分配、灵活伸缩,完美契合业务的动态需求。其高度可靠的基础设施和先进的容错机制,确保了服务的持续可用性,让企业的数据安全无忧。同时,云计算的高效部署与自动化管理,极大地提升了工作效率,让企业能够快速响应市场变化,加速数字化转型的步伐。此外,云计算平台提供的丰富应用与服务,如人工智能、大数据分析等,为企业提供了强大的技术支持,助力企业在全球范围内拓展业务,实现高效服务。
2025-05-15 23:50:40
564
原创 什么是大模型?(超详细)大模型从入门到精通,看这一篇就够了
大模型是指具有数千万甚至数亿参数的深度学习模型。近年来,随着计算机技术和大数据的快速发展,深度学习在各个领域取得了显著的成果,如自然语言处理,图片生成,工业数字化等。为了提高模型的性能,研究者们不断尝试增加模型的参数数量,从而诞生了大模型这一概念。大模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。大模型的设计目的是为了提高模型的表达能力和预测性能,能够处理更加复杂的任务和数据。大模型采用预训练+微调的训练模式,在大规模数据上进行训练后,能快速适应一系列下游任务的模型。
2025-05-15 23:47:20
725
原创 什么是AI模型训练?到底在训练什么?今天一次讲清楚!
AI模型训练实质上是利用数据驱动的方法,使人工智能系统能够从经验数据中自主学习,并针对特定任务进行高效预测、分类或内容生成。此过程的核心在于通过优化算法调整模型内部参数(例如,在神经网络中的权重和偏置),以最小化模型输出与实际目标值之间的误差或损失函数。这样做的目的是为了提高模型的泛化能力,使其在未见过的数据集上也能保持出色的性能。
2025-05-15 23:43:34
627
原创 人工智能大模型多场景应用原理解析
在上篇文章《人工智能大模型之ChatGPT原理解析》中分享了一些大模型之ChatGPT的核心原理后,收到大量读者的反馈,诸如:在了解了核心原理后想进一步了解未来的发展趋势(比如生成式人工智能和元宇宙能擦出什么样的火花?),大模型如何优化现有技术(如:如何提高图像文档识别准确率等)…近期有幸参加了中国图像图形学学会和合合信息共同举办的CSIG企业行活动,对活动中的干货自己花了一些精力进行系统性研究与整理,在此与大家共享。
2025-05-15 23:40:07
788
原创 中国人工智能大模型技术白皮书,从0入门大模型,附文档+LLM实战教程
1.1 大模型技术的发展历程 …51.2 大模型技术的生态发展 …91.3 大模型技术的风险与挑战 …118.1 协同多方合作,共同推动大模型发展 …958.2 建立大模型合规标准和评测平台 …968.3 应对大模型带来的安全性挑战 …978.4 开展大模型广泛适配,推动大模型技术栈自主可控…98大模型发展历程。
2025-05-15 23:26:48
921
原创 一文搞懂大模型最容易混淆的概念 量化、剪枝与蒸馏
大模型的量化、剪枝和蒸馏是三种常见的模型压缩技术,它们各自有不同的目标和实现方法,但。它们之间既有区别,又有联系,非常容易混淆。量化是将模型中的浮点数权重和激活值转换为低精度的整数表示(如从32位浮点数转换为8位整数)。这种转换可以显著减少模型的存储空间和计算复杂度,同时在某些硬件上加速推理过程。实现方法:1. 权重量化:将模型权重从高精度浮点数转换为低精度整数。2. 激活量化:将激活值也进行低精度表示。3. 量化感知训练(QAT):在训练过程中加入量化操作,使模型在训练时就适应低精度计算。
2025-05-15 23:23:02
714
原创 一份全面的大模型「幻觉」综述
,来自腾讯AI实验室和一些国内大学的研究团队,综述提出了LLM幻觉现象的分类法和评估基准,分析旨在减轻LLM幻觉的现有方法,并确定未来研究的潜在方向。将重点放在解决与数据相关的幻觉、与训练相关的幻觉和与推理相关的幻觉的方法上,每种方法都提供了量身定制的解决方案,以应对各自原因所固有的特定挑战。)从LLM幻觉的创新分类方法出发,深入探究了可能导致幻觉的因素,并对检测幻觉的方法和基准进行了概述。目前在LLM幻觉问题上已经有无数的研究,比如关于幻觉的检测、幻觉的评估基准分类、缓解幻觉的方法等。
2025-05-15 23:19:43
590
原创 【网安AIGC专题10.11】①代码大模型的应用:检测、修复②其安全性研究:模型窃取攻击(API和网页接口)
国内外生成式大模型研究现状总结GPT 系列模型的发展历程总结这个工作,效果肉眼可见的差hh。
2025-05-15 23:14:51
639
原创 【大模型】初识大模型(非常详细)零基础入门到精通,收藏这一篇就够了_大模型入门
大模型的定义大模型是指具有数千万甚至数亿参数的深度学习模型。近年来,随着计算机技术和大数据的快速发展,深度学习在各个领域取得了显著的成果,如自然语言处理,图片生成,工业数字化等。为了提高模型的性能,研究者们不断尝试增加模型的参数数量,从而诞生了大模型这一概念。本文讨论的大模型将以平时指向比较多的大语言模型为例来进行相关介绍。大模型的基本原理与特点大模型的原理是基于深度学习,它利用大量的数据和计算资源来训练具有大量参数的神经网络模型。通过不断地调整模型参数,使得模型能够在各种任务中取得最佳表现。
2025-05-15 23:11:17
884
原创 【TEE】可信执行环境保障大模型安全
当交换完成时,GPU 驱动程序和 SEC2 都持有相同的对称会话密钥。在大模型公有云服务方面,以百度、阿里等为代表的互联网与云服务公司,从大模型全生命周期视角出发,涵盖大模型训练、精调、推理、大模型部署、大模型运营等关键阶段面临的安全风险与业务挑战,在自有技术体系内进行深入布局,探索打造安全产品与服务。360等第三方独立的人工智能与安全科技公司,探索“以模型管理模型”方式,打造以大模型为核心的AI Agent(AI智能体),带入企业真实安全运营场景中,以“虚拟安全专家”的形象,满足企业对安全业务的需求。
2025-05-15 23:03:17
868
原创 【AIGC】baichuan-7B大模型
开源可商用的大规模预训练语言模型baichuan-7B大模型概述baichuan-7B 是由百川智能开发的一个开源可商用的大规模预训练语言模型。基于 Transformer 结构,在大约1.2万亿 tokens 上训练的70亿参数模型,支持中英双语,上下文窗口长度为4096。在标准的中文和英文权威 benchmark(C-EVAL/MMLU)上均取得同尺寸最好的效果。
2025-05-15 23:00:10
926
原创 『保姆级』大模型教程来了(从入门到实战)
2023年大西洋彼岸的OpenAi公司,AI大模型,正在构建的颠覆力,为了更好的入局AI大模型,,包含??压缩技术中,为什么量化要优于剪枝、蒸馏???如何搜索裁剪阈值用于裁剪outlier???包含有异常值outlier的特征如何量化???模型剪枝的技术背景??模型剪枝具体方法??模型剪枝前沿方法??语言模型剪枝实例??AI作画–以文生图??扩散模型是什么??扩散模型工作拓展??扩散模型带来的机遇??RLHF的优点和挑战??RLHF如何改善大模型性能??RLHF的实际应用案例??
2025-05-15 22:57:42
969
原创 PyTorch生成式人工智能实战:从零打造创意引擎
生成式人工智能 (GAI) 自ChatGPT问世以来,引发了广泛关注,并成为了技术领域的焦点。生成式人工智能技术极大的改变了我们日常生活的多个方面,开启了技术的新纪元,并激发了大量研究人员探索各种生成模型所提供的广泛可能性。例如,Midjourney已经实现了从简短的文本输入生成高分辨率、逼真图像的技术。类似地,软件公司Freshworks通过ChatGPT的强大功能,显著加速了应用程序开发,将原本需要10周时间的开发周期缩短到仅仅几天。
2025-05-15 22:55:09
794
原创 Ollama内网离线部署大模型
1、创建一个名为 Modelfile 的文件,并使用 FROM 指令,填写的模型的本地文件路径。访问huggingface下载qwen1_5-0_5b-chat-q5_k_m.gguf模型。2、在Ollama中创建模型。
2025-05-15 22:52:35
239
原创 Java SpringBoot 调用大模型 AI 构建智能应用实战指南
Spring AI是Spring框架的一个扩展,用于简化AI应用的开发。它提供了与AI大模型的集成,支持智能对话、角色预设、流式响应等功能。功能特点模型调用:通过简单的API调用,可以与各种AI大模型进行交互。提示词模板:支持定义提示词模板,方便生成高质量的文本内容。检索增强生成(RAG):结合外部数据源,实现更准确的回答。多模态支持:支持文生图、文生语音等多模态应用。适用场景智能客服:通过AI大模型生成自然语言回答,提升客服效率。写作助手:帮助用户生成文章、文案等内容。智能教育。
2025-05-15 22:49:10
759
原创 【MySQL】MySQL表的操作
这个语句创建了一个users表,其中id是自动递增的主键,username和email是非空字段,并且每个字段都有相应的注释。综上所述,这些文件的存在和它们的内容反映了MySQL数据库db1中使用MyISAM存储引擎的user表的数据和索引存储情况。假设你有一个名为employees的表,其中有一个名为salary的列,数据类型为INT。这是一个可选项,用于防止在表已经存在的情况下执行创建表的操作时出现错误。这些文件的存在和它们的内容与MySQL的存储引擎有关,特别是与MyISAM存储引擎相关。
2025-03-22 15:47:41
1502
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人