自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(343)
  • 收藏
  • 关注

原创 模拟投资大师思维:AI对冲基金开源项目详解

"ai-hedge-fund"是一个概念验证(POC)目,旨在探索使用人工智能进行股票交易决策的可能性。该项目由15个不同的 AI 智能体(Agent)成,这些智能体模拟了著名投资者的思维模式或专注于特定的金融分析领域。项目仅供教育和研究目的,不用于实际交易或投资活动。系统采用了多种大型语言模型(LLM),包括 OpenAI、Groq、Anthropic 和 Deepseek 模型,通过这些 AI 技术,系统能够分析股票数据并生成投资建议。

2025-06-05 00:04:52 662

原创 大模型获取embdding

以qwen为例:本文将使用 Hugging Face 的库来完成这些步骤。这是一个非常流行且功能强大的库,用于处理各种预训练语言模型。

2025-06-04 23:52:33 199

原创 垂直领域大模型微调实践经验最全总结

本篇从基座模型选择、模型整体架构、数据设计、训练微调四个角度总结垂直领域大模型微调经验。本篇将现有垂类大模型微调已公布的实践经验做一个全面的总结,大部分经验实测可推广,大家在自己实践过程中可以进行适当参考。下面是一个快捷目录,其中数据设计和训练微调是重点。1. 基座模型选择2. 模型整体架构3. 数据设计4. 训练微调推荐BLOOMZ模型BLOOMZ 模型系列使用了PILE语料库进行训练,该语料库包含各种医学文本,包括PubMed Central 和 PubMed Abstracts等。

2025-06-04 23:38:56 928

原创 什么是AI模型训练?到底在训练什么?今天一次讲清楚!

AI模型训练实质上是利用数据驱动的方法,使人工智能系统能够从经验数据中自主学习,并针对特定任务进行高效预测、分类或内容生成。此过程的核心在于通过优化算法调整模型内部参数(例如,在神经网络中的权重和偏置),以最小化模型输出与实际目标值之间的误差或损失函数。这样做的目的是为了提高模型的泛化能力,使其在未见过的数据集上也能保持出色的性能。

2025-06-04 23:26:16 598

原创 【拥抱AI】Xinference 详细介绍

Xinference(Xorbits Inference)是一个高性能的分布式推理框架,它能够支持大规模语言模型(Large Language Models, LLMs)、语音识别模型、多模态模型等各种人工智能模型的推理。Xinference 提供了易于使用的接口,包括Web图形用户界面(WebGUI)和RESTful API,以及命令行工具,使得用户可以轻松部署和管理模型.Xinference 是一个强大的开源语言模型框架,集成了多个大规模预训练模型,支持多种自然语言处理任务。

2025-06-04 23:13:55 761

原创 Ollama内网离线部署大模型

1、创建一个名为 Modelfile 的文件,并使用 FROM 指令,填写的模型的本地文件路径。访问huggingface下载qwen1_5-0_5b-chat-q5_k_m.gguf模型。2、在Ollama中创建模型。

2025-06-04 23:01:41 189

原创 AI革命先锋:DeepSeek与蓝耘通义万相2.1的无缝融合引领行业智能化变革

结合使用,将会发挥更强的优势。通过蓝耘平台的高效数据处理、行业解决方案与DeepSeek强大的深度学习训练能力,开发者可以在数据准备和模型训练上省去大量的繁琐步骤,直接聚焦于模型的优化与应用,极大提升了人工智能项目的开发效率和应用效果。DeepSeek的强大之处在于其深度学习框架的兼容性和丰富的模型训练功能,使得用户能够轻松构建、训练和调优复杂的深度学习模型。为了帮助非专业的用户也能使用深度学习,DeepSeek还提供了AutoML功能,自动进行模型选择、训练和优化,大大降低了深度学习技术的使用门槛。

2025-06-04 22:47:49 671

原创 2024年 AI大模型我该买一张什么显卡?

在我的文章(

2025-06-04 22:30:35 974

原创 从零到精通:详解如何训练大模型的完整指南,非常详细,收藏我这一篇就够了

尽管可以使用一些技巧方法来构造一些看起来特别平滑的指标来反对大模型涌现这个词汇,但是不可否认的事实是,在不同的尺寸变化或者数据量、计算量变化之后,人们可以非常明显地感知到大模型表现的巨大差异,这就是一个相变的结果,就像是炼制一门18连环刃的法器,从第一把的炼制到第18把,从个数的指标上来说是非常平滑的,但是从威力上来说,18把可以构建一个法阵,极大地增加了武器的威力,与之前不可同日而语。以及,另外一个可能,小模型每一层cos都小,有可能每一层在干不同的事,或者每一层都会注意到新的东西。

2025-05-22 00:11:59 600

原创 什么是大模型?一图全面了解大模型,附国内外知名大模型及240余家大模型清单!

AI大模型是“大数据+大算力+强算法”结合的产物,是一种能够利用大数据和神经网络来模拟人类思维和创造力的人工智能算法。它利用海量的数据和深度学习技术来理解、生成和预测新内容,通常情况下有数百亿乃至数万亿个参数,可以在不同的领域和任务中表现出智能。

2025-05-22 00:07:41 1006

原创 人工智能与人类社会的复杂关系:挑战与应对

本文探讨了人工智能与人类社会的复杂关系,分析了人工智能发展带来的机遇与挑战。文章重点讨论了人工智能对就业市场的影响、人口老龄化背景下的应用、社会不平等问题以及伦理和法律挑战。通过多维度分析,本文提出了应对策略,包括教育改革、社会保障体系完善、人工智能伦理框架建立和国际合作。研究表明,只有通过多方共同努力,才能实现人工智能与人类社会的和谐共处,推动社会可持续发展。关键词人工智能;人类社会;就业;老龄化;伦理;社会不平等;教育改革;社会保障。

2025-05-21 23:15:44 978

原创 一文读懂 AI

*而现在是2025年,AI已经过Word2Vec 、RNN、 HMM、Transformer、BERT、GPT……就是NLP,其中重点是听懂,而不是你说“吃饭了嘛”,计算机也说“吃饭了嘛”。:科学家们发现统计效果很好后,扩大了语料库,加入了矩阵、向量计算(这不是本文重点,但可以是下一篇)和人工设计特征(早期有,后期减少),计算机硬件发展为该阶段的提供算力支持。很难想象,没思想的计算机怎么能听懂有思想的人说的话?,上面有不同的菜肴(如自然语言处理、计算机视觉等),这些菜肴是顾客需要的服务或产品。

2025-05-21 23:11:53 628

原创 一个开源的AI数据分析工具,与数据对话,一键生成SQL、图表、表格、报告和智能商业分析。

Wren AI是一个开源的AI智能代理,让用户能够跟数据对话,实现从文本到SQL的转换,还能生成图表、电子表格、报告以及商业智能分析。它支持多种语言,能深入挖掘数据价值,提供智能数据探索功能,通过语义索引和精心设计的界面,让用户无需写代码即可获取洞察。Wren AI采用独特的架构,包含Wren UI、Wren AI Service和Wren Engine三大核心服务,可部署在本地或云端,助力团队高效、安全地解锁数据潜力。

2025-05-21 23:08:15 394

原创 【大模型微调】一文掌握7种大模型微调的方法

本篇文章深入分析了大型模型微调的基本理念和多样化技术,细致介绍了LoRA、适配器调整(Adapter Tuning)、前缀调整(Prefix Tuning)等多个微调方法。详细讨论了每一种策略的基本原则、主要优点以及适宜应用场景,使得读者可以依据特定的应用要求和计算资源限制,挑选最适合的微调方案。大型语言模型(LLM)的训练过程通常分为两大阶段:阶段一:预训练阶段在这个阶段,大型模型会在大规模的无标签数据集上接受训练,目标是使模型掌握语言的统计特征和基础知识。

2025-05-21 23:04:46 830

原创 STM32上部署AI的两个实用软件——Nanoedge AI Studio和STM32Cube AI

异常检测、单分类、多分类、预测。左上角四个模型分别对应这四种库(AD:异常检测,nC:多分类,1C:单分类,E:预测),然后下面是以前做过的一些历史工程。我这里使用8.1版本,导入什么类型的模型就选什么格式,选择STM32Cube.AI runtime,Compression代表压缩模型,如果模型过于复杂,那么根据需求选择压缩程度,Optimization是选择时间和空间的协调程度,即时间优先还是空间优先。

2025-05-21 22:51:44 901

原创 Ollama部署大模型并安装WebUi

Ollama用于在本地运行和部署大型语言模型(LLMs)的工具,可以非常方便的部署本地大模型。

2025-05-21 22:48:02 910

原创 NLP(五十九)使用FastChat部署百川大模型

本文主要介绍了如何使用FastChat来部署国产大模型——百川模型,并演示了两种部署方式——WEB部署和CLI部署,以及在部署过程中出现的问题和解决方案,希望能给读者带来启示。

2025-05-21 22:44:26 943

原创 AI大模型开发——7.百度千帆大模型调用

在AI蓬勃发展的时代,大模型平台作为支撑大规模数据处理和复杂模型训练的基石,正逐渐成为推动科技创新和产业升级的重要力量。千帆大模型平台,凭借其卓越的性能、灵活的应用和强大的生态系统,已成为众多企业和研究机构首选的大模型解决方案。千帆大模型平台是一个集数据处理、模型训练、推理部署于一体的综合性平台,它提供了丰富的算法库和工具集,支持多种深度学习框架,能够轻松应对各种复杂的数据处理和模型训练任务。平台采用分布式计算架构,能够充分利用多节点计算资源,以实现高效的大规模数据训练和推理。

2025-05-21 21:24:19 1087

原创 AI大模型ms-swift框架实战指南(四):大模型推理实践完全指南

在大模型的开发与应用中,推理环节扮演着至关重要的角色。它是将训练好的模型投入实际使用,让模型根据输入数据生成有价值输出的关键步骤。无论是智能客服为用户解答问题,还是内容创作工具自动生成文案,又或是智能助手完成各种任务,背后都离不开高效准确的推理过程。ms-swift框架作为大模型开发的得力助手,为我们提供了强大且灵活的推理功能,使我们能够轻松将大模型集成到各种应用场景中。

2025-05-21 21:21:23 585

原创 AI写代码时代,我却被这块28寸方屏显示器圈了粉!

在AI技术飞速发展的2025年,编程方式正经历着前所未有的变革。作为一个在代码堆里摸爬滚打了五年的程序员,我从未想过有一天写代码会变成 “聊天”。如今写代码早已不是从零敲一行行的苦力活了,有了AI的帮助,随便聊几句需求,就能帮我们生成代码框架、补全逻辑,甚至检测出隐藏的bug,效率简直起飞!但上周帮朋友调试祖传代码时,看着 16:9 屏幕里挤成一团的代码行,我突然意识到再强的AI也离不开一块好屏幕。虽然现在 AI 工具越来越智能,但屏幕质量直接影响着我们的工作心情和效率。

2025-05-21 21:18:27 742

原创 AI Agent调研--7种Agent框架对比!盘点国内一站式Agent搭建平台,一文说清差别!大家都在用Agent做什么?

官方GPTs商店:各大平台均设有官方GPTs应用商店,汇聚了琳琅满目的插件与模型,满足多元化需求。知识库:在知识库构建上,各平台展现独特风采,内容既广泛又深入,助力用户轻松获取所需信息。流程图编排功能作为标配,让无编程基础的用户也能通过直观拖拽,迅速构建高效工作流,实现流程自动化。对于模型支持,部分平台展现开放姿态,兼容多模型选择;而有的则专注于自家大模型深度优化,但无论哪种,均能有效支撑日常工作的顺利进行。

2025-05-21 21:14:40 587

原创 通义万相 2.1 + 蓝耘算力,AI 视频生成的梦幻组合

例如,在我生成 “在繁华都市街头举行盛大派对” 这样复杂场景的视频时,如果没有蓝耘提供的强大算力,视频生成的时间可能会成倍增加,甚至可能因为算力不足而无法完成。看到有趣之处,她嘴角不自觉上扬,眼眸里闪烁着愉悦的光芒,发出清脆的笑声,打破了房间的宁静。偶尔,她会停下滑动的手指,歪着头思考片刻,然后在评论区迅速敲下自己的想法,点击发送后,又满怀期待地等待着他人的回复,眼神中满是专注与投入。我打算生成一个 “在古老的城堡中,镜头从城堡的大门缓缓推进,穿过长长的走廊,最后停在一间摆满珍宝的房间” 的视频。

2025-05-18 23:57:23 580

原创 蓝耘元生代AIDC OS体验:用ComfyUI玩转AI抠图,免费高效实现专业级效果,快来体验吧~

通过蓝耘元生代AIDC OS + ComfyUI,我们可以免费、高效地实现专业级抠图,摆脱对PS等工具的依赖。未来,随着AI模型的优化,抠图技术将更加智能,甚至可能结合3D建模、视频编辑等更复杂的应用场景。我们拭目以待~如果你也想体验免费AI抠图,不妨试试这个方案!方案一:无代码一键部署??官网链接方案二:针对有代码能力的??GitHub资源你对AI抠图有什么看法?欢迎在评论区交流!??

2025-05-18 23:53:07 749

原创 突破网页数据集获取难题:Web Unlocker API 助力 AI 训练与微调数据集全方位解决方案

Web Unlocker API是基于Bright Data的代理基础设施开发的,具备三个关键组件:请求管理、浏览器指纹伪装和内容验证。通过这些功能,它能够自动化处理所有网页解锁操作,包括CAPTCHA验证、浏览器指纹识别、自动重试机制以及请求头和cookies的定制。当你需要抓取像亚马逊这样具有高防护的网站数据时,这些功能尤为关键。你只需发送包含目标网站的API请求,系统就会返回干净的HTML/JSON响应。

2025-05-18 23:48:19 698

原创 模拟投资大师思维:AI对冲基金开源项目详解

"ai-hedge-fund"是一个概念验证(POC)目,旨在探索使用人工智能进行股票交易决策的可能性。该项目由15个不同的 AI 智能体(Agent)成,这些智能体模拟了著名投资者的思维模式或专注于特定的金融分析领域。项目仅供教育和研究目的,不用于实际交易或投资活动。系统采用了多种大型语言模型(LLM),包括 OpenAI、Groq、Anthropic 和 Deepseek 模型,通过这些 AI 技术,系统能够分析股票数据并生成投资建议。

2025-05-18 23:43:44 939

原创 打造智能聊天体验:前端集成 DeepSeek AI 助你快速上手

基于 Vue 3 + TypeScript + Element Plus 开发的 AI 聊天助手,集成了 DeepSeek 的 API 服务。提供打字机模式和流式输出两种对话模式,支持多种 AI 模型切换。

2025-05-18 23:40:04 699

原创 开源大模型与闭源大模型

开源大模型和闭源大模型各有优缺点,适合不同的应用场景和需求。开源模型在透明性、社区协作和教育资源方面具有优势,而闭源模型则在商业化、控制和支持方面表现更佳。选择哪一种模式取决于具体的应用需求和商业目标。无论哪种模式,推动AI技术的透明和负责任发展,都是未来的关键方向。

2025-05-18 23:36:07 913

原创 如何使用服务器训练AI模型

登录网站之后,你可以根据你的自身情况来挑选合适的显卡,注意这里是按照小时进行计费的,大家要根据自己的经济水平来进行选择,另外,这个网站应该是可以进行学生认证的,认证之后应该有对应的优惠,如果小伙伴感兴趣的话可以认证一哈。大家好,这里是,之前有小伙伴反馈说自己的电脑只有cpu,没有GPU,也想要体验一下使用gpu训练模型,或者有的小伙伴反馈说自己所在的实验室提供了linux的服务器,但是不怎么会用,本期我们就来说说如何使用服务器来训练自己的模型。输入你的用户名和密码,这个时候即可登录。

2025-05-18 23:23:37 970

原创 大模型系列|垂直大模型的几种训练策略(一)

那么这个比例多少比较合适呢?但是困难的是,原有数据保持分布的采样,你拿到的模型是个黑盒,别人并没有给你原始的数据分布,更何况海涉及到了惊细的清洗。第二,在落后的显卡上去训练,需要考虑更多的分布式问题,而将来迁移到高端显卡上的时候,在老显卡上累积的经验能直接用上的不多。首先,不知道他们对金融数据是如何清洗和保证数据质量的,个人觉得他们500B的金融数据质量可能是低于500B的通用数据的质量的,这个对模型最后能力的局限有比较大的影响,通用数据和金融数据必须是用同样的标准做了高质量清洗和质量控制的。

2025-05-18 23:19:57 602

原创 大模型架构记录1

通过设计不同的 Prompt,可以将语言模型应用于各种任务,如写作、翻译、问答、代码生成等。

2025-05-18 23:15:15 640

原创 大模型加速微调和训练,不得不掌握的方法,代码解析和应用示例

通过本文可以了解:LoRA模型加速原理、peft包使用、Autocust自动混合精度、Accelerate和deepspeed加速、多GPU分布式训练等大模型加速训练和微调的方法和代码应用示例。近期大模型层出不穷,大家对于大模型的微调也在跃跃欲试,像斯坦福的[1], 清华的[2],中文的[3],让我这样的普通玩家也能训练自己的微调模型。在微调和推理的时候仍然需要加速,有哪些方法可以加速微调呢?

2025-05-18 23:10:02 852

原创 人工智能大模型时代,八种常见的“数据标注”方法

你知道的数据标注都有哪些?数据标注(Data Annotations)是指对收集到的、未处理的原始数据或初级数据,包括语音、图片、文本、视频等类型的数据进行加工处理,并转换为机器可识别信息的过程。矩形框标注是一种的简单处理方式,常用于等。多边形标注是指在静态图片中,使用多边形框,标注出不规则的目标物体,相对于矩形框标注,同时对于不规则物体,也更具针对性。语义分割是指根据物体的属性,,以帮助训练图像识别模型,常应用于自动驾驶、人机交互、虚拟现实等领域。关键点标注模板最大的应用即是。

2025-05-18 23:06:04 607

原创 金融大模型到底靠不靠谱?

一个“技术问题”,导致巴菲特的伯克希尔-哈撒韦公司股价暴跌近 100%。想必很多小伙伴已经感受过了这则铺天盖地的消息,所带来的亿点点震撼。而根据事后的消息来看,这个大故障是纽交所的合并报价系统(CTA)在更新软件时出现了问题。许多专家都对此做了分析,有人认为是 CTA 软件在进行版本更新时出现了数据一致性问题;也有人提出最大的问题应该是出现在了数据库。①人工智能/大模型学习路线②AI产品经理资源合集③200本大模型PDF书籍④超详细海量大模型实战项目⑤LLM大模型系统学习教程。

2025-05-16 22:01:42 934

原创 蓝耘平台介绍:算力赋能AI创新的智算云平台

蓝耘平台凭借高性能算力、灵活的资源配置及用户友好的设计,成为AI开发者与企业的重要工具。无论是科研探索还是产业落地,其“降本提效”的核心优势显著,适合作为入门级算力平台或企业级算力解决方案。未来随着算力需求的爆发式增长,蓝耘在智算云服务领域的潜力值得期待。

2025-05-16 21:30:52 766

原创 终于有人把多模态大模型讲这么详细了

多模态大型语言模型(Multimodal Large Language Models, MLLM)的出现是建立在大型语言模型(Large Language Models, LLM)和大型视觉模型(Large Vision Models, LVM)领域不断突破的基础上的。这里给大家总结了多模态大模型的结构,训练,评估方法以及幻觉问题的解决办法,通俗易懂!!

2025-05-16 21:26:43 911

原创 深度求索(DeepSeek):以AI之力重塑医疗未来

当DeepSeek的算法开始理解细胞凋亡的数学表达,当智能体能够模拟药物在血管中的湍流扩散,我们正在见证医疗范式的根本性转变。这不是机器取代医生的故事,而是人类智慧与人工智能的共进化史诗。从三甲医院到偏远村卫生室,从新药实验室到家庭健康终端,DeepSeek持续用技术突破拓展医疗普惠的边界。在这条用代码构建生命防线的道路上,每一次算法的精进,都在为人类健康共同体增添新的希望注脚。

2025-05-16 21:21:51 754

原创 数字人技术的核心:AI与动作捕捉的双引擎驱动(210)

AI 与动作捕捉技术的深度融合,正在重构数字人的 “生命体征”。随着 5G、AR/VR 技术的普及,数字人将从单一功能载体进化为具备自主意识的虚拟生命体,成为连接物理世界与数字空间的超级入口。未来的数字人不仅是技术的集合体,更是人类情感与智慧的数字化延伸。我们正站在一个新的时代起点上,见证着数字人技术带来的变革与创新。在这个虚实共生的新纪元中,数字人将与我们的生活、工作、娱乐深度融合,创造出无限可能的未来。

2025-05-16 21:16:15 606

原创 如何搭建基于大模型的智能知识库

基于RAG与LLM的知识库作为目前最有潜力的企业端大模型应用之一,从技术角度可以看到,建设方案已经完备;从业务角度,最终的应用效果和业务价值还需要观察,并通过业务侧的反馈不断地促进建设方案的进一步优化,比如增加对多模态知识的处理能力等。让我们共同期待这类应用普及那一天的到来。

2025-05-16 21:03:34 831

原创 大模型获取embdding

以qwen为例:本文将使用 Hugging Face 的库来完成这些步骤。这是一个非常流行且功能强大的库,用于处理各种预训练语言模型。

2025-05-16 20:59:00 109

原创 大模型的快速部署与高效推理——GGUF格式模型介绍与使用教程

在人工智能领域,大型语言模型的发展日新月异,它们在自然语言处理、机器翻译、智能助手等多个领域展现出了前所未有的能力。然而,随着模型规模的不断扩大,这些庞大的神经网络模型在存储、传输和加载上面临着一系列挑战。传统的文件格式在处理这些庞大的数据集时显得力不从心,不仅效率低下,而且兼容性和扩展性也难以满足日益增长的需求。在这样的背景下,GGUF(GPT-Generated Unified Format)应运而生。

2025-05-16 20:54:29 921

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除