自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(180)
  • 资源 (3)
  • 收藏
  • 关注

原创 【AI推理部署】服务化部署篇01—FastAPI

FastAPI是一个基于Python 3.6+的高性能异步Web框架,具有编码快、Bug少、直观简单等特点。它基于Pydantic进行数据验证,Starlette处理异步请求,Uvicorn作为ASGI服务器。快速创建应用时,使用@app.get装饰器定义路由,支持路径参数和查询参数,并自动生成交互式API文档。安装只需pip install fastapi,运行命令uvicorn main:app --reload启动开发服务器。FastAPI兼容同步和异步模式,简化了Web API开发流程。

2025-09-14 11:57:24 904

原创 【AI推理部署】Docker篇03—Docker容器和镜像操作

本文总结了Docker镜像和容器的主要操作命令。镜像操作包括查看、搜索、下载、运行、删除、保存和加载镜像的命令示例。容器操作则涵盖查看、启动/停止、删除、进入容器以及容器导出/导入等常用命令,并对比了attach和exec两种进入容器方式的区别。文中提供了详细的命令语法和参数说明,如docker images查看镜像、docker run运行容器、docker rm删除容器等,帮助用户快速掌握Docker的基本操作。

2025-09-14 10:41:58 108

原创 【项目】多模态RAG—本地部署MinerU实现多类文档解析

【摘要】开源工具MinerU由OpenDataLab团队开发,支持本地部署实现多类文档(PDF/Word/Excel/图片等)解析,可保留原始格式并转换为Markdown/JSON。该工具具备OCR识别、表格/公式转换、多语言支持等功能,适用于RAG、文档数字化等场景。项目通过API服务实现政策文件解析需求,将附件转为Markdown后再生成HTML展示,解决了政务问答系统中格式丢失问题。安装部署包含模型下载和Python服务端搭建,提供RESTful接口供其他系统调用。

2025-09-01 23:22:59 867

原创 【项目】多模态RAG必备神器—olmOCR重塑PDF文本提取格局

olmOCR是一款开源Python工具包,专为解决PDF文本提取难题而设计。它通过文档锚定技术和微调7B视觉语言模型两大核心技术,能高效转换复杂PDF为结构化文本,保留自然阅读顺序,并精准识别表格、公式等元素。相比传统OCR工具,olmOCR在学术文献数字化、企业文档处理等场景中展现显著优势:处理速度快数倍,准确率达95%以上,且成本仅为GPT-4o API的1/32。支持GPU加速和集群部署,用户可通过简单安装步骤实现本地或大规模PDF处理。

2025-09-01 22:50:33 964

原创 【AIGC】大模型面试高频考点17-常见的8种参数高效微调策略(PEFT)

本文介绍了大模型微调中的8种常见策略:LoRA(低秩适应)、QLoRA(量化LoRA)、Adapter Tuning(适配器调优)、Prefix Tuning(前缀调优)、Prompt Tuning(提示调优)、P-Tuning及v2版本,以及LoRA+MOE混合方法。这些技术通过参数高效微调(PEFT)显著降低计算成本,适用于不同应用场景。配图直观展示了各类方法的架构特点,为面试准备和技术选型提供了实用参考。

2025-08-26 11:53:51 486

原创 【AGI】全球多模态模型开源新标杆-GLM-4.5V

智谱推出新一代开源视觉推理模型GLM-4.5V(106B参数),在41个多模态榜单中取得SOTA性能。该模型基于GLM-4.5-Air基座,具备图像/视频理解、GUI操作、文档解析等全场景视觉推理能力,并新增"思考模式"开关。典型应用包括:网页/视频前端复刻、图片翻译、GUI Agent操作、图表转换、学科解题及复杂文档深度解读。同步开源的桌面助手应用可实时处理屏幕内容,赋能开发者构建多模态应用。模型在视觉定位、推理深度等方面表现优异,为AGI发展提供了新的技术探索。

2025-08-12 03:04:04 896

原创 【狂飙AGI】2025年上半年中文大模型综合性测评

海外模型o3以73.78分领跑全球榜单,o4-mini(high)和Gemini-2.5-Pro分列二、三位。国内最佳表现来自字节跳动的Doubao-Seed-1.6-thinking-250715(68.04分),但国内外头部模型在推理任务上仍存在近10分差距。 国内开源模型表现突出,DeepSeek-R1-0528以66.15分居开源榜首,领先海外开源模型近20分。Qwen3系列小参数量模型在细分领域表现亮眼。 在智能体任务中,Doubao-Seed以90.67分全球

2025-08-09 12:35:42 2355

原创 【AGI】GPT-5:博士级AI助手的全面进化与协作智能时代的黎明

2025年8月,OpenAI发布GPT-5,采用1.8万亿参数MoE架构,实现博士级专业能力(数学推理94.6%、编程74.9%),支持200K tokens工作记忆与多模态统一处理。其动态路由系统可调用快速模型(gpt-5-main)或深度推理模型(gpt-5-thinking),效率较GPT-4提升40%。横向评测显示,GPT-5在推理、编码等维度全面领先Gemini 2.5 Pro、Claude 4等竞品,成本仅$1.25/百万tokens。

2025-08-09 10:40:18 1295

原创 【狂飙AGI】第10课:大模型评测2-AI产品能力测评

本文介绍了三类AI产品的能力测评标准:1)AI代码编程助手侧重代码补全、错误检测等开发效率指标;2)AI原生搜索产品评估搜索准确性、结果相关性及响应速度;3)AI实时语音产品评测语音识别准确率、延迟及交互流畅度。通过建立系统化测评基准,可客观评估不同AI产品在专业领域的实际表现,为技术优化和产品改进提供依据。

2025-07-21 14:15:32 325

原创 【狂飙AGI】第9课:大模型评测1-通用能力测评

本文系统梳理了大模型评测体系,围绕通用能力测评展开分析。首先回顾大模型发展历程,展示最新评测数据及中文大模型全景图。重点解析综合评测框架,包括理科能力(数学、物理等)、文科能力(语言理解、创作)以及Hard测评(复杂指令执行)三大维度。通过测评模型横向对比与总榜排名,全面评估当前主流大模型的核心性能表现,为技术选型与应用提供参考依据。

2025-07-21 12:24:59 187

原创 【AGI】跨平台智能引擎:Java+AI大模型融合的技术纵深

本文探讨了Java与AI大模型的融合技术,重点分析了Deeplearning4j和DJL两大Java框架的优势与应用。Deeplearning4j作为原生Java深度学习框架,支持端到端模型训练与部署,深度集成Java生态系统;DJL则提供跨语言接口,支持直接加载预训练模型。两者通过JVM的跨平台性和企业级稳定性,有效降低了Java开发者使用大模型的门槛。文章还指出,这种技术融合不仅拓展了大模型的工业落地场景,也推动了Java生态的智能化转型,为构建高性能、高可靠的企业级AI应用提供了新路径。

2025-07-21 00:54:46 1002

原创 【项目】MCP+GraphRAG搭建检索增强智能体

本文介绍了如何搭建MCP+GraphRAG检索增强智能体系统。主要内容包括:1) 使用uv工具初始化项目并创建虚拟环境;2) 配置GraphRAG索引,包括数据上传和索引构建;3) 创建RAG服务器端,通过FastMCP实现查询接口;4) 构建客户端程序与服务器交互。系统采用Parquet格式存储实体和社区数据,支持多段落响应,可用于机器学习等领域的知识检索任务。文章详细说明了环境配置、代码实现和关键参数设置,为构建基于知识图谱的智能问答系统提供了完整方案。

2025-07-18 18:39:06 720

原创 【项目】GraphRAG基于知识图谱的检索增强技术-实战入门

GraphRAG基于知识图谱的检索增强技术-实战入门

2025-07-12 15:30:44 929

原创 【狂飙AGI】第8课:AGI-行业大模型(系列2)

摘要:本文探讨了AIGC(生成式人工智能)在多个领域的应用与发展趋势,包括传媒、移动互联网、社交媒体、元宇宙、具身智能、空间智能等新兴技术场景。同时分析了AI在预测、评测、数据模拟、伦理规范方面的关键作用,以及其在新闻业、数据挖掘、编程辅助等专业领域的创新实践。最后展望了AIGC人机共生引擎的未来发展方向,呈现了人工智能技术深度融合产业生态的多元可能性。(149字)

2025-07-04 23:51:06 345

原创 【狂飙AGI】第7课:AGI-行业大模型(系列1)

本文展示了AI技术在各领域的创新应用:从服装史研究实现"GPT时刻",到医疗领域开发多学科诊疗系统和生物医药大模型;在教育领域构建个性化学习模型,在心理健康领域打造咨询辅助系统;工业设计大模型支持创意生成,出版和舆情领域也实现智能化转型。这些案例体现了AI技术正在深度赋能传统行业,推动跨学科融合发展。

2025-07-04 23:32:14 350

原创 【AGI】中国AI开源双响炮:文心4.5与盘古模型开启全民共创时代

中国AI开源双响炮:文心4.5与盘古模型开启全民共创时代

2025-06-30 20:14:02 996

原创 【AGI】Qwen VLo:多模态AI的范式重构与AGI演进关键里程碑

Qwen VLo:多模态AI的范式重构与AGI演进关键里程碑

2025-06-29 19:43:02 1605

原创 【AGI】突破感知-决策边界:VLA-具身智能2.0

视觉语言动作模型(VLA)通过端到端学习突破传统模块化系统的局限,将视觉感知、语言理解和动作生成统一为智能决策闭环。其核心架构包含多模态融合机制,如OpenVLA等开源模型在泛化性和效率上表现突出,支持复杂场景的零样本任务执行。VLA在工业操作、人机协作、自动驾驶等领域展现潜力,但仍面临数据稀缺、安全验证等挑战。未来趋势包括多任务泛化、世界模型集成等,推动具身智能向通用化发展。VLA的类人交互模式使其成为Physical AI落地的关键技术。

2025-06-21 23:39:18 1624

原创 【狂飙AGI】第6课:前沿技术-文生图(系列2)

本文探讨了当代美学理论与AIGC创作实践的结合。第一部分系统阐述了错时空、无厘头、迷融汇等7种前沿美学理论形态,通过视觉图示呈现其核心特征。第二部分展示AIGC生成的艺术作品,体现算法创作的美学可能性。第三部分介绍AI自动化工作流技术,为艺术创作提供工具支持。文章揭示了人工智能时代美学理论的新发展路径与艺术实践的技术支撑,附有相关技术课程参考资料。全文通过理论阐释与作品展示,呈现了数字美学与智能创作的融合趋势。

2025-06-15 11:22:58 352

原创 【狂飙AGI】第5课:前沿技术-文生图(系列1)

本文探讨AI绘画的美学本质与发展。通过分析国内外AI转绘展览,提出AI创作的七大美学理论:不可能美学(突破现实限制)、趋无限美学(极致表现)、反物理美学(违背自然规律)、异世界美学(构建奇幻场景)、高细节美学(微观极致)、超风格美学(融合多元风格)和多尺度美学(宏观微观切换)。这些理论揭示了AI绘画在视觉表达上的革新潜力,展现了人工智能艺术创作的独特美学价值。

2025-06-15 10:59:17 395

原创 【狂飙AGI】第4课:前沿技术-具身智能

人形机器人技术取得突破性进展,中国研发实力跻身全球前列。文章系统梳理了人形机器人的发展现状,包括基础概述、实际应用场景和前沿技术创新。通过宇树机器人等典型案例,展示了国产机器人在运动控制(如鲤鱼打挺、太极等复杂动作)方面的技术突破。同时分享了2024全球十大人形机器人榜单,呈现了中国在该领域的强势崛起态势。视频链接提供了机器人最新发展动态的直观展示,反映出人形机器人技术正快速向实用化、智能化方向发展。

2025-06-14 10:42:26 243

原创 【狂飙AGI】第3课:大模型时代前沿技术

本文系统梳理了AI领域五大前沿方向:1)智能涌现现象展示AI的自主学习能力;2)Transformer架构迎来重大革新,计算效率提升50%;3)Agent技术呈现多元化落地,涵盖AI小镇、ChatDEV软件开发、清华AI医院等创新应用;4)具身智能取得突破,DeepMind已开发出具备足球技能的智能体;5)推荐阅读包含音乐生成大模型Suno V3等最新研究成果。这些进展共同推动着AI技术向通用智能迈进,展现了从算法创新到产业应用的完整发展路径。

2025-06-12 23:27:55 661

原创 【狂飙AGI】第2课:大模型方向市场分析

【狂飙AGI】第2课:大模型方向市场分析

2025-06-12 23:06:46 616 3

原创 【狂飙AGI】第1课:大模型概述

本文系统梳理了大模型技术发展脉络与行业现状。第一部分解析大模型概念;第二部分回顾发展历程;第三、四部分详述国内外头部企业布局:OpenAI、微软、谷歌等海外巨头持续迭代GPT系列、Copilot等产品;国内阿里通义、百度文心、华为盘古等大模型竞相涌现,智源研究院、商汤科技等机构也在多模态、专用领域取得突破。全文通过技术路线图和企业案例,展现了大模型从理论研究到产业落地的完整演进路径,为读者提供全面的行业认知框架。

2025-06-12 22:54:26 470

原创 【AIGC】Qwen3-Embedding:Embedding与Rerank模型新标杆

Qwen3-Embedding:文本嵌入与重排序模型的技术解析与应用实践

2025-06-12 21:26:11 1879

原创 【AIGC】大模型面试高频考点16-RAGAS评估原理及实践

RAGAS评估原理及实践

2025-06-08 22:11:38 1316 1

原创 【AGI】Qwen3模型高效微调

【项目】Qwen3模型高效微调

2025-05-28 20:25:59 1647

原创 【AGI】大模型微调技术-四大微调框架

大模型微调技术-四大微调框架

2025-05-20 13:10:08 877

原创 【AGI】大模型微调数据集准备

大模型微调数据集准备

2025-05-18 22:06:17 1162

原创 【AGI】模型性能评估框架EvalScope

模型性能评估框架EvalScope

2025-05-18 21:59:30 822

原创 【AGI】Qwen3系列模型介绍及特性

Qwen3系列模型介绍及特性

2025-05-18 21:55:40 1006

原创 【项目】基于MCP+Tabelstore架构实现知识库答疑系统

基于MCP+Tabelstore架构实现知识库答疑系统

2025-04-22 17:24:39 1580

原创 【项目】CherrySudio配置MCP服务器

CherrySudio配置MCP服务器

2025-04-16 16:58:35 3014

原创 【项目】支付宝MCP:一键调用支付宝

支付宝MCP:一键调用支付宝

2025-04-16 11:07:43 1038

原创 【AGI】MCP生态的“飞轮效应”

【AGI】MCP生态的“飞轮效应”

2025-04-15 21:58:20 1179

原创 【AGI】Llama4:大模型与多模态领域的里程碑,通往AGI的阶梯

Llama4:大模型与多模态领域的里程碑,通往AGI的阶梯

2025-04-07 18:30:36 1063

原创 【AIGC月报】AIGC大模型启元:2025.04

AIGC大模型启元:2025.04

2025-04-07 17:46:49 1288

原创 【AIGC月报】AIGC大模型启元:2025.03

【AIGC月报】AIGC大模型启元:2025.03

2025-03-27 00:30:35 1114

原创 【AGI】OpenManus 技术全景解析

OpenManus 技术全景解析

2025-03-08 13:37:25 1990 1

原创 【AGI】通往AGI的复兴号:模型工具演进与技术路径优化

通往AGI的复兴号

2025-03-08 13:24:10 944

自己发布自己!人形机器人又又进化了

自己发布自己!人形机器人又又进化了

2025-06-14

全球大模型下半场,谁还留在牌桌上?

全球大模型下半场,谁还留在牌桌上?

2025-06-14

最强技术的数字人AI MV,OmniHuman-1+一致性,AI MV的新高度,《白色皮卡丘》完整版

最强技术的数字人AI MV,OmniHuman-1+一致性,AI MV的新高度,《白色皮卡丘》完整版

2025-06-14

AI音乐MV「SURREAL(超现实)」数字歌手Yuri

AI音乐MV「SURREAL(超现实)」数字歌手Yuri

2025-06-14

AutoGLM升级+GLM-PC

AutoGLM升级+GLM-PC

2025-06-14

AutoGLM正式发布

AutoGLM正式发布

2025-06-14

【人工智能大模型】大模型方向市场分析:产业规模、政策引导、人才需求及薪资情况综述

内容概要:本文档对大模型方向的市场进行了全面分析,涵盖了多个重要方面。首先介绍了产业规模,阐述了大模型产业的发展现状与潜力;接着分析了政策引导对大模型产业的影响,包括相关政策的支持与限制。随后探讨了人才需求,详细讲解了不同工作年限的人才需求情况以及年薪分析,指出不同地域的匹配薪资存在差异。文档还特别提到了紧缺人才的情况,强调了具备特定技能的人才在市场上更为抢手。此外,文档分析了核心竞争力,指出了企业在大模型领域取得成功的关键因素。最后,文档简要提及了大模型的使用率、开源与闭源大模型的性能差距,以及未来可能的研发方向。; 适合人群:对大模型方向感兴趣的从业者、研究者、投资者等。; 使用场景及目标:①帮助从业者了解大模型市场的现状和发展趋势;②为研究者提供参考数据和方向指引;③协助投资者评估投资机会和风险。; 其他说明:文档内容详实,数据丰富,旨在为读者提供全面的大模型市场分析,建议读者结合自身需求进行深入研究。

2025-06-13

【大模型时代前沿技术】Transformer与Mamba架构对比及具身智能发展:智能涌现与Agent应用综述

内容概要:本文详细介绍了大模型时代的前沿技术,涵盖了智能涌现、Transformer架构、Mamba模型、KAN网络、Agent智能体和具身智能等方面。智能涌现指模型在达到一定规模时展现出惊人的能力,如语言理解和逻辑推理,尤其强调了思维链(CoT)的作用。Transformer架构通过编码器-解码器、注意力机制等实现高效的输入输出处理,但也存在内存占用大和推理速度慢的问题。Mamba模型通过选择性状态空间和硬件感知算法优化了Transformer的不足,表现出优异的性能。KAN网络则以更少的参数实现了高精度,适用于数学和物理问题。Agent智能体包括画像、记忆、规划和动作模块,能够执行复杂任务并在虚拟环境中自主进化。具身智能则是指有物理形态并与环境互动的智能体,如DeepMind推出的具身智能“足球运动员”。 适合人群:对人工智能和大模型技术感兴趣的开发者、研究人员及从业者。 使用场景及目标:①理解智能涌现、Transformer、Mamba、KAN等技术的工作原理和应用场景;②掌握Agent智能体的功能模块及其在虚拟环境中的应用;③了解具身智能的发展现状和未来趋势,探索其在机器人和服务领域的潜力。 其他说明:本文提供了丰富的参考资料和技术细节,帮助读者深入了解大模型时代的前沿技术。建议读者结合实际案例和最新研究成果进行学习和实践。

2025-06-13

基于MCP+Tabelstore架构实现知识库答疑系统-代码资料

基于MCP+Tabelstore架构实现知识库答疑系统-代码资料

2025-06-10

特征工程-特征选择-相关数据集

特征工程-特征选择-相关数据集

2025-05-28

Matplotlib+Pandas+Seaborn绘图-相关数据集

Matplotlib+Pandas+Seaborn绘图-相关数据集

2025-05-28

SingleFileDel.zip

本程序实现将文件中的单身jpg文件删除的功能 单身文件:图像和标签文件未匹配,即只存在图像文件或者只存在标签文件。

2022-01-05

COCO_Objects365_to_VOC_Convertor.zip

COCO/Objects365转VOC标签,并进行指定类别抽取。

2022-01-05

Model Convetor

1.pytorch模型转ONNX 2.ONNX simplifier简化ONNX模型 3.ONNX模型推理 4.ONNX模型转NCNN模型(.bin和.param) 5.NCNN模型优化之ncnnoptimize

2022-02-19

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除