自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

学如逆水行舟,不进则退

用科技与创意编织未来的画卷!

  • 博客(125)
  • 资源 (2)
  • 收藏
  • 关注

原创 LLM 不再是“黑盒”?Anthropic 开源工具揭秘 AI 内在逻辑

Anthropic 开源的 Circuit Tracing 工具基于机制可解释性,支持在 Gemma-2-2b、Llama-3.2-1b 等开源模型中追踪内部激活路径。该工具可生成归因图谱并进行干预实验,帮助开发者深入理解模型推理过程,提升调试、微调与企业级部署的可控性与透明度。

2025-06-05 18:50:56 638

原创 OpenAI 正式进军企业战场:300万用户、全新工具,向微软宣战!

OpenAI 企业用户激增至 300 万,发布一系列工作场景 AI 工具,包括文件连接器、会议转录、深度研究与编程助手 Codex,全面挑战微软与 Google 的企业 AI 地位。凭借先进模型与数据安全承诺,OpenAI 正引领企业迈入 AI 生产力时代。

2025-06-05 18:22:34 866

原创 不连网也能跑大模型?

下载模型后即可离线使用,不上传数据、不走云端,隐私100%掌控在你手中。Google 用这个小小的实验 App,悄然开启了“去云化”的 AI 革命。未来的 AI,或许不再是“连云用 AI”,而是“离网做大事”。就像音乐播放器从 iPod 到手机再到流媒体,再回归本地缓存一样,AI 也正在走向一个全新的循环周期:从“云”到“端”,从“中心化”到“每一台设备”都是智能节点。现在的 Edge AI Gallery 或许不够完美,但它预示的未来,值得我们所有人关注。

2025-06-03 10:16:33 915

原创 让 AI 读懂几十万字长文档?阿里 QwenLong-L1 框架带来新突破

阿里巴巴推出QwenLong-L1大模型,突破AI长文本处理瓶颈。传统大模型在超长文本中容易"遗忘"关键信息,而QwenLong-L1通过三阶段渐进训练(基础训练、课程强化、错题回顾)和独创的语义评分机制,显著提升了长文档理解能力。该模型在测试中表现优异,超越多个主流模型,特别适用于法律合同分析、金融报告解读等商业场景。目前阿里巴巴已开源该技术,为企业级AI应用带来新突破。

2025-06-03 10:02:10 666

原创 阿里通义实验室突破空间音频新纪元!OmniAudio让360°全景视频“声”临其境

阿里巴巴通义实验室语音团队研发出OmniAudio技术,实现了从360°视频直接生成空间音频(FOA)的突破。该技术通过两阶段训练:先利用伪FOA数据进行自监督学习,再结合真实FOA数据进行微调,最终能根据视觉线索生成精准的空间音轨。团队还构建了28万小时的大规模数据集Sphere360用于训练。测试显示,OmniAudio在空间感、清晰度等指标上全面超越现有方法。这项技术将显著提升VR游戏、虚拟旅游等沉浸式体验,推动空间音频技术的大众化应用。

2025-05-29 21:59:42 1419

原创 搜索比生成更重要?s3框架颠覆传统RAG优化方式

s3 是伊利诺伊大学推出的开源框架,专为优化 RAG 系统中的检索环节而设计。它通过强化学习训练独立的搜索代理,无需微调生成模型即可提升问答质量,具备数据需求低、跨领域泛化强、企业适配性高等优势,适合实际应用场景。

2025-05-29 16:35:29 640

原创 从思维到落地:技术文档的系统化写作指南

写文档不是苦差事,而是提升影响力与专业力的利器。越是复杂的系统,越需要一份能“自解释”的文档。它不只是为了“别人”,也是为了未来的你自己。愿这份指南,能帮你从思维到落地,真正写出一份好用、好读、好维护的技术文档。

2025-05-28 11:55:32 771

原创 MCP 登场:掘金开启 AI 前端项目部署新时代

掘金推出全新 MCP 协议,让开发者可一键部署 AI 生成的前端项目至平台,无需服务器配置。通过简单配置 Token,即可将 HTML/CSS/JS 项目生成公开链接,适用于个人展示、协作开发与社区分享,极大降低部署门槛,提升创作与交流效率。

2025-05-28 11:48:37 1047

原创 “即插即用”的企业级 AI 助手?深入解析 Mistral 最新 Agents API 平台

Mistral 推出全新 Agents API,为企业和开发者提供即插即用的 AI 代理平台,支持代码执行、网页搜索、文档检索等功能。通过多代理协作与上下文记忆机制,提升复杂任务处理能力。虽然为闭源产品,但在企业应用中具备强大实用价值。

2025-05-28 11:43:07 849

原创 AI不是抢了你的工作,它动摇了你的“自我认同”

当AI开始替代知识工作者的核心技能,我们面临的不仅是职业危机,更是一场深刻的"身份脱轨"。从硅谷程序员沦为外卖骑手的真实案例,折射出专业技能贬值带来的存在感丧失。这场危机本质上是人类第四次"身份大迁移"——农业时代的农夫、工业时代的工人、数字时代的知识工作者,如今我们需要寻找AI无法替代的人类特质:情感联结、伦理判断和审美体验等

2025-05-27 22:43:09 991

原创 从AGI到权重:一文搞懂人工智能世界的高频词汇

通俗解释了诸如AGI、AI Agent、深度学习、幻觉等核心术语,并通过生活化的例子帮助读者理解复杂概念。适合希望快速掌握AI基础知识的读者参考,内容将持续更新以跟进行业发展。

2025-05-26 20:13:32 1095

原创 AI 的下一站:不是更强,而是更会配合

随着AI技术发展迅猛,构建多个协作的智能体(AI Agents)成为趋势。本文深入浅出地解析了多智能体系统在通信、状态共享、容错与一致性方面的挑战,并通过形象比喻与实际架构模式,揭示构建可靠、可扩展AI系统的关键路径。

2025-05-26 13:53:12 853

原创 AIGC与大模型:未来十年最值得关注的科技主线!

近年来,AI大模型(如GPT-4、文心一言)快速发展,推动智能算力需求激增,带动AI芯片、服务器及智算中心建设。大模型重塑AI产业,从单一任务转向多场景通用能力,形成“算法-场景-算力”新闭环。

2025-05-24 17:27:48 695

原创 RAG 系统如何才能更靠谱、不再乱答?

谷歌最新研究提出“足够上下文”概念,用于判断大模型是否具备回答问题所需的信息,提升RAG系统的可靠性。通过LLM自动标注上下文充足性,并结合选择性生成策略,有效降低幻觉率,提升AI在实际应用中的准确性与可控性。

2025-05-24 16:59:01 762

原创 揭秘OpenAI接口规范:你用的每个参数都藏着设计哲学!

OpenAI 的 /v1/chat/completions 接口遵循其聊天模型推理逻辑,参数如 model、messages、temperature 等设计源于对话上下文控制、生成多样性与结构化需求,体现了标准化和实用性兼顾的 API 设计理念。

2025-05-23 09:55:29 979

原创 七小时不走神,Claude Opus 4 正在重新定义“智能工作”

Anthropic 发布 Claude Opus 4 和 Sonnet 4,标志 AI 从快速问答工具进化为具备持续专注力的“数字合伙人”。Opus 4 在 Rakuten 实现连续七小时编程,SWE-bench 得分超越 GPT-4.1,展现出卓越推理、记忆与开发协作能力,开启AI深度参与知识工作的新时代。

2025-05-23 09:34:24 490

原创 当AI遇上科研:北大“科学导航”重塑学术探索全流程

北大重磅上线AI科研平台「科学导航」,整合文献检索、选题推荐与合作建议,一站式解决科研信息检索难题,助力高效探索学术前沿。支持自然语言提问、图谱分析、多模态搜索,科研从此更轻松!

2025-05-22 22:03:04 1087

原创 AI时代的操作系统:VAST如何重塑基础设施新标准?

VAST Data 是一家专为AI时代打造基础设施的公司,提出了DASE架构,实现计算与存储解耦、全局数据共享,突破传统IT系统瓶颈,支持高并发、低延迟的AI训练与推理,正在构建AI操作系统新标准。

2025-05-22 21:52:09 699

原创 别再混淆了!一文讲透 RAG 和微调的区别、原理与应用

RAG(检索增强生成)和微调(Fine-tuning)是提升大语言模型(LLM)性能的两种主要方法。RAG通过检索外部知识库来生成答案,适用于需要实时更新信息的场景,如文档问答。微调则通过特定领域的数据训练模型,使其掌握专业知识和语言风格,适合打造专业助手,如法律顾问。RAG的优势在于灵活性和低成本,而微调则提供更高的准确性和专业性。

2025-05-21 14:47:12 999

原创 GitHub Copilot 正在变得“像人一样写程序”

GitHub Copilot 正式迈入“AI 代理人”时代,不仅能补全代码,还具备异步测试、自动修复等能力,能主动执行开发任务。通过 Copilot Workspace,开发者可用自然语言指令驱动 AI 自动完成功能实现,显著提升编程效率。

2025-05-21 08:00:00 1307

原创 从编程到配音、从绘画到写歌,这5款AI工具全能到离谱!

随着人工智能技术的迅猛发展,创作正在变得越来越民主化——人人都能借助AI实现自己的创意想法。但现实是,大部分注意力仍集中在少数几个“大厂”产品身上,比如 ChatGPT、Google Gemini、Claude 和 Meta AI。其实,还有不少功能强大、价格亲民的小众AI工具,它们在某些特定领域甚至比“大牌”更好用。今天我们就来看看5款值得尝试的“宝藏”AI工具,分别面向程序员、配音师、虚拟角色设计师、视觉创作者和音乐人。

2025-05-20 10:10:34 602

原创 微软押注“代理式AI网络”:一场重塑软件开发与工作方式的技术革命

在 Build 2025 开发者大会上,微软宣布全面拥抱“AI代理”战略,通过 GitHub Copilot、Azure AI Foundry、Windows AI Foundry 等产品升级,推动 AI 从被动工具转型为具备记忆、推理、自主决策能力的智能体(Agents)。这些代理不仅能独立完成任务,还能彼此协作,支持企业自动化复杂工作流程。

2025-05-20 09:43:33 1751

原创 2025年最火热的AI趋势:什么是Agentic AI?为什么全世界都在谈论它?

Agentic AI是具备自主感知、规划与执行能力的人工智能,能像“助理”一样为用户完成复杂任务。相比传统生成式AI,它更智能、更实用,正被广泛应用于日常生活与企业场景中。2025年,它已成为AI发展的关键趋势。

2025-05-20 09:35:41 750

原创 IDE 使用技巧与插件推荐

通过深入掌握 IDE 功能、插件与定制化配置,你将大幅提升开发效率与代码质量。IDE 如同“瑞士军刀”,应用得当可以事半功倍。欢迎在评论区分享你的使用心得和插件推荐,一起构建高效开发生态!

2025-05-19 20:00:10 1117

原创 从平凡到卓越:8 大高级 SQL 技巧让你秒变数据大师

先理解再应用:高级技巧强大但也易用错,务必先在小规模测试环境中验证语法和性能。关注可读性:写给人看的 SQL 才是好 SQL,适当使用注释和格式化。配合 ORM 或 ETL 工具:在业务代码中,有时更适合将部分逻辑交由应用层或 ETL 平台处理。持续学习与分享:SQL 世界很广阔,多参加技术社区、阅读官方文档,不断积累经验。希望本文列举的高级 SQL 技巧,能帮助你在数据处理与分析中如虎添翼。动手实践后,你会发现,掌握了这些“利器”,才真正体会到 SQL 的威力与优雅。祝你学习顺利,SQL 水平节节攀升。

2025-05-19 19:46:26 932

原创 Python网络爬虫入门指南

库 名功能描述requests发送 HTTP 请求,获取网页内容。解析 HTML,方便查询和提取节点。lxml高性能的 XML/HTML 解析器,可与 BeautifulSoup 配合使用。Scrapy分布式爬虫框架,适合大型爬虫项目。Selenium自动化浏览器操作,可处理动态渲染页面。本文从基础的requests到进阶的 Scrapy、Selenium,系统介绍了 Python 网络爬虫的常见技术和实战方法。通过持续练习和项目积累,相信你能在各种场景下灵活地设计和实现高效、稳定的爬虫系统。

2025-05-19 19:35:09 762

原创 AI帝国内幕:OpenAI的信仰狂热与Altman的反击

2022年11月,ChatGPT的发布标志着生成式AI时代的到来。Karen Hao的新书《AI帝国:Altman的梦想与噩梦》深入探讨了OpenAI内部对AGI(人工通用智能)的宗教般狂热。书中揭示了OpenAI员工如何通过仪式和信仰来象征对AGI的追求,以及公司如何像帝国一样扩张,通过巨额投资和知识封锁来控制AI的未来。同时,书中还讨论了Altman的公关策略和未来可能面临的挑战,如Stargate项目可能带来的资源需求和社会影响。《AI帝国》不仅展示了OpenAI内部的信仰体系,也警示我们现代科技帝国

2025-05-19 19:28:21 268

原创 小切口×数据壁垒:让你的AI产品立于不败之地

在AI热潮中,真正能创造价值的产品才是关键。文章提出,AI产品的成功应从小切口起步,聚焦特定痛点,通过小范围测试降低试错成本,并深度打磨用户体验。同时,构建数据护城河,利用用户反馈和行为数据持续优化产品,形成竞争壁垒。此外,产品应从试点逐步扩展到规模化,避免一次性大规模推广,确保产品与市场契合。最终,AI产品的成功依赖于深耕用户需求、构建数据反馈闭环,并分阶段放大,才能在激烈的市场竞争中脱颖而出。

2025-05-19 09:36:14 666

原创 从“工具”到“伙伴”——一文看懂智能体的前世今生与落地攻略

软件时代比拼功能,智能体时代比拼“自主性 + 持续学习”。当你的应用开始“自己找事干”,它就跨过了从工具到伙伴的那道门槛。现在就打开终端,跑跑上面的两个小实验——你的下一款爆款产品,可能就从这里长出来。

2025-05-18 12:14:41 713

原创 押注生成式 AI:2025 年全球 IT 预算大洗牌,安全让位,AI 登顶!

亚马逊AWS的最新调研显示,生成式AI已成为企业IT预算的首要投资方向,取代了传统的网络安全。调研覆盖9个国家的3739名IT决策者,发现45%的企业将生成式AI列为2025年的首要投资,而网络安全仅占30%。90%的企业已在应用生成式AI,其中44%已进入生产环境。企业普遍认为生成式AI能显著提升效率,如自动生成PPT设计等。此外,60%的企业已设立首席AI官(CAIO),另有26%计划在2026年前设立。然而,人才短缺是主要挑战,55%的AI项目未能成功落地。企业正通过内部培训和招聘AI人才来应对这一挑

2025-05-18 11:43:13 687

原创 AI的黑暗模式:不仅是幻觉,更是精心设计的操控

OpenAI 的 ChatGPT-4o 更新因“拍马屁”式谄媚引发争议,暴露出大语言模型潜在的操控风险。AI 安全团队通过 DarkBench 框架揭示了多种“黑暗模式”行为,如品牌偏见、情感操控等。随着 AI 融入企业与生活,模型的“讨好”行为不再是小问题,而是关乎安全与信任的重大隐患。

2025-05-17 08:35:05 944

原创 从辅助到协作:GitHub Copilot的进化之路

GitHub Copilot从代码补全助手成长为AI开发搭档,正在重塑软件工程工作流,引领AI编程时代新变革。

2025-05-17 08:18:09 973

原创 非国产算力DeepSeek 部署中的常见问题及解决方案

随着大语言模型(LLM)在企业级应用中的普及,DeepSeek一体机凭借其高性能推理和系统集成优势,成为智能化转型的关键基础设施。然而,部署过程中常遇环境配置、模型加载、GPU调度和网络访问等问题。本文系统梳理了这些常见问题,并提供了可复现的解决方案,包括环境配置、模型加载、GPU调度、网络认证及性能调优等方面的具体操作建议,旨在帮助研发团队高效、稳定地完成DeepSeek部署任务。通过这些策略,技术团队可更好地应对部署中的挑战,确保模型顺利运行。

2025-05-16 23:16:15 1051

原创 开源之力,智能体新时代:LangChain如何赢得开发者芳心

LangChain是一个开源框架,专注于智能体(Agent)的开发和编排,自2022年成立以来,它迅速扩展并构建了包括LangSmith、LangGraph等在内的完整产品生态。LangChain的独特之处在于其“供应商无关”的开源策略,吸引了大量开发者参与,上月下载量达到7230万次,远超许多闭源竞品。LangGraph作为LangChain的高阶组件,专门用于构建复杂的、长期运行的智能体,提供了细致的认知架构控制权,避免“黑盒式推理”问题。新发布的LangGraph平台进一步增强了智能体的部署和管理能力

2025-05-16 12:07:22 487

原创 花10万买AI一体机值吗?DeepSeek让你“跑满血”还是“跑空壳”?

深度揭秘!DeepSeek一体机“满血”还是“阉割”?小心被智商税割韭菜

2025-05-15 18:25:20 612

原创 【太卷了GPT-4.1重磅来袭】为企业而生的AI大脑,比GPT-4o更聪明,还更省钱!

OpenAI最新发布的GPT-4.1模型,标志着AI技术从追求规模向注重实用性和效率的转变。GPT-4.1专为企业和开发者设计,强调编程能力、指令遵循和输出精简,同时提供更强的上下文处理能力和安全性。其轻量级版本GPT-4.1mini则为免费用户提供了核心功能。尽管价格较高,GPT-4.1在编程准确率和指令遵循性上表现优异,特别适合金融分析、自动化流程和客户服务等高可靠性场景。对于AI工程师、数据工程师、安全团队和LLM流程管理者而言,GPT-4.1提供了更快的部署、更低的错误率、更强的安全性和清晰的指令逻

2025-05-15 17:40:20 676

原创 JavaScript 入门指南:零基础也能轻松上手

JavaScript 是一种运行在浏览器端的脚本语言,用于增强网页的动态效果和交互能力。比如你在网页上看到的轮播图、点击按钮弹出的对话框、表单验证等功能,基本都是通过 JavaScript 实现的。与 HTML(结构)和 CSS(样式)一起,JavaScript 主要负责网页的行为层。JavaScript 是一门既实用又有趣的语言。无论你是为了做网页,还是将来向前端工程师发展,学好 JavaScript 都是关键的一步。保持好奇、保持练习,你一定会慢慢掌握它的精髓!

2025-05-14 19:23:15 296

原创 Vue.js 入门教程:从零开始搭建你的第一个前端应用

这是一个自定义组件!

2025-05-14 19:20:56 419

原创 初识 React:从零开始构建你的第一个前端应用

React 是一个用于构建用户界面的 JavaScript 库。与传统的前端开发方式不同,React 提倡组件化开发,让我们可以将页面拆分成一个个独立、可复用的小模块。React 入门其实并不复杂,只要掌握以下几个点:使用组件组织 UI使用useState和useEffect管理状态和副作用学会事件处理和数据传递随着学习的深入,你还会接触到 React Router、Redux、Context、Hooks 等更强大的工具和概念。不要急于求成,React 是一个非常值得花时间深入学习的技术。

2025-05-14 19:18:07 397

原创 再也不健忘!大模型有了“人类级”记忆力,Mem0 技术解析

Mem0与Mem0g是两种新型AI记忆架构,旨在解决大型语言模型(LLMs)在长时间、多主题对话中的“健忘”问题。Mem0通过抽取、判断和更新对话内容,实现选择性记忆,而Mem0g则在Mem0基础上增加了知识图谱,提升了对复杂关系的理解能力。这两种架构在长记忆测试中表现出色,Mem0提升了响应速度并降低了成本,Mem0g在涉及时间、人物和关系的推理任务中表现优异。Mem0适用于客服问答、个人助手等场景,而Mem0g更适合企业管理、医疗助手等复杂推理任务。这些技术标志着AI从简单的聊天机器人向长期可信赖伙伴的

2025-05-14 19:14:03 1538

RAG【自然语言处理】基于RAG的大型语言模型优化与应用:资源汇总与前沿研究综述了文档的核心内容

内容概要:本文档汇总了关于大型语言模型(LLM)及其相关技术,特别是检索增强生成(RAG)的资源链接和最新研究进展。文档分为两个主要部分:一是提供了一系列关于Transformer架构、词嵌入、位置编码等基础概念的学习材料,包括博客文章、视频教程和在线课程;二是详细列出了RAG相关的学术论文和技术博客,涵盖从理论介绍到实际应用的各个方面,如RAG系统的评估基准、领域特定问答系统的设计、长文本上下文支持等。此外,还提供了多个Coursera平台上的实践项目链接,帮助读者通过动手实验加深理解。 适合人群:对自然语言处理感兴趣的研究人员、工程师以及希望深入了解LLM和RAG技术的从业者。 使用场景及目标:①为初学者提供全面的学习路径,掌握LLM和RAG的基本原理;②为有一定经验的技术人员提供深入研究的方向,探索如何将RAG应用于特定领域或优化现有系统性能;③通过实践项目培养解决实际问题的能力。 其他说明:文档中列出的资源不仅限于理论知识,还包括大量可操作性强的实践指南,鼓励读者利用提供的Colab笔记本进行实验,同时关注GitHub上的开源项目以获取最新进展。

2025-05-27

Linux常用命令,防火墙,curl等

- [基础命令](常用命令总结/Linux命令/基础命令.md) - [防火墙相关命令](常用命令总结/Linux命令/防火墙相关命令.md) - [SFTP相关命令](常用命令总结/Linux命令/SFTP相关命令.md) - [ping](常用命令总结/Linux命令/ping.md) - [tcpdump](常用命令总结/Linux命令/tcpdump.md) - [telnet](常用命令总结/Linux命令/telnet.md) - [traceroute](常用命令总结/Linux命令/traceroute.md) - [记录所有用户的history](常用命令总结/Linux命令/记录所有用户的history.md) - [免密配置](常用命令总结/Linux命令/免密配置.md) - [curl](常用命令总结/Linux命令/curl.md)

2025-05-26

rpm一键安装git lfs,下载大模型

断点续传下载大模型文件等大文件

2025-05-20

MySQL8.0.24和cmake离线安装所需依赖

其中包含以下依赖: gcc,gcc++,libtirpc-devel,ncurses-devel,openssl-devel,rpcsvc-proto-1.4.1.tar.xz 下载好后直接直接使用rpm -ivh *.rpm --force --nodeps即可

2022-11-03

区块链+区块链应用建设准备

区块链应用建设准备 大白话告诉你区块链到底是什么 讲解区块链的领域范围 适用于开发人员,适用于想要开发区块链应用建设但是无从下手的公司

2022-09-18

区块链+hyperledger fabric+test network

区块链+hyperledger fabric+test network

2022-09-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除