- 博客(95)
- 收藏
- 关注
原创 GEO被315爆了!净与染的博弈 —— 论大模型的语料污染与治理
治理之路:构建三层防护体系面对GEO风险,业内普遍认为需要从技术、监管与行业自律三个层面协同构建治理框架。
2026-03-16 09:41:33
535
1
原创 MiroFish:一个10天打造、获3000万投资的群体智能仿真引擎
MiroFish是一个创新的开源多智能体仿真框架,由中国科大学生BaiFu主导开发,仅用10天完成并获得3000万投资。该项目通过输入文字自动生成百万级智能体的平行世界进行预测推演,采用FastAPI+Vue3技术栈,结合OASIS仿真引擎和Zep Cloud记忆系统,在工程化与产品化方面做出出色平衡。其核心价值在于将群体智能理论转化为可配置、可监控的实用工具,适用于舆情分析、剧情预测等多种场景。MiroFish的成功展示了"超级个体+AI工具链"新开发范式的潜力,为智能体系统发展提供了
2026-03-10 17:39:11
817
2
原创 CodeBuddy前端提效D2C之Figma转Code
本文介绍了如何利用Figma和CodeBuddy IDE实现设计到代码(D2C)的转换流程。首先说明Figma是一款云端协作式UI/UX设计工具,区别于PSD本地文件格式。详细步骤包括:安装CodeBuddy IDE及Figma MCP插件,获取Figma API密钥,将PSD转为Figma文件或直接设计,最后通过指令将Figma设计稿转换为HTML页面。文中提供了MCP服务器配置示例,并展示了转换效果,虽然存在一定失真,但完整演示了从设计到代码的自动化流程。
2026-03-05 14:14:07
397
1
原创 OpenClaw 记忆系统工作原理
本文探究了OpenClaw AI助手的记忆系统机制。该系统采用文件存储方式,将长期记忆和每日日志分别保存在Markdown文件中,支持用户直接编辑。通过混合搜索技术(70%向量搜索+30%关键词搜索)实现高效记忆检索,并具备自动压缩功能管理上下文限制,在隐私保护和离线可用性方面表现突出。这种透明可控的记忆方案适用于客服、问答等需要个性化服务的AI系统。
2026-02-25 19:59:46
1854
4
原创 Seedance 2.0 模型原理与案例体验
Seedance 2.0作为国产AI视频生成模型,在音画同步和多镜头叙事上取得突破。其核心采用双分支扩散变换器架构,可并行处理视觉与听觉信息,实现原生音画同步。相比前代,2.0版本在叙事连贯性、角色一致性上显著提升,生成速度比竞品快30%。实际体验中,虽然生成视频流畅自然,但仍存在细节问题如篮球数量异常、人脸替换失败等。该模型将AI视频生成从素材制作推向导演级叙事工具,但修改需重新生成等局限仍待改进。
2026-02-09 22:42:48
3664
3
原创 ComfyUI入门初相识与默认工作流
ComfyUI是一个基于节点式工作流的Stable Diffusion可视化操作界面,通过将图像生成过程拆解为可自由组合的功能模块(如模型加载、文本编码、采样器等),实现对AI生成流程的精细控制。相比WebUI,ComfyUI具有更高的定制性、更好的性能表现和更强的流程复现能力,适合进阶用户进行复杂创作。其核心原理与Stable Diffusion一致,通过潜空间生成和迭代降噪来产生图像。本地部署需要8G以上显存的Nvidia显卡,通过安装自定义节点可扩展视频生成等高级功能。
2026-01-02 10:48:59
1163
1
原创 混元世界模型1.5架构原理初探
腾讯混元世界模型1.5(HY World 1.5)是国内首个开源的实时世界模型框架,支持通过文本/图片生成可交互的3D场景。该模型采用WorldPlay自回归扩散技术,创新性地融合双分支动作表征、重构记忆机制等技术,实现24帧/秒的实时生成能力,同时保持几何一致性。其核心突破包括精准交互控制、3D一致性保障和高效强化学习框架,适用于游戏开发、虚拟现实等场景。模型已开源,提供从数据构建到流式推理的全流程支持,为AI内容创作提供了高效平台。
2026-01-01 10:43:09
1287
1
原创 ReAct和Function Calling之间的纠葛与恩恩怨怨
摘要: ReAct与Function Calling是大语言模型中两种不同的工具调用策略。Function Calling通过预定义函数直接匹配用户指令,适合标准化、流程固定的任务,效率高但灵活性低;ReAct采用“思考-行动-观察”的循环迭代,动态调整策略,适合复杂或开放性问题,但执行成本较高。两者的选择需权衡任务复杂度、性能与成本,例如简单查询优先Function Calling,多步推理则用ReAct。实验显示,在明确步骤的场景下,两者效果相近。开发者需根据实际需求选择策略,无绝对优劣之分。
2025-12-29 16:53:34
988
1
原创 2025,在AI星河中遨游,于CSDN星畔留痕
本文分享了作者"小马过河R"从2022年转型AI领域到2025年的技术探索历程。文章记录了智能问答系统从RAG+Bert到RAG+LLM的演进,AIGC短视频和AI生图的实践经验,以及基于Spec工作流的AI辅助编程模式。作者强调持续学习与分享的重要性,认为写作既是技术总结也是思维锻炼。在CSDN平台创作近百篇AI相关文章的过程中,作者既获得了专业成长,也收获了社区认可。文章以"AI不会替代人,只会淘汰不会使用AI的人"作结,表达了对技术发展的敬畏与期待。
2025-12-28 19:00:49
1138
1
原创 谷歌Nano Banana系列AI图像模型:从代号到原理的全解析
谷歌AI图像生成模型"Nano Banana"(Gemini 2.5 Flash Image)及其Pro版本采用原生多模态MoE Transformer架构,实现图像与文本的统一处理。基础版支持1024×1024分辨率,具有快速生成和角色一致性特点;Pro版基于Gemini 3 Pro,支持4K分辨率,强化了文字渲染和复杂场景融合能力。两个版本分别面向趣味创作和专业设计需求,通过Gemini App、API等方式提供服务。该系列通过交错生成、对话式编辑和多模态推理等技术,推动AI图像生成
2025-12-22 16:49:03
1634
1
原创 Codebuddy使用CloudBase MCP辅助AI编码基于Spec工作流开发的坦克大战小游戏
Codebuddy使用CloudBase MCP辅助AI编码基于Spec工作流开发的坦克大战小游戏
2025-12-16 19:07:47
1071
原创 浅谈AI辅助编码从氛围编程Vibe Coding到基于spec规范驱动开发
浅谈AI辅助编码从氛围编程Vibe Coding到基于spec规范驱动开发
2025-12-14 12:16:53
1682
9
原创 tRPC-GO 框架Helloworld实践初体验
本文介绍了tRPC-Go框架的入门实践。首先简要说明了tRPC-Go作为高性能RPC框架的架构特点,重点介绍了如何使用trpc命令行工具链安装配置环境。文章详细展示了从定义protobuf接口规范、生成桩代码到实现业务逻辑的完整流程,包括安装trpc-cmdline工具、编写proto文件、生成客户端和服务端桩代码,以及实现服务接口的具体步骤。通过一个简单的HelloWorld示例,帮助读者快速上手tRPC-Go框架的基本使用方法。
2025-11-29 12:47:21
1122
1
原创 APISIX和Kubernetes Ingress Controller如何配合使用?
apisix是一款云原生微服务API网关,可以为API提供终极性能、安全性、开源和可扩展的平台。apisix基于Nginx和etcd实现,与传统API网关相比,apisix具有动态路由和插件热加载,特别适合微服务系统下的API管理。
2025-11-18 13:51:13
1058
3
原创 AIGC视频生成之Deepseek、百度妙笔组合实战小案例
摘要:本文介绍了如何利用百度妙笔工具结合Deepseek模型快速生成AIGC长视频的方法。作者以天文奇观"血月"为例,仅需输入文本内容,无需剪辑或素材,10分钟即可自动完成脚本生成、角色创建、分镜设计和视频合成全过程。文章展示了百度妙笔在中文理解方面的优势,并对比了与其他AIGC视频工具的效果差异。该方法特别适合零基础用户快速制作短视频内容。
2025-10-25 15:54:10
1513
4
原创 5分钟使用Dify实现《射雕英雄传》问答智能体Agent
Dify的实现案例, 5分钟使用Dify实现《射雕英雄传》问答智能体Agent, 一文上手Dify的使用
2025-09-21 22:36:41
1431
7
原创 Taichi太极图形编程语言实践demo
太极(Taichi)是一种嵌入Python的领域特定语言,专为高性能计算设计,支持CPU/GPU运行,适用于物理模拟、游戏开发等领域。本文介绍了太极的安装与实践:首先需安装Python 3.6-3.8版本,通过pip install taichi安装太极库。实践部分通过调试官方示例代码(如分形动画),解决了版本兼容性问题,最终成功运行动态图形演示。文章还提供了不同平台的后端支持说明和常见错误解决方法,为初学者提供了实用的入门指南。
2025-09-20 17:43:19
1357
7
原创 小白AIGC短视频生成的第一课之混元AI视频
摘要 2024-2025年,AI生成内容(AIGC)在短视频领域实现全流程自动化生产,推动新型内容形态如单元剧、互动剧的发展。本文以腾讯混元AI视频平台为例,探索图生视频技术的应用效果。通过二郎神大战美猴王的案例,对比混元AI视频1.0与万相2.2的生成质量,从画面清晰度、动作连贯性、提示词遵循度等维度进行评估。结果显示,混元AI视频在画面清晰度上表现优异,但在动作生成和叙事逻辑上仍有提升空间。文章还总结了AIGC短视频制作的核心流程(剧本→分镜→文生图→图生视频→剪辑→配音),并分析了不同平台的技术特点,
2025-09-07 14:47:12
2721
6
毕业设计课题-H5小游戏,经典贪食蛇演示项目,HTML+JS纯前端网页应用
2026-01-25
如何实现一个PHP微服务的日志系统考虑,代码侵入和非侵入的情况
2025-04-18
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅