- 博客(413)
- 资源 (10)
- 收藏
- 关注
原创 首个国产芯片训练的多模态 SOTA 模型,已免费开源!
目前 GLM-Image 的 API 还处于内测阶段,为了方便大家体验,我用 Claude Code 配合 GLM-4.7 开发了个测试平台,并且在 GitHub 上开源了。但是在长 prompt 的输入下,就会被限制,也希望后面官方可以优化下,就拿薯图来说,提示词非常的长,就非常需要支持。这意味着,AI 生图的价格可能会被打下来,我的感触是很深的,因为最近一直在给我的产品薯图寻找性价比高的生图 API。
2026-01-19 23:32:05
297
原创 2026 最新 Claude Skills 保姆级教程及实践!
Skills 带来的是一种全新的 AI Agent 协作模式,过去,我们需要在每次对话中提供背景知识和操作指南,现在,借助 Skills,我们可以将这些知识封装起来,给到 AI 使用。但是要想使用还是需要配置一下 API 的,有挺多种办法,你可以选择官方的 Claude,非常贵,你也可以选择中转的 API,性价比高,当然你甚至可以选择 GLM 4.7,相对划算。
2026-01-19 23:28:04
959
原创 开源版 Claude Code 火爆全网,已狂飙 51.7k Star。。。
Claude Code 不用多说了,是 AI 编程 CLI 界的扛把子,最近又恐怖到了几乎谁写谁火的地步,我们之前也分享过很多相关的文章啦,还有 ima 知识库也可以配合着学习。如果你和我一样细心,你应该看到文章中第一张图片吧,没错,那就是 CLI 状态下的 OpenCode,不得不说,整个风格还是很有感觉的,隐约透露着一股 hacker 风。别的不说,坐着是贼会起名的,好,下次,我搞个 obsidian 的 skill 插件就叫,oh-my-ob,哦真牛逼。这个 UI 还挺 nice 的。
2026-01-09 00:29:08
619
原创 抢先实测豆包1.8模型,多模态Agent超强!
同时视觉理解基础能力大幅跃升,图片理解Tokens消耗更少,理解精度更高,单次视频理解帧数从640帧提升至1280帧,(在1秒1帧的情况下,可支持20分钟长视频理解)。关于模型信息更新信息给大家介绍完毕,接下来是带来一手实测,其实前些天就拿到了内测资格,这次测试我更聚焦于实际 Agent复杂场景,而非简单case测试。看完豆包 1.8 的表现,我一直在想,现在的工具真的太多了,开发者和职场人的切换成本越来越高。说实话,我现在就在火山引擎 FORCE 原动力大会的现场,人太多了,多到要挤着才能进来。
2025-12-23 20:55:44
836
原创 用即梦视频3.5pro复刻爆款AI探班视频,直接发现一个AI片场!
其实这种视频的制作并不复杂,最近尤其可以很简单——就在昨天,即梦网页版做了全新升级,包括画布和 Agent 带来的交互方式更新,视频 3.5 Pro与图片 4.5 等重要模型能力上新,以及能够打造更自由更专业的“一镜到底”的智能多帧2.0。点击「视频生成」,选择「智能多帧模式」,依次导入第二步生成的合影,即梦的智能多帧模式,在帧与帧之间输入提示词,生成好之后,如果对其中某个片段不满意,可以点击左下角的片段编辑。提示词:图2中的卷发百褶裙女孩,从图2的片场中走出,走到了图3的片场中,与图3中的主创们合影。
2025-12-23 19:02:07
1057
原创 免费!漫画 PPT + 全文档讲解,这谁顶得住啊。。。
试了一些其他风格,有时候会有一些文字乱码的情况出现,这也正常,毕竟香蕉或 NotebookLM 有时候也经不起细看,对于 beta 版本,秘塔也可以了。这几十页的文档,一个个去读,花费的时间会很长,在一开始,完全可以交给 AI,先来知识的总结理解,通过塔老师配合图片 PPT,来学习。好,已经迅速掌握到信息,但要想分享到社群,最好是可视化好些,光秃秃的文字,群友会提 8 米长的大砍刀架在我脖子上的。没别的好说的,就冲他这勇气,而且秘塔一直主打的免费,搞的我都挺不好意思的,新出的功能不得好好玩玩。
2025-12-23 18:54:08
316
原创 Nano Banana Pro 的20种逆天玩法,太强了!(附提示词)
现在很多地方都可以使用 nb pro,我依旧是在 Lovart 上做的测试,毕竟他们又可以全员免费用 3 天,配合他的无限画布,配合 Agent,一次就可以生成多张图,就很香。提示词:帮我生成一个 8 页的连环画,给 2 岁半的小朋友讲故事用,用中英文标出简短对话,主角是一只斑马和一只大象的故事,需要多角度展现主角,保持主角的一致性。就是这么朴实无华的提示词,配合 Gemini 3 的推理,简直无敌。现在,一个朴实无华的提示词,就直接能出来一个效果更好的信息图了,这简直不要太方便了叭,草,太牛逼了。
2025-11-21 13:36:53
715
原创 用百度文心5.0修族谱,感觉又能了!!
我还挺来劲的,又丢了 2 个梅西和 C 罗点球的视频给文心 5.0Preview,并放了一个对比提示词,顺带分析下是谁在点球。我又根据这个思路把阿姨发我的全部族谱进行了翻译,才真正看懂了族谱,并把我们家族的历史彻彻底底的了解了一遍。到我这辈,虽说没在官场报效国家,但也好在能写写文章,给全世界的人都能看到,输出价值,也算没辜负「文脉」。就很强,但这还不是最强的,最强的是它识别 C 罗的手段,一度让我怀疑它们是不是内置了个柯南?从萧何到梁武帝萧衍,到唐朝,到宋朝,祖上都特别的文脉军功起家,可以说文脉源远流长。
2025-11-15 20:25:32
569
1
原创 我用Claude Code开发了Obsidian内容分发插件,爆了!(附教程)
它能够将我在 Obsidian 中写的公众号长文,一键转成符合各个平台风格的文章。
2025-11-15 20:16:00
965
1
原创 用 Claude Claude + Kimi新模型跑通了 Obsidian 工作流,效率起飞!(附教程)
全自动创作工作流被我用cc+kimi做出来啦!
2025-11-09 17:34:56
1039
原创 这款国产智能编码工具,竟然登顶全球TOP3!
JoyCode 已服务京东上万名研发人员,支撑数亿级用户产品研发,生成代码采纳率超 50%,开发周期缩短 40%。
2025-10-28 17:22:20
1075
原创 谁能想到快手也开始卷AI编程了?上手体验了下,有点东西!
我用的是快手 StreamLake 平台的 API,看它有限时免费套餐,新用户注册就有 KAT-Coder-Pro V1 2000 万 Tokens (看了下另外的 KAT-Coder-Air V 1 的 API 是永久免费的)前阵子,他们开源的代码模型 KAT-Dev-72B-Exp 就在 SWE-Bench 认证榜单中以 74.6% 的成绩夺得了开源模型第一。这次,他们又带来了两款核心模型的升级版本,分别是 KAT-Coder-Pro V1 和 KAT-Coder-Air V1。
2025-10-24 16:57:19
563
原创 OpenAI的S2-pro人人可用了,免费无水印,真香!
提示词:为「红烧牛肉面」生成创意广告视频,包含面饼冲泡、汤汁浓郁、牛肉饱满的制作过程展示,功能亮点(如大块牛肉、醇厚高汤、劲道面条)的特写切换,用户享用场景(如深夜加班、朋友聚会、旅途火车上),以及品牌logo收尾。但当我打算用 lovart 试时,才发现,S2 已经不让生成已知动漫角色的视频了,据说是被太多公司举报了,先报名要紧。我相信大家听 S2 的大道理听多了,我就不多 bb 了,直接上我的实践,顺带把提示词分享出来。当工具抹平了技能的鸿沟,唯一能限制你的,就只剩下你的创意和审美了。
2025-10-21 16:39:19
615
原创 3个月圈粉百万,这个AI应用在海外火了
在这个社区里,你的每一个创意,无论是文字、图片还是视频,都可以由多个 AI Agent 协同完成,然后无缝地分享给其他人,甚至可以邀请他们进入你的项目,与你的 AI Agents一起协作。然后,基于这份研究报告,帮我自动生成一份PPT,至少15页,需要包含封面、目录、市场规模分析、竞争格局、技术趋势和未来展望等部分,并为关键页面配上合适的图表。其中我印象最深刻的还是 AI 设计中的深度设计能力,这个模式下,AI 会给自己打分、反思、修改、再打分,然后选出自己的最高分作品。
2025-10-21 16:21:00
936
原创 字节发布最新豆包视觉推理模型,一手实测来啦!
Doubao-Seed-1.6-vision 是全新升级的多模态大模型,适用于视频理解、Grounding、GUI Agent等高复杂度的场景,支持 256k 上下文窗口,输出长度支持最大 64k tokens。另外,这张片子有点歪,请帮我把它旋转扶正,让脊柱保持垂直,看下效果。来个非常有挑战的,我们知道清明上河图上有非常多人物,姿势动作各异,要想让大模型在清明上河图上精确找人,还是非常有难度的。从在复杂的《清明上河图》里找人,到分析X光片的细节,这些以前我们想都敢想的场景,现在正一个个变成现实。
2025-09-30 21:47:35
1471
原创 国产最强开源Coding模型发布了!!
接下来,我要将 GLM 4.6 放进刚刚发布的 Claude Code 2.0 中,让它来做一些更复杂的,更偏向实际开发的一些任务。真的挺麻的,以前重构是一件非常复杂的事情,得益与 GLM 4.6 200 K的上下文和增强的 Coding 能力,居然一次成功了。你还别说,就这两天,DeepSeek 刚发布 V3.2,我屁股还没坐热,Claude 就甩出了王炸 Claude 4.5。前端 UI上和 Claude 4 基本没差异,不过这个能力,在 GLM 4.5 表现就还不错,但 4.6 给我的感受是,
2025-09-30 21:39:46
1216
原创 阿里低调上线AgentBay,Agent的基础设施来了
这是一个开箱即用的 Agentic 强化学习服务,基于已有的强大沙箱和 Agent 建设框架,将复杂的自进化能力模块化、服务化,可实现 LLM 行为优化、提示词优化和 MCP 工具优化,让企业无需组建庞大的 AI 团队,即可为现有 Agent 注入“进化基因”。从 Agent 开发角度,一个高性能的 Agent,不仅仅是模型能力强就够了,它还需要一个稳定的、可扩展的、高效的运行环境。其实当时 AutoGLM 出来的时候,我就玩了很多,就是因为他太能干了,我和大多数人一样,担心的是自己的隐私问题。
2025-09-28 10:40:31
553
原创 不愧是腾讯,中国版 Claude Code 来了,支持微信登录
CodeBuddy Code 会生成 Dashboard.vue 的代码,在script setup中编写onMounted生命周期钩子,使用 axios 发起异步请求,并将数据绑定到组件状态上。更妙的是,因为它理解了 Spring Security,它直接在类上加上@PreAuthorize("hasRole('USER')")安全注解,并创建HabitService和HabitRepository的骨架。这是全栈开发中的一个常见难点。很简单的需求,能分享自己的秘密,并提供阅后即焚的功能。
2025-09-10 14:18:58
1937
原创 腾讯再次出手,现在视频号里也能直接召唤元宝了
它让普通人可以零门槛地使用 AI,随时随地,想问就问。最近,经常会在视频号看到一些短剧,动不动就是要等更新,或者进入一长串的连续剧,蹲一蹲后续成了最大的痛点,于是尝试让元宝来总结下短剧后续。最关键的经常看完就忘,抓不住精髓,现在就可以在视频下直接@腾讯元宝,帮我总结一下这个视频的精髓,写一份省流版笔记。有些时候看科普类视频,某一个知识点,特别想了解,也可以@元宝,然后针对于视频中提到的某个知识点,扩展提问。这就像是,过去我们用 AI,总得打开一个特定的地方,现在,AI就在你最常用的 App 里,触手可及。
2025-09-02 17:29:28
1013
微信聊天机器人python脚本(执行运行即可)
2019-06-17
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅