- 博客(13)
- 收藏
- 关注
原创 Gemini 3 零基础实战指南
1、如果你的提示词不专业,可以让任何一个 AI 帮你改得专业一些,例如,我想要 Gemini 3 帮我实现 xxxx 功能,请帮我丰富一下提示词。2、Gemini 不光有脑子和手,能理解你说的话,并帮你做出东西来。同时,它还有眼睛,比如你觉得哪个按钮的颜色不好看,可以直接截图告诉它,它能看懂。
2026-01-31 16:00:03
706
原创 Kimi K2.5实测:吊打国外模型
因为 K2.5 能理解视频,我又上传了一个点击交互的视频,K2.5 能理解视频中的交互,并像人一样能看清每一个交互后的页面,然后复刻。比如,这个是我用 K2.5 一句话复刻的 X 首页:相对比之下,这是我当时同样的提示词用 Gemini 3 复刻的 X 页面:可以看到 K2.5 除了复刻页面的每一个元素,甚至连页面中的图片都复刻了,而不是用占位符替代。这次 K2.5 的表现让人更加振奋,是那种肉眼可见的进步和爽感,写到这里,虽然测的有点累了,不过人还是相当的兴奋,就像当初熬夜测 Gemini 3 一样。
2026-01-29 23:18:31
1042
原创 盘点2026全球AI格局
而在 Image Edit Arena(图像编辑)榜单上,字节表现亮眼,前十占了三个:seedream-4.5 排第五,seedream-4-2k 第七,seedream-4-high-res-fal 第十。Vision Arena 测试多模态能力,前三全是谷歌:gemini-3-pro(1309 分)、gemini-3-flash(1284 分)、gemini-3-flash (thinking-minimal)(1268 分)。更魔幻的是,第二名还是谷歌,gemini-3-flash 得分 1480。
2026-01-28 09:57:27
567
原创 告别混乱:Agent Skills 实战指南
Skills” 这个概念最早由 Anthropic 公司提出,作为其大模型 Claude 的一种能力扩展机制。简单来说,它允许用户为 Claude 添加自定义的功能和工具。随着这套做法越来越成熟,并被社区广泛接受,Skills 如今已成为大多数 Agent 开发工具和 IDE 都支持的一种标准扩展规范。一个 Skills 通常以一个文件夹的形式存在,里面主要装着三样东西:一份说明书(SKILL.md)、一堆操作脚本(Script)、以及一些参考资料(Reference)。
2026-01-26 00:34:02
758
原创 DeepSeek v4:Engram 开启稀疏模型新轴线
DeepSeek与北京大学合作发布新论文《Conditional Memory via Scalable Lookup》,提出条件记忆模块Engram,作为MoE条件计算的补充。该模块通过哈希N-gram实现O(1)知识检索,将20%-25%稀疏参数分配给Engram可获最佳性能。实验显示,270亿参数规模的Engram在知识检索、推理和长上下文任务中均有显著提升,如MMLU+3.4、BBH+5.0。系统层面支持预取策略和多级缓存,几乎无额外开销。论文与代码已开源,DeepSeek v4轮廓渐显。开发者可通
2026-01-15 23:58:28
871
原创 当ChatGPT植入广告,AI还可信吗
2026年,人类将迎来数字史上最隐蔽的洗脑:AI广告拦截器正式成为刚需。就在今天凌晨,The Information 爆出 OpenAI 内部正在跑 ChatGPT 的广告原型。那个曾让你觉得能替代搜索竞价排名的数字上帝,正准备为了算力账单,把赞助商的私货塞进你的对话框。
2025-12-30 23:28:04
350
原创 顶级性价比:Gemini 3 Flash 实战指南
【摘要】Gemini3Flash颠覆行业认知,以1/4价格实现超越Pro模型的性能表现。其核心优势在于:1)具备自检逻辑能力,HLE测试成绩提升3倍,适合代码审查等高频场景;2)创新的ContextCaching技术将缓存成本降至$0.05/MB,大幅降低长文本处理费用;3)多模态能力突出(MMMU-Pro81.2%),特别适合实时视频流分析。建议开发者采用CoT机制提升准确性,配合指数退避策略优化响应稳定性。当前AI竞争已进入工程效率时代,Gemini3Flash成为处理90%业务场景的性价比之选。(14
2025-12-30 10:25:50
647
原创 Gemini-3.0-Pro 入坑指南
摘要:2025年,Google为抢占开发者生态,Gemini3.0 Pro API提供每日100次免费请求。国内用户可通过Google AI Studio获取API Key,利用Cloudflare Workers自建代理绕过地区限制,实现稳定直连。搭配NanoBanana生图模型,可高效处理复杂任务。若嫌自建麻烦,NunuAI提供国内直连方案,集成多个顶级模型。官方API仍是性价比最优选择,免费额度足以满足个人和小型自动化需求。
2025-12-26 22:05:58
793
原创 2025年终对比:ChatGPT vs Claude vs Gemini
摘要: 2025年AI模型已高度专业化,盲目订阅多个服务是浪费。测试发现:ChatGPT-5.2适合简单任务但易忽略系统级问题;Claude-4.5擅长架构设计和边界测试;Gemini-3.0长文本检索能力强但需深度追问。建议通过工具(如NunuAI)整合多模型,按场景切换:编程用Claude,多模态用ChatGPT,日志分析用Gemini。关键要匹配任务特性,而非依赖单一模型。
2025-12-26 09:34:18
760
原创 AI写作:2025硬核写作生产线
摘要:2025年AI写作渗透率超65%,导致内容同质化严重。作者指出AI写作追求"极大公约数"的特性正在扼杀人类独特性,提出对抗策略:1.将AI当作思维碰撞工具而非写作秘书;2.运用RAG技术注入个人知识库;3.建立多Agent协作流程(挑刺、数据、分发、排版)。真正的写作高手应利用AI放大人类特有的"偏见",因为在这个算法时代,"真实感才是最昂贵的资产"。
2025-12-25 10:04:20
680
原创 2025论文降AI实测指南
【摘要】论文检测器正在误伤最认真的学者:当研究生将论文打磨得过于规范时,反而会被判定为AI生成。研究发现,人类写作的关键特征在于"呼吸感"——包括适度的语法瑕疵、思维跳跃和情绪表达。剑桥大学数据显示,真人学术写作的困惑度波动幅度比AI高出50%。讽刺的是,学术训练让人工写作越来越接近AI模板,致谢部分误报率高达20%。有效的"去AI化"策略不是机械改写,而是保留思考痕迹:插入口语化表达、自我质疑和碎片化短句。更关键的是建立完整的数字证据链,包括修订记录、搜索历史和版本
2025-12-24 10:42:20
622
原创 AI能干啥?我整理了11个应用场景
AI工具已成为高效工作的得力助手,经过一年实践验证,在11个场景中效果显著:辅助写作思路拓展、批量处理重复性工作、快速入门陌生领域、信息提炼、代码调试、概念通俗化翻译、测试数据生成、表格整理优化、语境化翻译、头脑风暴陪练和框架模板生成。这些应用将机械性工作外包给AI,可节省70%时间,但核心判断与创意仍需人工。关键在于合理使用AI作为效率工具,而非完全依赖,保留人工审核环节确保质量。
2025-12-13 01:01:17
622
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅