石臻说AI-CSDN博客

原创 AI Agent 开发必备：云端浏览器自动化完全指南

本文探索了开发AI Agent时浏览器自动化的挑战与解决方案。文章首先指出，在生产环境中稳定运行浏览器自动化远比预期复杂，主要面临三大问题：反爬机制（浏览器指纹检测）、IP管理（代理质量与轮换）以及规模化运行（资源消耗与状态管理）。针对这些问题，作者介绍了Bright Data的Browser API云端浏览器解决方案，该方案通过真实浏览器运行、自动反爬处理、弹性资源分配和兼容现有工具等特性，有效降低了验证码触发率（从20%降至5%以下），且代码迁移成本低。特别适合需要多步骤交互的AI Agent场景，为开

2025-10-28 11:34:46 12620

原创 AI时代的“读写能力“进化：多模态文本智能技术全景体验

这不是简单的OCR升级，而是让AI从"打字员"进化成了"专业助理"。多模态文本智能技术，本质上是让AI从"被动工具"进化成"主动伙伴"。它不再只是"你让我做什么，我就做什么"，而是能够主动理解问题、分析问题、解决问题。从文档处理到AI安全，从个人效率工具到企业级风控系统，合合信息搭建的是一个完整的技术生态。技术的终极意义，不是炫技，而是解决真实问题，创造真实价值。

2025-10-23 09:22:56 17306 4

原创我试用了5款文本转语音工具后的真实感受

【5款TTS工具实测推荐】作为内容创作者测试了AI易配音、Google TTS等主流文本转语音平台。AI易配音凭借8万字符免费额度、300+音色免费使用、独特情感标签功能（如(愤怒)(高兴)语调转换）和多格式支持成为首选，尤其适合视频配音和有声读物制作。Google TTS技术强但操作复杂，Natural Reader适合简单文档朗读，Balabolka需离线安装，Speech2Go功能较基础。综合比较显示AI易配音在免费程度、音质效果和易用性上表现最佳，是个人创作者的性价比之选。建议优先试用其免费功能满足

2025-08-04 10:58:57 30697 11

原创推荐几个常用免费的文本转语音工具

文本转语音技术正在不断发展，为内容创作带来新的可能性。从简单的文本朗读到富有情感的多角色配音，这些免费工具已经能够满足大部分创作者的需求。如果你正在寻找一款功能全面、支持中文且特别适合小说转语音的工具，我强烈推荐尝试AI易视频。它不仅提供基础的文本转语音功能，还有文本翻译和小说角色配音等特色功能，能够帮助你更高效地创作优质内容。无论你是内容创作者、教育工作者还是有声书爱好者，这些工具都能为你的项目增添语音元素，提升内容的可访问性和吸引力。选择适合自己需求的工具，开始探索文本转语音的无限可能吧！

2025-05-13 14:37:26 31955 12

原创从零开始，手把手教你搭建Lerobot机械臂

SO-ARM100是一款具备 6 自由度、支持 3D 打印、极具性价比的开源机械臂。Lerobot是个开源机器人的解决方案，可基于act的强化学习框架训练SO-ARM100模仿人的操作，当然也可以是其他机械臂。如果没人指导，还是有点麻烦的，好在AI还能帮点忙，不然要退货了。目前简单抓取动作的成功率还行，看看能不能训个叠衣服的机械臂！还有做了些好玩的视频，分享在小红书账号上，感兴趣的可以看看。希望这篇教程对你有所帮助，快去动手试试吧！说不定还能给蚂蚁机器人助个力，哈哈。

2025-02-27 14:53:39 24778 16

原创喜报! 祝贺KnowStreaming升级为首批银河计划成员

9月16日，中国信息通信研究院（以下简称“信通院”）主办的2022 OSCAR 开源产业大会在京成功举办，滴滴4项开源项目由可信开源社区共同体正式成员升级为首批银河计划（TWOS Galaxy 2022）成员，会上、DoKit、LogicFlow、Delta 4位项目代表上台领取了奖杯，未来将与信通院及各成员单位一起聚焦开源技术，共同学习成长，提升创新能力，推动开源产业生态完善。

2022-10-08 14:04:48 12540 8

原创多图详解kafka生产者消息发送过程

文章目录相关配置源码元信息数据的更新 METADATA发起ApiVersionsRequest获取Kafka版本信息发起MetadataRequest获取元信息信息Kafka服务接受到METADATA客户端收到Response, 更新元数据 ProducreMetaData生产者拦截器生产者拦截器详解onSend(ProducerRecord今天我们来通过源码来分析一下,生产者发送一条消息的所有流程~~~相关配置参数说明默认/示例key.serializerkey的序列化器,需要

2022-04-29 08:30:00 10285 38

原创石臻臻的2021总结和2022展望 | 文末彩蛋

文末有彩蛋

2022-01-24 08:30:00 11635 124

原创【kafka运维】Kafka全网最全最详细运维命令合集(精品强烈建议保存)

本文所有命令,博主均全部操作验证过,保证准确性; 非复制粘贴拼凑文章; 如果想了解更多工具命令,可在评论区留下评论,博主会择期加上;kafka-topics.sh、kafka-configs.sh、kafka-reassign-partitionskafka-console-producer.sh、kafka-console-consumer.sh、kafka-leader-election、kafka-verifiable-producer.sh、kafka-verifiable-consumer、

2021-06-25 11:48:00 54725 56

原创 4 秒出图、10 美分视频，Google 新媒体模型来了

⭐ 设为星标 · 第一时间收到推送石臻说AI 编辑：石臻Google 这次把两个生成式媒体模型同时推给开发者：一个负责便宜、快速地出图，一个负责把视频生成和视频编辑变成对话。对开发者来说，重点不只是“又多了两个模型”，而是图片草稿、视频参考、多轮编辑这些环节开始能串成一条更低成本的流水线。图注：Google 官方发布 Nano Banana 2 Lite 和 Gemini Omni Flash。

2026-07-02 19:31:57 323

原创 ZCode 上手：GLM-5.2 的官方开发环境

ZCode 支持通过 BigModel / Z.ai 账号连接 GLM-5.2。授权成功后，页面会跳回应用，模型就可以在任务里直接使用。BigModel 授权成功：完成授权后会跳回 ZCode 应用除了官方模型入口，ZCode 也提供了自定义模型供应商配置。在模型设置里，可以添加供应商，填写名称、Base URL、API Key，选择 API 格式，再配置模型列表。截图里能看到 Anthropic Messages 这类 API 格式选项，说明它不是只给单一模型入口使用。

2026-07-02 17:17:02 247

原创当AI能生成App、做素材、当客服，普通人做生意的门槛还剩多少？

导读：有些 AI 产品看起来很厉害，但离普通人的生活很远。义乌 AI 小店这件事有点不一样。它不是在讲一个更强的模型，也不是在讲某个炫技demo，而是把AI放进了一个非常具体的场景里：一个普通人做小生意的门槛，到底还剩多少？它让我们看到一件事：AI不再只是帮你写文案、画图，而是能帮你直接生成一个APP、配一个运营助手-- 这才是它真正值得被讨论的地方。

2026-06-08 09:22:46 188

原创 Claude Code 上下文管理：rewind compact subagent怎么选

100 万 token 来了，但你的用法还停留在 20 万时代？Claude Code 团队负责人拆解 session 管理 5 大决策点：rewind、compact、clear、subagent 怎么选。

2026-04-16 08:50:32 570

原创 Claude Code偷偷把缓存缩水被抓包，用户成本暴涨

有人翻了12万条API调用记录，发现Anthropic在3月初悄悄把缓存从1小时改成5分钟，没有任何公告。配额消耗直接翻倍，作者Boris Cherny终于出来解释了。

2026-04-14 08:55:41 482

原创 Claude Code偷偷把缓存缩水被抓包，用户成本暴涨

有人翻了12万条API调用记录，发现Anthropic在3月初悄悄把缓存从1小时改成5分钟，没有任何公告。配额消耗直接翻倍，作者Boris Cherny终于出来解释了。

2026-04-14 08:35:34 490

原创沉浸式翻译完全指南：4个功能彻底改变你看英文内容的方式

导读：沉浸式翻译你可能用过，但大概率没把它用到位。网页翻译只是入门，它还能搞定 PDF 排版还原、视频实时双语字幕、输入框一键翻译……这篇文章把它的核心功能挨个演示一遍，顺便聊聊最新上线的 BabelDOC 到底有多能打。

2026-04-12 18:04:41 573 2

原创我用6个AI测了一圈，谁是国产Agent第一名，答案出奇地一致

让ChatGPT、Gemini、DeepSeek、文心、豆包、千问各自评选国产AI Agent三巨头，结果6个模型几乎清一色把百度排在第一位，连豆包都没把自家字节排第一。

2026-03-27 19:09:45 6242 1

原创让Claude连跑6小时：Anthropic多智能体Harness框架完整拆解

Anthropic工程师用GAN的思路搭了一套多agent框架：规划器+生成器+评估器三角配合，让Claude从单次生成天花板突围，自主开发出能玩的复古游戏和能用的DAW，耗时6小时、成本$200，但质量碾压单agent。

2026-03-25 07:55:51 6501

原创让Claude连跑6小时：Anthropic多智能体Harness框架完整拆解

2026-03-25 07:47:19 5543

原创 90% 的人从没打开过这个文件夹，但它是 Claude Code 真正的控制台

拆解 Claude Code 控制中心：CLAUDE.md/rules/commands/skills/agents，搞懂就能完全掌控 Claude。

2026-03-25 07:30:13 5883

原创 OpenClaw 大更新：插件市场上线，/btw 侧边提问，AI agent 从工具变成了平台

OpenClaw 大版本更新：ClawHub 插件市场上线，内置三款搜索引擎，/btw 侧边提问，OpenShell 沙盒，MiniMax M2.7。升级前注意 SDK 迁移等破坏性变更。

2026-03-24 09:00:21 5369

原创 Claude Skills 终极清单：22 个技能 + 3 个 MCP + 40 个项目

我扫描了 1000+ 仓库、测试了 200+ 技能，整理出 90 个真正能用的 AI 工具：Skills、MCP Servers、GitHub 仓库，一张清单全收。

2026-03-23 01:30:47 5251

原创对不起，真的再见了，这次再见也许就是永别了

磁盘满了，被迫卸载 IDEA、PyCharm、VSCode、Cursor……一个老程序员的十年工具告别，也是一次 AI 时代的代际交接。

2026-03-20 11:34:43 4823 1

原创分享5个打工人必备Skill，PPT到BGM龙虾全包了

Skywork新上线了一批Skill：PPT颜值在线、AI配乐批量生产、数据监控自动推送……作为重度用户分享几个真正好用的，顺带聊Ultra会员的5倍Token用量。

2026-03-19 09:41:01 8227 10

原创 Anthropic 工程师用了几百个 Skills，总结出这 9 条血泪经验

Anthropic 工程师 Thariq 分享数百个内部 Skills 的实战经验：9种分类、Gotchas优先、description是触发器、给Claude代码而非文字指令。

2026-03-18 10:03:54 6188

原创大模型用了十年的「笨办法」，被 Kimi 悄悄换掉了

Kimi 团队发布 Attention Residuals 论文，用 softmax 注意力替代传统均等残差连接，在深度方向实现选择性信息聚合，在 48B MoE 模型上实现 1.25x 计算效率提升，推理延迟增加不到 2%。

2026-03-17 08:44:54 5658

原创 OpenClaw 永久免费的提取任何网页的终极方案

实测对比三种网页内容提取方案：Jina格式最干净但每天200次限额，Scrapling无限制还能读微信公众号，web_fetch只适合静态页面。

2026-03-10 07:24:52 7031

原创 AI 写完文章自动推公众号：我做了这套发布 skill，每次省 40 分钟

用 OpenClaw 搭建的自动化发布 skill：一行命令把 Markdown 文章推进微信公众号草稿箱，图片全自动上传、样式自动套用，支持双账号和图文两种格式。

2026-03-08 07:59:43 6198

原创 GPT-5.4 发布：Computer Use 超越人类，Tool Search 让 Agent 用工具省了一半 token

OpenAI 发布 GPT-5.4，OSWorld 达 75% 超越人类基线，Tool Search 减少 47% token 用量，1M 上下文支持长任务，整合编程、推理与 Computer Use 能力。

2026-03-06 09:40:46 2688

原创用了10年显示器，这是我第一次觉得“这是专门为我做的“

这块显示器价格不便宜，我在下单前也犹豫了一段时间。但用下来觉得值。每一个功能点都能对应到实际的痛点：3:2 方屏对应代码行不够、抗反射对应工位采光、猫头鹰对应深夜伤眼……不是堆参数，是真的研究过程序员用显示器会遇到什么问题。十年换了好几块显示器，第一次觉得"这是为我做的"。如果你也是每天对着代码七八个小时的人，可以去看看。

2026-03-05 16:49:16 3501 2

原创不知道自己的 AI Skill 还灵不灵？现在可以跑测试了

Anthropic 给 skill-creator 加了测试框架，支持写 evals、跑 benchmark、A/B 对比，全程无需写代码，终于能知道 Agent Skill 到底管不管用了。

2026-03-04 18:09:10 2939

原创一句话，让三个 AI 同时开工：OpenAkita 开源多 Agent 助手解析

大多数人用 AI 的方式还是一问一答——你打字，它回答，换个问题再来一遍。OpenAkita 想做的是另一件事：多个 AI 自动组队分工，你说一句话，后面的事它们自己搞定。这个项目刚开源没多久，但设计思路值得认真看一下。

2026-03-03 08:15:00 3561

原创 Cloudflare 花 1100 美元用 AI 重建了 Next.js，tldraw 连夜把测试套件闭源了

Cloudflare 一名工程师用 AI 在一周内从零重建 Next.js，成本仅 1100 美元。这直接引发 tldraw 将测试套件转为闭源，开源商业模式面临 AI 时代的生存危机。

2026-03-01 19:44:56 2093

原创 2亿美元 vs 安全底线：五角大楼向 Anthropic 下最后通牒，Grok 趁机上位

美国国防部长 Hegseth 要求 Anthropic 在周五前取消 Claude 的军事安全限制，否则终止 2 亿美元合同。Anthropic 拒绝妥协，xAI 的 Grok 已获批进入军方机密系统。

2026-03-01 19:05:47 2219

原创 AI 成功了，然后世界崩了——一份来自 2028 年的经济尸检报告

CitriniResearch 以 2028 年视角回溯，推演 AI 成功后的经济连锁反应：白领失业→消费萎缩→SaaS 崩盘→私募信贷违约→13 万亿房贷市场动摇。不是 AI 悲观主义，是系统性风险的压力测试。

2026-03-01 18:51:20 1991

原创还只是单 agent 模式，Grok 4.20 就拿下了搜索第一

Grok 4.20 beta1 在 Arena 搜索榜登顶第一，文本榜排第四，而这还只是关掉多 agent 协作的单 agent 成绩。

2026-02-26 08:32:26 822

原创 Codex + Claude Code + 一个编排器：独立开发者的「一人军团」实战手册

独立开发者 Elvis 用 OpenClaw 搭建 AI agent 编排系统，让 Codex/Claude Code 集群自动写代码、提 PR、交叉审核，一个人实现日均 50 commit 的开发团队产出，月成本仅 $190

2026-02-25 08:02:08 1045

原创一键部署Openclaw，手把手教学

百度正在搞一个代号为"O计划"的神秘项目。据说，百度把搜索和云的团队拉到一起集中办公，目标是做一件"可能改变搜索交互范式"的事情。云团队最近集中力量在接入一个叫OpenClaw的开源项目，盲猜可能和这个有关。好奇心驱使下，我决定先拿百度智能云部署尝个鲜。这一试不要紧，我发现自己可能正在见证AI发展史上的一个关键转折点——当一个拥有7亿月活的国民应用，决定把最前沿的AI Agent技术开放给每一个普通用户时，会发生什么？你的手机，正在从一个"工具"进化成一个"AI操作系统"。

2026-02-11 10:39:09 12786 1

原创 Claude Code Agent Teams 完全指南：从入门到实战

摘要： Anthropic于2026年2月展示了Claude Opus 4.6的Agent Teams功能，仅花费2万美元即通过16个实例协同开发出能编译Linux内核的C编译器（10万行代码）。Agent Teams支持多实例并行协作，具备独立上下文、任务共享和自主协调能力，适用于复杂项目，但需权衡协调成本与效率。环境配置：需启用实验性功能（通过settings.json或环境变量），推荐使用tmux分屏模式（需配置鼠标支持以解决macOS快捷键冲突）。适用场景包括独立任务协作，而顺序任务或紧密耦合工

2026-02-09 17:26:25 7239 2

原创从零开始，手把手教你训练Lerobot机械臂

本文介绍了如何利用GPUFree平台进行Lerobot机械臂的远程训练，解决本地训练效率低和成本高的问题。平台提供预置环境简化配置流程，支持RTX 4090显卡租赁（约1.38元/小时）。教程包含三种训练方式：命令行操作、网页工具和JupyterLab运行。重点推荐了作者开发的WebUI工具，可实现一键上传数据集、选择训练算法、自动关机防闲置计费，以及便捷下载模型功能。通过7001端口映射，用户能轻松完成从数据上传到模型部署的全流程，显著提升训练效率并降低成本。

2025-12-17 14:29:42 7400 3

SQL数据库学习

2014-07-13

关系数据库学习

2014-07-13

dubbo官方文档

dubbo 用户手册操作文档； dubbo 用户手册操作文档； dubbo 用户手册操作文档； dubbo 用户手册操作文档； dubbo 用户手册操作文档； dubbo 用户手册操作文档； dubbo 用户手册操作文档；

2018-05-30

SpringMVC+FREEMARK+Redis

1. Maven多模块 2. 登录 3. redis 4. 用户角色管理 5. Freemark渲染 6.数据库 7.generator 下载可以直接运行；不需要本地数据库；因为连的是远程数据库；如果远程数据库连接不上了；则运行sql脚本创建本地数据库；初始账号为 admin 123456 ; 启动运行 http://localhost:8080/index ;

2016-10-26

Centos 7环境开发者环境初始化脚本

该资源包是基于Centos 7 下面的开发者环境初始化脚本包含了 1. java 2. maven 3.mysql 4.nginx 5.redis

2018-12-26

JSP课设我的博客

绝对适合新手学习有很多功能代码清晰应付课设绝对不成问题肯定得优秀

2014-08-06

JAVA读写EXCEl下载直接用

包含jar包下载直接使用

2014-12-26

MAC 的 ffmpeg

Mac电脑转码程序可以将 amr 转成 mp3 等等博客说明:https://blog.csdn.net/u010634066/article/details/85160055

2018-12-21

toolkit-intellij-2019.5.1.zip

Arthas在intellij上的插件可以通过Cloud Toolkit插件使用Arthas一键诊断远程服务器

2019-09-19

MyEclipse egit插件

org.eclipse.egit.repository-3.6.2.201501210735-r.zip

2015-02-09

maven创建多模块项目＋springMVC

多模块 SpringMvc

2016-09-27

SpringMVC4.0+MYBATIS3.0

SpringMVC4.0+MYBATIS3.0增删改查用的是oracle数据库数据看配置文件自己配置一下表名SM_USER 列ID,NAME.PASSWORD 一定要匹配正确否则报错

2014-11-23

java基础继承和多态实例

//练习： //1.做一个教师类Teacher，有属性：1.教师号，2教师姓名， //3教师工资（基本工资，课时费，课时数）。 //有方法：1.输出教师所有信息，2.计算教师总工资。 //2.在教师类的工程里在添加一个类School，该类对教师工资信息 //进行统计。 //（1）该类有以下属性：学校编号：schId, //教师姓名：schName，教师数组 Teacher []tea 教室里面又有教授和助教两个 //(2)该类有如下方法。 //a.输出所有教师所有信息。 //b.可以在数组中新增教师。 //c.可以统计数组中教师实际人数。 //d.可以根据教师编号查找教师。 //e.更新某个id的教师信息。 //f.可以根据id删除某个教师。 //g.求最高和最低工资教师。 //h.对教师按总工资进行排序。

2014-07-16

TA关注的人

SQL数据库学习

关系数据库学习

dubbo官方文档

SpringMVC+FREEMARK+Redis

Centos 7环境开发者环境初始化脚本

JSP课设 我的博客

JAVA读写EXCEl下载直接用

MAC 的 ffmpeg

toolkit-intellij-2019.5.1.zip

MyEclipse egit插件

maven创建多模块项目＋springMVC

SpringMVC4.0+MYBATIS3.0

java基础 继承和多态实例

ffmpeg for Linux

dubbo+zookeeper+spring -demo

JAVA实现GAME2048

eclipse svn 插件下载

早上早点起床可以学习两个小时

OAUTH2.0授权登陆怎么保持登陆状态

JSP课设我的博客

java基础继承和多态实例