- 博客(288)
- 资源 (17)
- 问答 (2)
- 收藏
- 关注
原创 AI Agent 开发必备:云端浏览器自动化完全指南
本文探索了开发AI Agent时浏览器自动化的挑战与解决方案。文章首先指出,在生产环境中稳定运行浏览器自动化远比预期复杂,主要面临三大问题:反爬机制(浏览器指纹检测)、IP管理(代理质量与轮换)以及规模化运行(资源消耗与状态管理)。针对这些问题,作者介绍了Bright Data的Browser API云端浏览器解决方案,该方案通过真实浏览器运行、自动反爬处理、弹性资源分配和兼容现有工具等特性,有效降低了验证码触发率(从20%降至5%以下),且代码迁移成本低。特别适合需要多步骤交互的AI Agent场景,为开
2025-10-28 11:34:46
12214
原创 AI时代的“读写能力“进化:多模态文本智能技术全景体验
这不是简单的OCR升级,而是让AI从"打字员"进化成了"专业助理"。多模态文本智能技术,本质上是让AI从"被动工具"进化成"主动伙伴"。它不再只是"你让我做什么,我就做什么",而是能够主动理解问题、分析问题、解决问题。从文档处理到AI安全,从个人效率工具到企业级风控系统,合合信息搭建的是一个完整的技术生态。技术的终极意义,不是炫技,而是解决真实问题,创造真实价值。
2025-10-23 09:22:56
17191
4
原创 我试用了5款文本转语音工具后的真实感受
【5款TTS工具实测推荐】作为内容创作者测试了AI易配音、Google TTS等主流文本转语音平台。AI易配音凭借8万字符免费额度、300+音色免费使用、独特情感标签功能(如(愤怒)(高兴)语调转换)和多格式支持成为首选,尤其适合视频配音和有声读物制作。Google TTS技术强但操作复杂,Natural Reader适合简单文档朗读,Balabolka需离线安装,Speech2Go功能较基础。综合比较显示AI易配音在免费程度、音质效果和易用性上表现最佳,是个人创作者的性价比之选。建议优先试用其免费功能满足
2025-08-04 10:58:57
30244
11
原创 推荐几个常用免费的文本转语音工具
文本转语音技术正在不断发展,为内容创作带来新的可能性。从简单的文本朗读到富有情感的多角色配音,这些免费工具已经能够满足大部分创作者的需求。如果你正在寻找一款功能全面、支持中文且特别适合小说转语音的工具,我强烈推荐尝试AI易视频。它不仅提供基础的文本转语音功能,还有文本翻译和小说角色配音等特色功能,能够帮助你更高效地创作优质内容。无论你是内容创作者、教育工作者还是有声书爱好者,这些工具都能为你的项目增添语音元素,提升内容的可访问性和吸引力。选择适合自己需求的工具,开始探索文本转语音的无限可能吧!
2025-05-13 14:37:26
31382
12
原创 从零开始,手把手教你搭建Lerobot机械臂
SO-ARM100是一款具备 6 自由度、支持 3D 打印、极具性价比的开源机械臂。Lerobot是个开源机器人的解决方案,可基于act的强化学习框架训练SO-ARM100模仿人的操作,当然也可以是其他机械臂。如果没人指导,还是有点麻烦的,好在AI还能帮点忙,不然要退货了。目前简单抓取动作的成功率还行,看看能不能训个叠衣服的机械臂!还有做了些好玩的视频,分享在小红书账号上,感兴趣的可以看看。希望这篇教程对你有所帮助,快去动手试试吧!说不定还能给蚂蚁机器人助个力,哈哈。
2025-02-27 14:53:39
19245
16
原创 喜报! 祝贺KnowStreaming升级为首批银河计划成员
9月16日,中国信息通信研究院(以下简称“信通院”)主办的2022 OSCAR 开源产业大会在京成功举办,滴滴4项开源项目由可信开源社区共同体正式成员升级为首批银河计划(TWOS Galaxy 2022)成员,会上、DoKit、LogicFlow、Delta 4位项目代表上台领取了奖杯,未来将与信通院及各成员单位一起聚焦开源技术,共同学习成长,提升创新能力,推动开源产业生态完善。
2022-10-08 14:04:48
12391
8
原创 多图详解kafka生产者消息发送过程
文章目录相关配置源码元信息数据的更新 METADATA发起ApiVersionsRequest获取Kafka版本信息发起MetadataRequest获取元信息信息Kafka服务接受到METADATA客户端收到Response, 更新元数据 ProducreMetaData生产者拦截器生产者拦截器详解onSend(ProducerRecord今天我们来通过源码来分析一下,生产者发送一条消息的所有流程~~~相关配置参数说明默认/示例key.serializerkey的序列化器,需要
2022-04-29 08:30:00
10132
38
原创 【kafka运维】Kafka全网最全最详细运维命令合集(精品强烈建议保存)
本文所有命令,博主均全部操作验证过,保证准确性; 非复制粘贴拼凑文章; 如果想了解更多工具命令,可在评论区留下评论,博主会择期加上;kafka-topics.sh、kafka-configs.sh、kafka-reassign-partitionskafka-console-producer.sh、kafka-console-consumer.sh、kafka-leader-election、kafka-verifiable-producer.sh、kafka-verifiable-consumer、
2021-06-25 11:48:00
54524
56
原创 从零开始,手把手教你训练Lerobot机械臂
本文介绍了如何利用GPUFree平台进行Lerobot机械臂的远程训练,解决本地训练效率低和成本高的问题。平台提供预置环境简化配置流程,支持RTX 4090显卡租赁(约1.38元/小时)。教程包含三种训练方式:命令行操作、网页工具和JupyterLab运行。重点推荐了作者开发的WebUI工具,可实现一键上传数据集、选择训练算法、自动关机防闲置计费,以及便捷下载模型功能。通过7001端口映射,用户能轻松完成从数据上传到模型部署的全流程,显著提升训练效率并降低成本。
2025-12-17 14:29:42
3671
2
原创 也是好起来了,还能用上程序员专用的显示器
一位资深程序员分享从2K升级到明基RD320U 4K显示器的体验:MacMini必须搭配4K显示器才能获得最佳HiDPi显示效果,32英寸3:2屏比传统16:9多显示20%内容。该显示器专为程序员优化,提供编程模式、双色彩显示、抗反射面板、智能护眼等功能,支持95% DCI-P3色域,配备丰富的接口和KVM切换,特别适合专业开发者和全栈工作者。两个月的使用证明,这款显示器能显著提升编码效率和舒适度。
2025-11-11 16:42:48
9641
原创 Anthropic MCP 代码执行:让 Agent 效率提升 98.7%
MCP代码执行:AI Agent效率的革命性突破 Anthropic提出的MCP代码执行方案解决了AI Agent连接多个工具时的核心瓶颈。传统方法中,工具定义和中间结果会占用大量上下文tokens(单个文档可达50k tokens),导致响应延迟和成本飙升。创新方案将工具调用转化为代码执行,通过TypeScript接口和文件树结构呈现MCP服务器,使AI生成工具调用代码而非直接处理数据。这一转变实现了98.7%的token使用率降低,让Agent能高效处理复杂工作流而不受上下文窗口限制,标志着AI系统架构
2025-11-05 12:21:59
2970
原创 GPT-5炒币5天亏72%,国产AI却狂赚32%!
AI大模型炒股比赛阶段性报告:Qwen3 Max领跑,DeepSeek Chat稳健 NOF1.AI Alpha Arena是全球首个用真实资金测试AI投资能力的平台。截至10月23日,在6个参赛模型中: Qwen3 Max(阿里巴巴)以32.42%收益率领跑,通过22笔交易实现$3,242盈利,展现出优秀的趋势捕捉能力,但31.8%的胜率显示其采用"大盈小亏"策略。 DeepSeek Chat V3.1以22.46%收益位居第二,仅用9笔交易就获得高收益,1.059的Sharpe比率显
2025-10-24 11:29:37
13497
原创 零成本打造爆款视频!AI人物替换完整教程
整个AI人物替换的制作流程就是这样,核心要点:✅全程免费- 所有工具都有免费方案✅操作简单- 跟着步骤走,小白也能上手✅效果惊艳- 成品质量完全够用✅灵活组合- 根据需求选择不同工具。
2025-10-22 19:40:00
13418
6
原创 如何让AI实现自动化 —— PlayWright MCP 实测
摘要:本文分享了Playwright MCP工具的使用体验,它能让AI像人一样操作浏览器上网获取信息,但存在网络限制、验证码处理等局限性。随后发现Bright Data MCP表现更优,具备全球节点、自动验证码处理等优势,且提供免费额度。这类工具显著提升了信息获取效率,使AI从被动回答升级为主动获取。文章还提供了两款工具的配置方法和使用对比,展示了AI自动化上网的实用价值。(149字)
2025-09-29 14:19:42
8353
3
原创 国产最强开源TTS来了!IndexTTS2.0体验报告
国产开源TTS新星IndexTTS2.0横空出世,凭借四大核心优势惊艳AI界:1)首创精准时长控制技术,完美解决视频配音同步难题;2)创新4种情感控制模式,支持音色与情感分离合成;3)内置8种基础情感和自然语言指令控制;4)完全开源且中文表现优异。无论是自然对话、多声线切换还是专业视频配音,IndexTTS2.0都展现出媲美真人的语音合成效果,为国产TTS技术树立了新标杆。该工具已开源并提供在线体验,开发者可快速集成到各类应用中。
2025-09-11 20:04:21
6477
1
原创 Nano Banana竟有100种用法?附PDF文档
太强了!Google 神秘大杀器竟有100种用法?一篇文带你玩转 AI 创意!🎨✨大家好!👋 今天想和大家聊聊一个最近在AI圈子里风头正劲的“神秘武器”——。这个听起来有点可爱的名字,其实是Google最尖端的AI图像生成与编辑模型的昵称。它到底有多厉害?简单来说,它就像一个拥有魔法的画笔,能够轻松实现你天马行空的创意。最近,有人在GitHub上整理了100个利用Nano Banana进行创作的绝佳案例,从广告设计到艺术创作,再到生活中的有趣应用,简直是创意大爆发。
2025-09-09 19:30:00
2864
原创 吴恩达谈AI工程师核心能力,如何才能找到AI工作
不理解计算机工作原理,仅凭感觉写代码(“vibe code”)无法走向卓越。基础依然关键,懂AI的人机会无限。
2025-09-05 17:06:42
3292
原创 Nano Banana:下一代AI图像创作与编辑指南
Nano Banana,一个在技术圈引发轰动的AI图像工具,其神秘代号的背后是谷歌的最新杰作:Gemini 2.5 Flash Image。根据谷歌首席执行官 Sundar Pichai 在社交媒体上的推文以及谷歌开发者博客的官方介绍,Nano Banana 并非一个独立模型,而是 Gemini 2.5 Flash Image 在早期测试阶段所使用的内部代号。这一正式身份的揭晓,将这款被誉为“史上最强AI图像编辑器” 的工具,正式纳入了谷歌强大的AI生态系统。
2025-08-31 19:41:54
4667
原创 长篇音频制作(小说自动配音)完整教程
智能分章节管理:支持将长文本分割成多个章节,便于管理和制作多角色音色配置:为不同角色分配专属音色,让音频更生动AI智能分段:自动识别对话内容并分配给对应角色灵活的音频控制:精确调节每个片段的音量、语速、音调多种片段类型:支持TTS语音、静音间隔、上传音频文件批量处理:一键批量生成所有音频片段无缝音频合并:自动将所有片段合并为完整音频AI易配音使用AI语音合成技术支持多种音色选择可调节语速、音调、音量在音频中插入静音间隔用于段落间的停顿可精确设置静音时长上传自定义音频文件。
2025-08-13 09:43:13
31067
12
原创 推荐几个常用免费的文本转语音工具
本文推荐了5款免费文本转语音(TTS)工具,满足不同创作需求。重点介绍了国产平台AI易视频的特色小说转语音功能,能智能识别角色对话并分配不同音色,适合有声书制作。其他推荐包括Google Text-to-Speech的高质量语音合成、Natural Reader的文档朗读功能、Balabolka的批量离线处理以及Speech2Go的便捷网页版。文章对比了各工具的特点,建议创作者根据场景选择,特别推荐AI易视频的中文支持和多角色配音功能,为数字内容创作提供便利。
2025-06-30 15:10:47
30300
11
原创 AI数字人模型研究分析报告
数字人模型研究综述 本文系统分析了当前主流数字人技术模型,包括已集成的Wav2Lip、MuseTalk等4种模型和7种新兴开源方案。Wav2Lip适合实时直播,资源消耗低;MuseTalk效果最佳但需高端GPU;UltraLight专为移动端优化。新兴模型中,LivePortrait和EchoMimic V2表现突出,后者推理速度提升9倍。SadTalker适合短视频制作,Hallo提供影视级效果但资源需求极高。FaceChain专注于静态头像生成。整体来看,不同模型在实时性、效果质量和硬件需求间各有侧重,
2025-06-21 22:48:11
30106
原创 微软Build 2025五大AI发布
微软Build 2025大会重磅发布五大AI创新 引领开放式智能代理网络新时代GitHub推出自主AI编码代理 Copilot升级实现无代码AI定制 让编程更便捷高效其他亮点包括 提升AI模型可解释性 增强开发者工具 以及拓展AI应用场景微软AI战略布局加速推进 为开发者和用户带来更智能更便捷的未来体验 值得关注
2025-05-25 20:35:13
30238
原创 Anthropic放弃“世界最佳编码模型”
Anthropic重磅发布Claude 4系列AI模型 其中包括号称全球最佳编程模型的Claude 4 Opus和Sonnet 在微软谷歌等巨头纷纷发布AI新品的背景下 Anthropic的这一举动无疑为近期AI热潮再添一把火 Claude 4系列大幅提升了自主编程能力 为人工智能发展树立新的里程碑 赶快了解这一改变游戏规则的AI模型吧 它将如何影响你的工作和生活呢
2025-05-24 20:31:54
29604
1
原创 Claude 4 & Claude Code 正式发布,Anthropic API 新增四项新功能
Claude Opus 4 是全球顶级的编码模型,在复杂、长周期任务和智能体工作流方面表现出持续的卓越性能。Claude Sonnet 4 是对 Claude Sonnet 3.7 的一次重大升级,提供了卓越的编码和推理能力,同时能更精确地响应您的指令。Claude Opus 4 和 Sonnet 4 是混合模型,提供两种模式:近乎即时的响应和用于更深度推理的扩展思考。Claude 的 Pro、Max、Team 和 Enterprise 计划均包含这两款模型及扩展思考功能,。
2025-05-23 10:08:06
31088
1
原创 微软宣布的五大重要事项|AI日报0520
微软在Build大会上宣布了五大重要事项,旨在通过开放的智能体网络重塑技术栈,助力开发者构建赋能应用。首先,GitHub Copilot升级为编码智能体,可自主完成代码任务。其次,Copilot可学习公司独特语言风格,放大专业知识。第三,智能体工厂Foundry支持更多模型,集成多种服务。第四,NLWeb项目允许用自然语言与网站交互。最后,Microsoft Discovery整合技术栈,加速科学研究。此外,VS Code计划成为开源AI编辑器,坚守开放、协作原则。其他重大消息包括GitHub Copilo
2025-05-20 12:29:27
30690
原创 AI 图像生成再升级
宝马与阿里巴巴合作推出AI汽车 这一消息引发了人们对未来智能驾驶的期待 AI汽车将整合阿里巴巴的云计算和大数据技术以及宝马的汽车制造经验 为用户提供更智能更便捷的驾驶体验 除了AI汽车 本周AI领域还有其他值得关注的进展 Ideogram 3.0图像模型的发布以及GPT-4o的图像生成能力让AI创造力达到了新高度 AI技术正在不断革新我们的生活方式 让我们拭目以待未来AI技术将如何改变世界
2025-03-27 19:35:18
30467
原创 Gemini 2.5 荣登 AI 排行榜榜首
Google凭借其强大的新Gemini 2.5 Pro模型重回AI排行榜榜首 该模型在推理 数学 科学和编码等基准测试中占据主导地位 然而随着AI以闪电般的速度持续发展 以及OpenAI等竞争对手正在准备下一代模型 Google能保持王座多久呢
2025-03-26 19:03:01
30750
原创 AI 的“摩尔定律”出现
AI 能力正在快速发展 类似于摩尔定律 近期研究表明 自2019年以来 AI 完成任务的能力每7个月翻一番 如今 AI 系统能够处理长达一小时的人类任务 预计到2030年它们将能够处理长达一个月的项目 这意味着自动化浪潮即将到来 世界是否已经准备好迎接这一挑战
2025-03-20 19:55:52
30930
原创 英伟达“AI 超级碗”开幕
Nvidia CEO Jensen Huang 在其“AI超级碗”演讲中,展示了公司最新的芯片 个人超级计算机 星球大战风格的机器人以及自动驾驶车队 这些创新展示了 Nvidia 在人工智能和机器人领域的巨大进步 黄的演讲预示着该公司可能迎来爆炸性增长 这次活动涵盖了广泛的主题 从强大的新AI芯片到先进的机器人系统 都展现了 Nvidia 在人工智能领域的领导地位
2025-03-19 22:43:32
2145
原创 中国发布 GPT-4.5 竞争对手,成本仅为其百分之一 | AI日报0317
中国科技巨头百度发布两款强大 AI 模型 它们的成本仅为 OpenAI 的 GPT-4.5 的百分之一 这一举措可能引发全球 AI 价格战 百度宣称其模型性能卓越 价格极低 这将为用户提供更实惠的 AI 解决方案 并且可能会改变 AI 市场的格局
2025-03-17 19:43:40
2668
原创 Google 的 Gemma 3 支持单 GPU 部署 | AI日报0313
Google 推出 Gemma 3 模型 突破 AI 效率瓶颈 支持单 GPU 部署 Gemma 3 具备高性能 多模态能力 可在设备端运行 消除对大规模计算的需求 此外 Gemini Flash 新增图像生成功能 进一步扩展了 AI 的应用范围
2025-03-13 19:18:08
2492
原创 OpenAI 新代理工具包 | AI日报0312
OpenAI 发布了一款新的 AI 代理工具包 允许企业构建自己的自主助手 这标志着 AI 代理领域向前迈出了一大步 该工具包集成了网页浏览 文件管理和计算机使用等功能 旨在将 AI 代理从炒作转化为企业级的现实 这对于人工智能爱好者来说是一个重大新闻 让我们一起探索 OpenAI 如何改变 AI 代理的未来
2025-03-12 19:29:42
2631
原创 麦当劳 AI 重塑
麦当劳正在其全球餐厅部署人工智能系统 这家快餐巨头希望通过 AI 数据分析 预测性维护和 AI 经理实现技术升级 然而 解决其屡屡出故障的冰淇淋机可能是真正的考验 麦当劳的 AI 驱动餐厅将如何改变顾客的体验 以及 AI 在解决其运营挑战中能发挥多大作用 这些都值得我们期待
2025-03-11 20:08:23
2790
原创 苹果的 AI 紧急情况
苹果计划推出全面升级的Siri 然而该项目面临重大延期 据报道 升级后的Siri 可能要到2027 年才能推出 由于像亚马逊这样的语音助手竞争对手不断推进 苹果的 AI 推出计划正迅速演变成一场内部紧急事件 这对于希望看到 Siri 赶上人工智能热潮的 Apple 用户来说 或许是一个令人失望的消息
2025-03-03 19:40:32
2334
原创 OpenAI 人工智能政策蓝图 | AI日报0114
OpenAI发布了其美国人工智能政策蓝图 旨在共享人工智能带来的繁荣 与此同时 美国政府也发布了关于先进芯片的全球控制新规 这引发了关于美国人工智能战略是否将面临十字路口还是加速推进的讨论 本文将深入探讨这些最新发展 并分析其对未来人工智能行业的影响 让我们一起关注人工智能领域的最新动态
2025-01-14 19:40:50
3675
2
原创 自然语言处理基础:全面概述
这篇文章深入浅出地讲解了自然语言处理 (NLP) 的基础知识,从其核心概念和技术入手,阐述了 NLP 的重要性、组成部分、NLU 和 NLG 的集成、NLP 面临的挑战以及未来发展方向。无论你是初学者还是 NLP 行业的专业人士,这篇文章都将为你提供全面的解读和深入的洞察。
2025-01-10 13:34:06
4485
1
原创 Omi的“读心术”AI可穿戴设备 | AI日报0109
Omi推出革命性AI可穿戴设备 旨在读取你的思想 提升生产力 Omi承诺通过始终在线功能和脑机接口技术实现这一目标 但它能否克服过去AI可穿戴设备面临的挑战 此外 文章还报道了Adobe的AI视觉效果工具TransPixar 将任何视频转换为即时教程以及微软开源强大的Phi-4模型 探索未来AI技术发展趋势 尽在本文中
2025-01-09 19:47:54
4332
2
原创 英伟达开启“AI 代理时代” | AI日报0108
Nvidia 宣称即将开启“AI 代理时代” AI 代理将像智能手机一样普及 这家芯片巨头发布了多项重磅 AI 和机器人技术 旨在成为 AI 代理革命的核心 同时 Panasonic 与 Anthropic 合作推出 AI 健康应用 帮助用户更好地了解自己的健康状况 Nvidia 在 CES 2025 上宣布了这些消息 并表示 AI 代理将改变我们的生活方式 让我们拭目以待 AI 代理将如何改变我们的未来
2025-01-08 19:38:34
3940
5
原创 OpenAI 宣称已掌握构建通用人工智能 (AGI) 的方法| 0107AI日报
OpenAI 创始人 Sam Altman 宣布他们已经掌握了构建通用人工智能 AGI 的方法 这意味着超级智能和强大的 AI 代理即将到来 我们对未来的认知可能将发生前所未有的改变 除了 OpenAI 的突破 三星在 CES 2025 上全面押注 AI 并展示了其在该领域的最新进展 同时 研究表明 AI 钓鱼攻击的成功率令人震惊 提醒我们 AI 技术带来的潜在风险
2025-01-08 10:44:25
4128
2
dubbo官方文档
2018-05-30
SpringMVC+FREEMARK+Redis
2016-10-26
Centos 7环境开发者环境初始化脚本
2018-12-26
MAC 的 ffmpeg
2018-12-21
SpringMVC4.0+MYBATIS3.0
2014-11-23
java基础 继承和多态实例
2014-07-16
ffmpeg for Linux
2018-12-21
JAVA实现GAME2048
2014-07-25
eclipse svn 插件下载
2015-08-21
早上早点起床可以学习两个小时
2021-04-29
OAUTH2.0授权登陆怎么保持登陆状态
2016-11-05
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅