- 博客(53)
- 收藏
- 关注
原创 PaddleOCR技术深度解析
🚀 PaddleOCR:百度开源的OCR全栈解决方案 摘要:PaddleOCR是百度飞桨生态下的开源OCR工具库,提供100+语言的文本检测与识别能力。最新3.6.0版本包含三大核心技术模块:PP-OCRv5系列(场景OCR)、PaddleOCR-VL(视觉-语言模型)和PP-StructureV3(文档结构分析)。核心算法采用DB++文本检测和SVTR+文本识别,在OmniDocBench基准测试中达到96.3%准确率。支持跨平台部署(CPU/GPU/XPU/NPU),提供轻量化模型(0.9B参数)和商
2026-06-10 10:37:33
300
原创 Headroom-AI-Agent-上下文压缩引擎深度解析
一个让 Claude、Cursor、Copilot 等 AI 编程助手 token 消耗骤降 60-95% 的开源神器,同时保持答案准确度零损失
2026-06-08 16:02:17
401
原创 Scrapling-深度解析
Scrapling是GitHub用户@D4Vinci一个无法被检测、能自适应网站变化、速度极快的爬虫框架。Scrapling不是一个普通的爬虫库,它是为反爬虫战争维度传统爬虫Scrapling指纹检测❌ 被秒识别✅ 完全伪装网站改版❌ 爬虫报废✅ 自适应存活JS渲染❌ 需额外方案✅ 内置支持CAPTCHA❌ 手动处理✅ 自动集成维护成本❌ 高✅ 低如果你厌倦了被Cloudflare封IP、被指纹检测秒识别、被网站改版折磨——
2026-06-02 11:09:08
269
原创 taste-skill-深度解析
Taste-Skill:AI生成UI的设计革命 Taste-Skill是一个开源的Claude Code Skill框架(GitHub 30k+ Stars),旨在解决AI生成UI的"模板化垃圾"问题。其核心通过三大机制实现:1)三拨盘系统(设计差异度、动效强度、视觉密度)控制输出风格;2)AI Slop禁令清单禁止常见低质设计模式;3)预飞检查确保50+项设计规范。项目支持主流技术栈(React/Tailwind)和官方设计系统(Material/Fluent等),提供多场景技能模块,从极简到粗野主义风格
2026-06-01 16:37:58
600
原创 AIRI:开源界的「AI 虚拟伴侣」——打造属于你的数字灵魂容器
AIRI 是开源 AI VTuber 领域的标杆项目:功能完整、跨平台支持、技术栈现代、社区活跃。它不仅是一个聊天机器人,更是一个能陪你玩游戏、实时语音对话的「数字灵魂」。与封闭的 Neuro-sama 相比,AIRI 让技术民主化——任何人都能拥有自己的 AI VTuber,无需依赖第三方平台。一句话总结:开源界的 Neuro-sama,游戏+语音+虚拟形象三合一——属于你的数字伴侣。
2026-05-26 17:54:47
475
原创 Paperless-ngx:开源界的「数字档案室」——告别纸质,拥抱智能
摘要: Paperless-ngx 是一款开源自托管文档管理系统,通过 OCR 技术将纸质文件数字化,支持全文检索与智能分类。核心功能包括多格式 OCR(Tesseract)、机器学习自动标签、多入口文件导入(扫描/邮件/API)及可视化数据管理。采用 Python+Django+Angular 技术栈,支持 Docker 快速部署,提供 RESTful API 便于集成。相比传统方案,它解决了纸质文档堆积、检索低效和隐私顾虑等问题,适合个人或企业构建私有化文档中心。典型应用场景包括发票归档、合同管理和凭证
2026-05-26 17:34:34
436
原创 从“盲读代码“到“全局掌控“:Understand-Anything 如何颠覆你的代码理解方式
Understand-Anything:代码理解的革命性工具 该项目通过混合分析引擎(Tree-sitter + LLM)将代码库转化为交互式知识图谱
2026-05-25 17:13:00
469
原创 当 AI 驾驶浏览器:深入解析 Chrome DevTools MCP
本文介绍了Chrome DevTools MCP协议,这是一种让AI编程助手(如Claude、Cursor、Copilot)能够直接操控浏览器的革命性技术。MCP协议作为AI与工具间的标准化桥梁,通过JSON-RPC 2.0实现通信,包含Tools(可调用函数)、Resources(可读数据源)和Prompts(提示词模板)三大核心原语。Chrome DevTools MCP服务器将43种浏览器调试工具(如截图、内存分析、性能追踪等)暴露给AI使用,使AI能直接执行页面检查、错误捕获等操作,大幅提升开发效率
2026-05-22 14:37:52
521
原创 把大脑交给自己,而非交给 AI —— Files.md 的“极简知识管理“哲学
Files.md 是一款**本地优先(Local-first)**的 Markdown 笔记应用,以纯本地文件形式拥有你的数据,以自控软件打开这些文件。用文件和你的大脑来增长知识,用 LLM 来扩展软件。纯文件和自控软件可以穿越时代。
2026-05-22 10:29:57
387
原创 ViMax:AI导演、编剧、制片人一体化——颠覆传统视频制作的智能体革命
(Multi-Agent Video Generation Framework),通过智能体协同实现自动化多镜头视频生成,并确保角色与场景的一致性。:只需输入你的创意概念,ViMax 自主处理剩余一切——端到端自动化视频创作。
2026-05-20 14:22:58
452
原创 Bun CLI:一键通吃的 JavaScript 终极武器
一个命令、一个工具、一切搞定。这不是关于"更快"(虽然确实快)。这是关于简化。从到。从 7 个工具到 1 个。从"配置地狱"到"零配置天堂"。Bun 让 JavaScript 开发回归本质:写代码,运行代码。
2026-05-18 15:18:19
584
原创 CLI-Anything:让 AI 智能体「驾驭」任何软件的终极 CLI 桥梁
CLI-Anything一键将GUI软件转化为AI可操控的命令,使 AI 智能体能够通过结构化命令操控软件,无需 GUI 介入
2026-05-18 14:44:41
554
原创 scrcpy-屏幕镜像神器技术文档
scrcpy(Screen Copy)是由 Genymobile 团队开发的开源 Android 设备屏幕镜像与控制工具。它通过建立 USB 或 TCP/IP 无线连接,将手机屏幕实时投射到电脑显示器,同时允许用户使用键盘鼠标进行远程操控。特性指标数据端到端延迟35~70ms(业界领先)启动时间~1秒显示首帧帧率范围30~120fps(自适应)安装包体积~1MB(极致轻量)开源许可Apache 2.0最低 Android 版本。
2026-05-15 16:17:46
520
原创 gstack-guide
GStack是由Y Combinator CEO Garry Tan开发的开源AI辅助开发工具包,将Claude Code等AI编程助手转化为"虚拟工程团队"。该工具包含23个专业技能,覆盖产品规划、开发设计、代码审查、发布部署等全流程,支持10种AI编程助手。GStack采用结构化开发冲刺流程,提供安全防护、浏览器自动化等功能,据称能实现810倍效率提升。安装简单,支持多平台,附带详细文档资源。项目采用MIT许可证,GitHub获97K+ Stars,持续活跃更新。
2026-05-15 16:02:09
427
原创 CloakBrowser
CloakBrowser 是一个隐形 Chromium 浏览器(Stealth Chromium Browser),通过在 C++ 源码级别修改浏览器指纹,实现对反机器人检测系统(Anti-Bot Systems)的绕过。它作为 Playwright 和 Puppeteer 自动化框架的直接替代品,无需修改代码即可实现隐形浏览。
2026-05-11 17:24:59
1008
原创 UI-TARS-desktop
UI-TARS-desktop 是字节跳动开发的开源GUI智能代理应用,基于原生多模态大语言模型,能够通过自然语言指令控制计算机实现桌面交互自动化。该项目采用统一架构设计,集成感知、推理、动作和记忆四大模块,支持跨平台操作(Windows/macOS/Linux/Android)。核心优势包括直接处理原始截图无需OCR依赖、端到端训练和迭代学习能力。提供2B到72B不同规模的模型变体,在多项GUI自动化基准测试中达到SOTA性能。项目包含桌面应用和CLI工具两种形式,支持一键安装和开发者定制。
2026-05-11 15:56:46
591
原创 openreel-video
OpenReel Video是一款专业级浏览器视频编辑器,作为开源CapCut替代方案,完全基于浏览器运行,无需上传或安装,保障隐私安全
2026-05-08 18:30:00
417
原创 Claude for Financial Services
项目摘要 Claude for Financial Services 是专为金融行业设计的AI解决方案库,提供11个预构建代理覆盖投行、股权研究、私募股权和财富管理等核心业务场景。项目采用模块化架构设计,包含代理(Agent)、技能(Skill)、命令(Command)和连接器(Connector)四个层级,支持双路径部署模式。
2026-05-08 14:02:05
617
原创 9router
9Router是一个AI网关/代理,作为本地服务器将AI编码助手的API请求路由到多个AI后端。它最大化免费/低价模型的使用,同时通过RTK压缩技术减少20-40%的Token消耗。
2026-05-08 10:44:41
815
原创 DeepSeek-TUI - 终端 AI 编码代理
DeepSeek-TUI 是一个专为 DeepSeek V4 设计的终端 AI 编码代理工具,提供高效的 CLI 交互体验。核心特性包括:流式推理输出、本地工作区集成、三种运行模式(Plan/Agent/YOLO)以及 1M Token 超大上下文支持。采用 Rust 语言开发(占比 98.3%),基于 ratatui 框架实现终端界面,支持跨平台运行。
2026-05-06 16:33:42
1134
原创 DocuSeal - 开源电子签名平台
DocuSeal是一款开源电子签名平台,提供DocuSign的替代方案。核心功能包括可视化PDF表单构建器、12种字段类型、多签署人支持、数字签名验证和移动端优化。支持模板创建、嵌入式表单及多种云存储选项。企业版提供品牌定制、批量发送和SSO等功能。技术架构基于Ruby on Rails和Vue.js,支持PostgreSQL等多种数据库。部署方式灵活,可通过Docker快速启动或一键部署到主流云平台。配置选项丰富,涵盖数据库、存储、邮件和安全设置,适合各类企业自托管需求。
2026-05-06 14:09:56
432
原创 Kode-Agent-vs-Claude-Code
Kode-Agent与Claude Code是两款终端AI编码助手,在模型支持、代理系统和工具集成方面存在显著差异。Kode-Agent采用多模型协作策略,支持OpenAI、Anthropic等主流模型及本地部署,提供灵活的子代理系统和工具权限控制。Claude Code则专注于Claude系列模型的深度优化,内置20+工具和团队协作功能,支持Jupyter编辑等专业场景。两者在代理定义方式、热重载机制和专家咨询功能上各具特色,开发者可根据项目需求选择。
2026-04-30 16:41:31
620
原创 Kode-Agent:新一代多模型协作 AI 编码助手
Kode-Agent(品牌名Kode)是由 shareAI-lab 开发的开源 AI 编码助手,专为终端环境设计。它采用自主代理架构,能够理解代码库结构、直接编辑文件、执行 Shell 命令,并通过自然语言指令自动化整个开发工作流程。与传统单模型 AI 编码工具不同,Kode 实现了真正的多模型协作系统(Multi-Model Collaboration),允许用户根据任务类型灵活切换不同的 AI 模型,最大化开发效率。
2026-04-30 14:59:16
614
原创 Claude Code 连 MySQL:保姆级教程
Claude Code连接MySQL教程摘要 🚀 本教程详细介绍了如何让Claude Code与MySQL数据库建立连接。通过安装mcp-server-mysql作为中间件,用户可以通过两种方式配置连接: 命令行快速配置(适合简单场景) JSON文件配置(支持多数据库连接) 配置要点包括填写数据库地址、用户名、密码和数据库名等基本信息。教程还特别强调了安全注意事项,默认只读模式防止误操作,并提供了开启写入权限的方法。对于远程数据库,建议使用SSH隧道进行安全连接。
2026-04-29 17:17:41
1526
原创 uv - 极速 Python 包管理器
uv 是由 Astral 团队开发的极速 Python 包和项目管理工具,采用 Rust 编写,可替代 pip、poetry 等传统工具。其核心优势包括超高速(比 pip 快 10-100 倍)、一体化功能(项目管理、脚本管理、工具执行、Python 版本管理)和 pip 兼容接口。uv 支持全局缓存、工作空间和 Cargo 风格的工作流,无需 Rust 或 Python 环境即可安装。
2026-04-28 09:47:47
478
原创 claude-mem
Claude-Mem 代表了 AI 辅助编程工具领域的重要进展——从会话式助手向持久化智能伙伴的范式转变。通过生命周期 Hook、AI 压缩、向量语义检索、渐进式披露等技术的有机结合,该项目有效解决了 AI 编程助手的核心痛点:上下文连续性缺失。对于追求高效、连贯 AI 编程体验的开发者,Claude-Mem 提供了一套成熟、开源、可扩展的解决方案,值得深入探索与实践。
2026-04-27 19:30:00
635
原创 homebrew
Homebrew是 macOS(及 Linux)上免费开源的包管理系统,用于简化 Apple(或 Linux 发行版)默认未包含的软件安装。它完全基于 Git 和 Ruby 构建,允许用户轻松创建、修改和回滚包定义。# 构建依赖# 运行依赖# 可选依赖# 平台特定依赖endend# 冲突声明#{prefixend<<~EOS。
2026-04-27 14:02:17
604
原创 Homebrew - macOS 与 Linux 的包管理器
Homebrew是 macOS(及 Linux)上免费开源的包管理系统,用于简化 Apple(或 Linux 发行版)默认未包含的软件安装。它完全基于 Git 和 Ruby 构建,允许用户轻松创建、修改和回滚包定义。# 构建依赖# 运行依赖# 可选依赖# 平台特定依赖endend# 冲突声明#{prefixend<<~EOS。
2026-04-22 11:17:08
586
原创 USB设备历史清理工具使用手册
USB设备历史清理工具是一个用于清理Windows系统USB设备注册表历史记录的批处理脚本。每当USB设备连接到计算机时,Windows会在注册表中记录设备信息,本工具可以帮助您清理这些历史记录。
2026-04-16 11:25:16
400
原创 Pascal Editor:基于 WebGPU 的开源 3D 建筑编辑器技术解析
是由 pascalorg 组织开发的开源 3D 建筑编辑器,旨在提供一个无需本地安装、完全基于浏览器的建筑设计与可视化解决方案。该项目采用WebGPU渲染技术结合构建三维场景,实现了接近原生应用的渲染性能与交互体验。项目属性数据11,683Forks1,479主要语言TypeScript(占比 98.6%)当前版本v0.5.1许可证官方网站源码仓库WebGPU 先行者:首批大规模采用 WebGPU 的开源 3D 项目,浏览器渲染性能突破传统 WebGL 限制架构设计规范。
2026-04-15 13:54:01
707
原创 MarkItDown使用教程
几乎所有你日常见到的办公文档,MarkItDown 都能转换!项目说明是什么把各种文件转成 Markdown 的工具谁开发的Microsoft为什么要用让 AI 更轻松读取你的文档内容怎么安装怎么使用markitdown 文件名.pdf > 输出.md支持格式PDF、Word、Excel、PPT、网页、电子书等费用免费现在,你已经掌握了 MarkItDown 的基本用法!试着转换一个你的文档,感受一下"一键变身"的便捷吧。
2026-04-13 15:19:51
3082
原创 Claude Code 行为指南
Andrej Karpathy(前 OpenAI 创始成员、前 Tesla AI 总监)在社交媒体上分享了他对 LLM 编码行为的观察:本项目通过四大核心原则来解决这些问题:核心理念:不要假设。不要隐藏困惑。展示权衡取舍。LLM 经常默默地选择一种解释然后执行。这个原则强制显式推理:示例对比:2. 简约优先 (Simplicity First)核心理念:解决问题的最少代码。不做任何推测性设计。对抗过度工程化的倾向:测试标准: 高级工程师会认为这过度复杂吗?如果是,就简化。示例对比:3. 精准修改 (S
2026-04-09 16:29:09
525
原创 oh-my-claudecode-vs-everything-claude-code
oh-my-claudecode (OMC) 官方文档明确承认 everything-claude-code (ECC) 是其灵感来源之一。claude-hudOuroboros│ 代理覆盖对比 ││ ││ OMC 独有: ││ ├── tracer (证据捕获) ││ ├── scientist (数据分析) ││ ├── critic (质疑评审 - Opus) ││ └── analyst (需求澄清 - Opus) ││ ││ ECC 独有: ││ ├── 8个语言特定审查器 │。
2026-04-05 09:30:00
841
原创 everything-claude-code-使用指南
是一个 AI 代理性能优化系统,由 Anthropic Hackathon 获奖者开发。它不仅仅是一组配置,而是一个完整的系统:包含技能、本能、内存优化、持续学习、安全扫描和研究优先开发。
2026-04-03 17:39:45
1210
1
原创 Anthropic Skills 解析
Anthropic Skills 是包含指令、脚本和资源的文件夹集合,Claude AI 可动态加载这些内容以提升特定任务表现。核心特性包括: 模块化设计:采用三级渐进式加载系统(元数据/指令/资源层)优化上下文效率 标准化结构:每个技能包含必备的SKILL.md文件和可选资源目录 多样化应用:提供17个专业领域技能,涵盖文档处理(Word/PDF/Excel/PPT)、API集成、测试工具等 触发机制:通过description字段定义技能功能和触发条件 规范约束:严格定义name字段命名规则和文件结构要
2026-04-02 17:27:59
809
原创 ClaudeCode完整学习指南
《Claude Code 编程助手完整学习指南》摘要: 本指南系统介绍Anthropic官方AI编程助手Claude Code的使用方法。内容涵盖11个核心模块:斜杠命令、记忆系统、技能、子代理、MCP协议、钩子、插件、检查点、高级功能和CLI命令。提供从入门到精通的分级学习路径(约11-13小时),包含55+内置命令详解、自定义命令创建方法、记忆系统配置技巧,以及生产级模板和可视化教程。特别设计了自我评估工具帮助开发者定位当前水平,并附有快速参考卡片和常见用例最佳实践,是掌握Claude Code的完整资
2026-03-30 17:01:29
1792
原创 USB设备历史清理工具使用手册
摘要:USB设备历史清理工具是一款用于清除Windows系统注册表中USB设备记录的批处理脚本。该工具支持交互式和命令行两种模式,可列出所有USB设备记录或按VID选择性删除。使用时需管理员权限,通过创建计划任务以SYSTEM账户运行来突破注册表权限限制。工具提供预览功能(/WHATIF)和安全提示,建议删除前仔细核对设备信息。适用于Windows 7/8/10/11系统,清理后重新插入设备会重新生成记录。
2026-03-24 18:00:05
645
原创 CC-Switch使用指南
Claude Code、Codex、Gemini CLI、OpenCode 和 OpenClaw 的全方位管理工具
2026-03-20 11:29:38
16170
4
原创 Claude Conversation Extractor 使用指南
Claude Conversation Extractor 使用指南,用于导出Claude code完整历史记录
2026-03-19 15:11:02
986
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅