【FastRTC今日星值飙升!】这个库能把Python函数秒变实时音频视频流,不管是WebRTC还是WebSockets都能搞定,简直不要太强大。而且安装也很方便,用pip就能搞定,还有好多额外功能可以加,比如自动语音检测和文本转语音。关键是它还自带UI,用.ui.launch()就能直接启动,小白也能轻松上手。更绝的是,它还能和FastAPI完美结合,直接挂载到你的应用上,瞬间提升逼格。(公 众 号·开源热榜)
1olmocr
-
今日星标
1,262 -
总星标数
2,602 -
连续上榜
2天
Python
GitHub - allenai/olmocr: Toolkit for linearizing PDFs for LLM datasets/training
olmOCR是一个专为处理复杂PDF文档设计的开源工具包,能高效提取适合大语言模型训练的结构化文本。它解决了扫描版PDF、图文混排文档的解析难题,支持单文件快速测试和百万级PDF分布式处理,适合学术论文、技术手册等专业资料的批量转换。工具内置智能过滤系统可自动去除SEO垃圾内容,并提供可视化对比工具检验处理效果。用户既可用本地GPU快速处理少量文件,也能通过云平台并行处理海量数据,输出结果可直接接入主流AI训练框架。该项目特别适合需要构建高质量文本数据集的研究团队或企业,帮助提升模型处理真实场景文档的能力。
2dify
-
今日星标
704 -
总星标数
75,113 -
连续上榜
4天
TypeScript
Dify 是一个开源的 LLM 应用开发平台,提供直观的界面和丰富的功能。它集成了 AI 工作流、RAG 管道、代理能力、模型管理和可观测性等特性,帮助用户快速从原型开发到生产部署。Dify 支持多种模型提供商,包括 GPT、Mistral 和 Llama3 等,并提供即插即用的工具,如文档提取和代理工具。用户可以通过 Docker 快速部署 Dify,并通过其 API 轻松集成到现有业务逻辑中。
3AstrBot
-
今日星标
401 -
总星标数
4,063 -
连续上榜
2天
Python
这是一个能快速搭建智能聊天机器人的开发框架,支持QQ、微信、Telegram等主流社交平台接入。它内置了GPT、Gemini等十多种AI模型,普通人也能轻松创建能处理文字、图片甚至语音对话的机器人。自带可视化控制面板,可一键部署到服务器,企业能用它搭建跨平台的智能客服系统,开发者可以通过插件扩展代码执行、网页搜索等高级功能。支持内容审核和速率限制,适合社群管理场景,还能对接知识库实现行业问答机器人。个人用户可以用它在自己的社群部署AI助手,开发者则能基于框架快速定制企业级对话应用。
4fastrtc
-
今日星标
393 -
总星标数
1,065 -
连续上榜
2天
Python
GitHub - freddyaboulton/fastrtc: The python library for real-time communication
FastRTC是一个让Python函数变身实时音视频流的开发神器。它能将普通代码快速转化为支持视频会议、语音聊天的交互程序,自动处理语音识别和视频传输等复杂技术细节。开发者只需专注业务逻辑,就能轻松打造智能语音助手、实时视频滤镜、在线教育系统等应用。内置网页界面和电话接口功能,可直接生成可交互的演示demo,比如与ChatGPT语音对话、实时物体检测、语音控制代码编辑等场景。无论是为AI模型增加实时交互能力,还是给传统应用添加音视频功能,都能通过简单API快速实现。
5drawdb
-
今日星标
332 -
总星标数
24,858
JavaScript
drawDB是一款免费易用的在线数据库图表设计工具,无需编程基础即可通过拖拽创建数据表关系图。它能自动将可视化图表转化为标准SQL建表语句,帮助开发者快速规划数据库结构。产品经理可用它绘制技术方案原型,教师能直观演示数据库设计原理。所有操作在浏览器中完成,无需安装软件或注册账号,适合临时会议记录或灵感速记。团队可私有化部署搭建内部协作平台,实时同步数据模型变更。系统内置多主题模板,支持导出PNG/SVG图片与SQL文件,是敏捷开发中提升数据库设计效率的轻量级工具。
6GenAI_Agents
-
今日星标
309 -
总星标数
7,618 -
连续上榜
4天
Jupyter Notebook
这是一个专为生成式AI开发者打造的全能工具箱,提供从入门到精通的智能体开发教程。无论你是想制作能聊天的AI助手、自动分析数据的办公小秘书,还是搭建能协作完成科研任务的AI团队,这里都有现成的解决方案和详细教程。项目包含43种实用场景案例,比如帮学生写论文的学术助手、给企业用的合同分析专家、甚至能创作音乐和侦探游戏的创意AI。所有案例都配有分步指南和可修改的代码模板,让开发者能快速搭建符合自己需求的智能系统,特别适合需要AI自动化处理的教育、电商、科研等领域。
7vision-agent
-
今日星标
92 -
总星标数
3,134
Python
GitHub - landing-ai/vision-agent: Vision agent
VisionAgent是一个帮助开发者利用代理框架生成代码来解决视觉任务的库。它提供了工具和功能,可以用于图像中物体的检测、计数和可视化,还支持视频文件的处理。通过简单的代码调用,开发者可以快速生成并执行视觉任务相关的代码。VisionAgent支持多种大型语言模型(LLM),并提供了灵活配置选项。最便捷的使用方式是通过其提供的Web应用进行快速测试。
8fish-shell
-
今日星标
49 -
总星标数
28,255
Rust
GitHub - fish-shell/fish-shell: The user-friendly command line shell.
fish 是一个面向普通用户的智能命令行工具,主打"开箱即用"的设计理念。它通过彩色语法高亮实时反馈命令输入正确性,输入时自动推荐历史命令,并提供更直观的智能补全功能,大幅降低命令行使用门槛。特别适合需要频繁使用终端但又希望提升效率的开发者和运维人员,其友好的交互设计也让刚接触命令行的新手更容易上手。支持在 macOS、Linux 和 Windows 的 Linux 子系统运行,可通过包管理器快速安装。内置帮助系统能直接在终端查看使用教程,日常操作无需额外配置就能获得流畅体验,显著提升命令行工作效率。
9OrcaSlicer
-
今日星标
39 -
总星标数
8,777
C++
Orca Slicer 是一款专为3D打印爱好者打造的开源切片软件,能自动为不同品牌打印机生成高精度打印指令。它支持市面上主流设备如Bambu、Prusa等,通过智能校准功能简化打印前的复杂设置,特别适合同时使用多台不同品牌打印机的用户。软件独创的三明治打印模式可优化模型内外层顺序,配合精确壁厚控制技术,能显著提升复杂模型的表面光洁度和结构强度。内置的Klipper固件兼容性让高级玩家能深度定制打印参数,而自动避障功能则保障了多模型同时打印的成功率。活跃的开发者社区持续提供功能更新和问题解答,无论是新手入门还是专业玩家调参,都能快速获得实用解决方案。