Ladybird浏览器今天又斩获684颗星星啦!总星数飙到2.9w+,快来康康它为啥这么火叭~①闪电启动不卡顿:写代码时秒开调试页面超丝滑;②全平台适配王:Mac/Windows/Linux三端同步,通勤路上手机看文档也完美适配;③隐私保护小能手:自带无痕模式刷剧不怕被剧透推荐。程序员哥哥们赶项目、学生党熬夜查资料都超适合用!(✧∇✧)(公 众 号·开源热榜)
1olmocr
-
今日星标
1,329 -
总星标数
4,441 -
连续上榜
3天
Python
GitHub - allenai/olmocr: Toolkit for linearizing PDFs for LLM datasets/training
olmOCR是一个专为处理复杂PDF文档设计的开源工具包,能高效提取适合大语言模型训练的结构化文本。它解决了扫描版PDF、图文混排文档的解析难题,支持单文件快速测试和百万级PDF分布式处理,适合学术论文、技术手册等专业资料的批量转换。工具内置智能过滤系统可自动去除SEO垃圾内容,并提供可视化对比工具检验处理效果。用户既可用本地GPU快速处理少量文件,也能通过云平台并行处理海量数据,输出结果可直接接入主流AI训练框架。该项目特别适合需要构建高质量文本数据集的研究团队或企业,帮助提升模型处理真实场景文档的能力。
2ladybird
-
今日星标
684 -
总星标数
29,508
C++
GitHub - LadybirdBrowser/ladybird: Truly independent web browser
Ladybird是一款基于全新引擎开发的独立网页浏览器,专注于实现现代网络标准。它采用多进程架构设计,将网页渲染、图像解码和网络请求分离到不同进程中运行,通过沙盒机制提升安全性,有效防范恶意内容攻击。目前浏览器整合了包括网页渲染引擎、JavaScript引擎、WebAssembly支持等核心模块,适合开发者体验前沿技术或参与底层开发。虽然处于早期测试阶段,但已能在Linux、macOS和Windows(通过WSL2)等主流系统运行。该项目主要面向对浏览器技术有研究兴趣的开发者,未来目标是打造能流畅支持现代网页应用的全功能浏览器。开发团队积极鼓励技术爱好者加入社区,共同参与代码优化和新特性开发。
3twenty
-
今日星标
463 -
总星标数
26,361
TypeScript
GitHub - twentyhq/twenty: Building a modern alternative to Salesforce, powered by the community.
Twenty 是一个由社区驱动的开源客户管理系统,旨在替代传统昂贵的CRM工具。它能帮助中小企业轻松管理客户信息、跟踪销售机会,并支持用时间轴记录沟通记录和待办事项。系统提供看板视图管理销售流程,内置邮件集成自动关联往来记录,适合需要灵活管理客户关系的销售团队。所有数据模型可自定义,企业能根据业务需求调整字段和流程。开发者还能通过API连接其他工具,实现自动化工作流。采用类似Notion的现代交互设计,支持快捷键操作,让用户像使用生产力工具一样管理客户资源。
4AstrBot
-
今日星标
397 -
总星标数
4,339 -
连续上榜
3天
Python
这是一个能快速搭建智能聊天机器人的开发框架,支持QQ、微信、Telegram等主流社交平台接入。它内置了GPT、Gemini等十多种AI模型,普通人也能轻松创建能处理文字、图片甚至语音对话的机器人。自带可视化控制面板,可一键部署到服务器,企业能用它搭建跨平台的智能客服系统,开发者可以通过插件扩展代码执行、网页搜索等高级功能。支持内容审核和速率限制,适合社群管理场景,还能对接知识库实现行业问答机器人。个人用户可以用它在自己的社群部署AI助手,开发者则能基于框架快速定制企业级对话应用。
5fastrtc
-
今日星标
391 -
总星标数
1,390 -
连续上榜
3天
Python
GitHub - freddyaboulton/fastrtc: The python library for real-time communication
FastRTC是一个让Python函数变身实时音视频流的开发神器。它能将普通代码快速转化为支持视频会议、语音聊天的交互程序,自动处理语音识别和视频传输等复杂技术细节。开发者只需专注业务逻辑,就能轻松打造智能语音助手、实时视频滤镜、在线教育系统等应用。内置网页界面和电话接口功能,可直接生成可交互的演示demo,比如与ChatGPT语音对话、实时物体检测、语音控制代码编辑等场景。无论是为AI模型增加实时交互能力,还是给传统应用添加音视频功能,都能通过简单API快速实现。
6DiffSynth-Studio
-
今日星标
269 -
总星标数
7,392
Python
GitHub - modelscope/DiffSynth-Studio: Enjoy the magic of Diffusion models!
DiffSynth Studio是一个专注于图像与视频生成的AI工具库,能够快速生成高清图片和流畅的长视频。它整合了Stable Diffusion、HunyuanVideo等主流模型,支持通过文字描述生成画面,还能对已有视频进行风格化处理、卡通渲染和智能补帧。该项目特别擅长处理影视级分辨率内容,能在普通显卡上实现129帧长视频生成,并提供画笔辅助创作功能让用户实时调整AI绘图。无论是制作动画短片、提升视频画质,还是为游戏开发快速生成素材,都能通过简单的代码调用或可视化界面轻松实现。其特色功能包括多模型联合控制生成、实体级精准编辑和4K级超分修复,适合数字艺术创作、短视频制作和影视特效预处理等场景。
7clash-verge-rev
-
今日星标
201 -
总星标数
48,849
TypeScript
8fish-shell
-
今日星标
200 -
总星标数
28,498 -
连续上榜
2天
Rust
GitHub - fish-shell/fish-shell: The user-friendly command line shell.
fish 是一个面向普通用户的智能命令行工具,主打"开箱即用"的设计理念。它通过彩色语法高亮实时反馈命令输入正确性,输入时自动推荐历史命令,并提供更直观的智能补全功能,大幅降低命令行使用门槛。特别适合需要频繁使用终端但又希望提升效率的开发者和运维人员,其友好的交互设计也让刚接触命令行的新手更容易上手。支持在 macOS、Linux 和 Windows 的 Linux 子系统运行,可通过包管理器快速安装。内置帮助系统能直接在终端查看使用教程,日常操作无需额外配置就能获得流畅体验,显著提升命令行工作效率。
9vision-agent
-
今日星标
116 -
总星标数
3,342 -
连续上榜
2天
Python
GitHub - landing-ai/vision-agent: Vision agent
VisionAgent是一个帮助开发者利用代理框架生成代码来解决视觉任务的库。它提供了工具和功能,可以用于图像中物体的检测、计数和可视化,还支持视频文件的处理。通过简单的代码调用,开发者可以快速生成并执行视觉任务相关的代码。VisionAgent支持多种大型语言模型(LLM),并提供了灵活配置选项。最便捷的使用方式是通过其提供的Web应用进行快速测试。