一周涨了 15k 的 Star!炸裂开源!

一键将URL转换为LLM友好输入的工具

Reader是由Jina AI开发的一项创新开源工具,致力于改善大型语言模型(LLMs)的输入质量。这个工具不仅免费、稳定,而且可扩展,是Jina AI核心产品之一。

开源地址:https://github.com/jina-ai/reader

它通过两个主要功能简化了信息的获取和处理:

1. URL转换:通过在任何URL前添加 https://r.jina.ai/ ,Reader可以将网页内容转换为LLM友好的格式,自动为缺少 alt 标签的图片生成说明,并以特定格式呈现。

4daec5282577f6dd85242409daa34760.png

2. 网络搜索:使用 https://s.jina.ai/ 前缀,Reader 能够搜索网络并返回最相关的五个结果,每个结果都以 LLM 友好的格式呈现。

b8f3ce902579abcf76fd271b8fcaf20b.png

举个例子

我在 GPT-4 的百度百科主页网址前添加 https://r.jina.ai/:

e937eb433b5fb1f2453340de3cc037e3.png

点击回车后,就会输出如下格式,该格式可以让 LLM 更好的提取信息:

7cf16b7ae78c8195a91a8346606e91d1.png

2. 用C语言和CUDA训练大型语言模型

在深度学习领域,PyTorch和TensorFlow等框架几乎占据了主导地位。但如果你对底层原理充满好奇,或者想从头开始理解模型训练的每一个细节,那么 llm.c 项目绝对值得一探。

这个开源项目短短一周,就获得了 15k 的 Star!

llm.c 是一个用纯C和CUDA编写的大型语言模型(LLM)训练项目。它的核心目标是提供一个简单、清晰的实现(仅仅 1000 行代码),让用户能够在不需要庞大框架支持的情况下,训练和理解GPT-2模型。

这个项目不仅是对技术的一次挑战,也是对教育的贡献,因为它让用户能够深入到模型训练的每一个细节。

本项目以简洁、直观的方式,将复杂的深度学习模型训练过程用C语言呈现出来,让更多人能够接近并理解这一领域。

开源地址:https://github.com/karpathy/llm.c

d1e2109c2a3c38ffe19a2244599e3cd4.png

历史盘点

逛逛 GitHub 每天推荐一个好玩有趣的开源项目。历史推荐的开源项目已经收录到 GitHub 项目,欢迎 Star:

地址:https://github.com/Wechat-ggGitHub/Awesome-GitHub-Repo

cdf1dee103885bb7a5b8df60e5ea8084.png


推荐阅读

1. GitHub 上有什么好玩的项目?

2. 推荐 5 个本周很火的 GitHub 项目

3. 推荐 5 个近期火火火的 GitHub 项目

4.  推荐 5 个令人惊艳的 GitHub 项目

0786ece0b364b2420108f5d296da2e0a.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值