推荐 3 个 yyds 的 GitHub 开源项目!

本期推荐开源项目目录:

1. 基于 AI 的答案引擎

2. 葫芦 AI:在国内使用 4 个知名大模型

3. 本地知识库问答

4. 媒体平台爬虫


01 基于 AI 的答案引擎

Morphic 是一个由 AI 驱动的答案引擎,利用了大模型技术为用户提供了一个动态、互动的问答体验。

通过结合强大的 AI 模型和直观的用户界面,提供一个全新的信息检索和交互方式。用户可以通过自然语言与系统交互,获取定制化的答案和解决方案。

如下是该开源项目基于的技术栈:

  • 应用框架: Next.js、文本流/生成性 UI: Vercel AI SDK

  • 生成模型: OpenAI、搜索 API: Tavily AI

  • 组件库: shadcn/ui、无头组件原语: Radix UI、样式: Tailwind CSS

开源地址:https://github.com/miurla/morphic

图片

02 本地知识库问答

QAnything 是由网易有道团队开发的一个本地知识库问答系统,旨在支持广泛的文件格式和数据库,允许离线安装和使用。该项目的核心特点包括数据安全、跨语言问答支持、支持大规模数据问答、高性能的生产级系统以及用户友好的一键安装和部署。

支持在整个过程中拔掉网络线进行安装和使用,无论文档的语言如何,都可以自由切换中英文问答。

采用两阶段检索排名,解决大规模数据检索的性能下降问题;数据越多,性能越好。可选择多个知识库进行问答。

QAnything 采用两阶段检索方法,以应对大量知识库数据的场景。在数据量增加时,单阶段嵌入检索会存在检索性能下降的问题。

通过第二阶段的重排,可以稳定提高准确率,实现数据越多性能越好的效果。QAnything 使用的检索组件 BCEmbedding,擅长中英文语言差异的桥接,在语义表示评估和RAG评估中表现出色。

开源地址:https://github.com/netease-youdao/QAnything

图片

图片

03 媒体平台爬虫

MediaCrawler 由开发者 NanmiCoder 创建和维护。该项目是一个开源的媒体内容爬虫工具集,专注于从多个流行的社交媒体和内容平台上抓取数据,特别是针对小红书笔记、抖音视频、快手视频、B站视频和微博帖子的评论信息。

多平台支持:包括但不限于小红书、抖音、快手、B站和微博。

评论抓取:该项目主要关注于抓取用户的评论信息,这对于市场研究、舆论监控和数据分析等方面非常有用。

开源地址:https://github.com/NanmiCoder/MediaCrawler

图片

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值