moonshot:一个用于评估任何 LLM 应用程序的简单模块化工具

大模型相关目录

大模型,包括部署微调prompt/Agent应用开发、知识库增强、数据库增强、知识图谱增强、自然语言处理、多模态等大模型应用开发内容
从0起步,扬帆起航。

  1. swift与Internvl下的多模态大模型分布式微调指南(附代码和数据)
  2. 多模态大模型Internvl-1.5-26B微调后部署及测试实录(附代码)
  3. 多模态大模型Internvl-2-26B的OCR赋能方案(附代码)
  4. miniconda+xinference的大模型推理部署指南
  5. Mem0:大模型最强赋能“有记忆的LLM”
  6. 再谈Agent:Dify智能体实现Txet2SQL
  7. Moe模式:或将是最好的大模型应用开发路径
  8. 一文带你了解大模型RAG
  9. 详细记录swfit微调interVL2-8B多模态大模型进行目标检测(附代码)
  10. DIfy中集成magic-pdf实现文档解析agent与多模态大模型图文问答
  11. 大模型Prompt trick:利用大模型同情心提升模型性能
  12. 一文带你入门大模型微调
  13. 开源大模型LLaMA架构介绍
  14. CyberScraper-2077+simple-one-api:使用大模型爬虫
  15. 大模型高效利用结构化信息研究:HTML格式或许更好
  16. moonshot:一个用于评估任何 LLM 应用程序的简单模块化工具

文章目录


Moonshot 由 AI Verify Foundation 开发,是首批将基准测试和红队结合在一起的工具之一,可帮助 AI 开发人员、合规团队和 AI 系统所有者评估 LLM 和 LLM 应用程序。

在这个初始版本中,Moonshot 可以通过多个界面使用:

用户友好的 Web UI - Web UI 用户指南
交互式命令行界面 - CLI 用户指南
通过 Moonshot 库 API 或 Moonshot Web API 无缝集成到您的 MLOps 工作流程中

在这里插入图片描述
环境需求:

Python 3.11 (We have yet to test on later releases)

Git

Virtual Environment (This is optional but we recommend you to separate your dependencies)

# Create a virtual environment
python -m venv venv

# Activate the virtual environment
source venv/bin/activate
If you plan to install our Web UI, you will also need Node.js verion 20.11.1 LTS and above

安装
要安装 Project Moonshot 的全部功能:

# Install Project Moonshot's Python Library
pip install "aiverify-moonshot[all]"

# Clone and install test assets and Web UI
python -m moonshot -i moonshot-data -i moonshot-ui
python -m moonshot web

在这里插入图片描述
当然我自身工作不涉及评估,有需求的网友可以测试一下看看。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

写代码的中青年

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值