FastLLM 项目使用教程

最新推荐文章于 2024-09-26 22:25:34 发布

陆璞朝Jocelyn

最新推荐文章于 2024-09-26 22:25:34 发布

阅读量417

点赞数 3

本文链接：https://blog.csdn.net/gitblog_00308/article/details/141048849

版权

FastLLM 项目使用教程

fastllm纯c++的全平台llm加速库，支持python调用，chatglm-6B级模型单卡可达10000+token / s，支持glm, llama, moss基座，手机端流畅运行项目地址:https://gitcode.com/gh_mirrors/fa/fastllm

1. 项目的目录结构及介绍

FastLLM 是一个纯 C++ 实现的多平台高性能大模型推理库。以下是项目的目录结构及其介绍：

fastllm/
├── docs/                # 文档目录
├── example/             # 示例代码
├── include/             # 头文件
├── pyfastllm/           # Python 调用接口
├── src/                 # 源代码
├── test/                # 测试代码
├── third_party/         # 第三方库
├── tools/               # 工具目录
├── .dockerignore        # Docker 忽略文件
├── .gitignore           # Git 忽略文件
├── .gitmodules          # Git 子模块配置
├── CMakeLists.txt       # CMake 配置文件
├── Dockerfile           # Docker 构建文件
├── LICENSE              # 许可证文件
├── README.md            # 项目介绍文档
├── README_EN.md         # 英文项目介绍文档
├── docker-compose.yaml  # Docker Compose 配置文件
├── install.sh           # 安装脚本
├── main.cpp             # 主程序文件
├── requirements-server.txt # 服务端依赖文件