自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

2401_82700030的博客

源大模型 CSDN认证博客专家 CSDN认证企业博客

码龄175天

10: 原创

52万+: 周排名

5万+: 总排名

1万+: 访问

: 等级

363: 积分

267: 粉丝

253: 获赞

12: 评论

186: 收藏

私信

关注

热门文章

分类专栏

工具教程 4篇
推理优化 1篇

最新评论

Yuan2.0千亿大模型在通用服务器上的高效推理实现——以NF8260G7服务器为例
CSDN-Ada助手: 恭喜您在博客中分享了关于Yuan2.0千亿大模型在通用服务器上高效推理实现的经验，以NF8260G7服务器为案例进行了详细说明。这篇博客对于那些对服务器推理实现感兴趣的读者来说无疑是一篇有价值的文章。希望您能继续保持创作的热情和积极性，为我们带来更多有启发意义的内容。或许下一步您可以考虑分享一些关于模型优化或者其他服务器方面的实用经验，让读者们受益更多。期待您的下一篇作品！
【转载】快速上手！LLaMa-Factory最新微调实践，轻松实现专属大模型
装一袋星辰大海叭.: 你好，第5步，测试推理及效果展示如何加载出来
Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术
慢飞的小鸟: 抄袭别人的，自己验证下，这个里边的有的根本就用不了，调好的代码有要的联系我
Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术
源大模型: 您把这个错误提到github的issue上吧，研发同事会及时跟进
Yuan2.0大模型，联合向量数据库和Llama-index，助力检索增强生成技术
momo-201905: 你好，相关包都已经安装好，运行 milvus.py 的时候收到以下提示，能看出 milvus.py 源代码部分有什么要修改的么？谢谢。基础的 uri 地址已经修改，报错如下： RPC error: [__internal_register], <MilvusException: (code=800, message=database not found[database=yuan])>,

最新文章

推理优化

关注

文章平均质量分 96

关注数：文章数：1 文章阅读量：1199 文章收藏量：25

作者: 源大模型

这个作者很懒，什么都没留下…

展开

基于TensorRT-LLM的Yuan 2.0推理服务部署

自Yuan2.0大模型发布以来，团队一直致力于提高大模型的性能和效率。最近我们完成了基于TensorRT-LLM推理框架的Yuan2.0大模型部署实践，一起来尝试一下吧！TensorRT-LLM是2023年10月新发布的大模型推理部署框架，用其部署Yuan2.0大模型一方面可以显著提高模型推理速度和减少延时，让用户可以更快的获取推理结果；另一方面，利用TensorRT-LLM灵活的插件功能，使得用户在部署Yuan2.0时更有效的利用硬件资源从而节省硬件成本。

原创 2024-02-28 12:08:23 · 1203 阅读 · 0 评论