- 博客(10)
- 收藏
- 关注
原创 InterLM开源生态:Llama3开箱实测
你已经是一只成熟的Llama了,请介绍一下自己:Llama3是一个基于 TensorFlow 的深度学习框架,主要用于自然语言处理(NLP)任务。它提供了一系列的预训练模型和工具,可以帮助开发者快速构建和部署NLP应用程序。Llama3支持多种语言,包括中文、英文、法语等。它也具有良好的可扩展性和可移植性,可以在多种平台上运行。Llama3指令跟随比2代有了很大进步,meta出品值得信赖。
2024-05-05 20:03:39
445
2
原创 OpenCompass 大模型评测实战
OpenCompass是一个开源的开源评测框架,可以进行主观与客观评测。客观评测可以根据答案匹配度判断分数,因此较为简单,客观评价可以快速进行。主观评价可以使用人工评分,也可以使用机器学习评分,当有先进模型A时可以使用A模型给B模型打分,如果没有先进的模型也可以用竞争的方式打分,比如用A模型同时对BC打分,用相对准确度替代绝对准确度。
2024-04-26 15:39:07
284
6
原创 Lagent & AgentLego 智能体应用搭建
智能体指的是可以感知环境并根据观察到的信息作出决策的实体。这些决策旨在实现某种目标或任务。智能体可以是简单的,如一个自动温度调节器,也可以是复杂的,如一个用于高频交易的自动化程序,或者是高级的机器学习模型。自主性:智能体能够在没有外部操作的情况下独立执行任务。社会能力:在多智能体系统中,智能体可以与其他智能体或用户进行交互。反应性:智能体能够感知环境并对变化做出响应。主动性:智能体不仅对环境变化作出反应,还能够自发地采取行动以实现其设计目标。
2024-04-26 15:18:01
246
1
原创 LMDeploy 量化部署 LLM 实践
LMdeploy 有两个功能:量化与部署。量化加快推理速度减少现存占用,部署可以用客户端、网页以及Api迅速调用方便开发者使用。
2024-04-26 14:52:56
245
1
原创 XTuner 微调 LLM
RAG(Retrieval Augmented Generation)技术,通过检索与用户输入相关的信息片段,并结合外部知识库来生成更准确、更丰富的回答。解决 LLMs 在处理知识密集型任务时可能遇到的挑战。
2024-04-02 20:45:04
313
1
原创 书生·浦语开源大模型全链路开源体系
近些年大模型成为发展通用人工智能的途径,并且离用户越来越近,广泛应用于生产实践中。企业和个人用户对于大模型的需求日益旺盛,而开源模型是对大模型针对性改进的重要途径。书生·浦语大模型包含了7B、20B以及123B等诸多中文预训练模型,为中文应用提供基座模型支撑。同时它整合了大量开源数据集,为国产大模型应用与训练建立数据基础。此外还为模型微调、模型评估、模型推理等建立了相应的程序框架方便了国产大模型的训练和部署。
2024-03-31 17:06:50
216
1
原创 书生·浦语大模型全链路开源体系
书生·浦语大模型包含了7B、20B以及123B等诸多中文预训练模型,为中文应用提供基座模型支撑。同时它整合了大量开源数据集,为国产大模型应用与训练建立数据基础。此外还为模型微调、模型评估、模型推理等建立了相应的程序框架方便了国产大模型的训练和部署。
2024-03-20 16:13:52
132
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人