- 博客(4)
- 问答 (3)
- 收藏
- 关注
原创 InternLM2-Chat-1.8B 模型部署
使用端口映射后出现警告,而且因为我之前已经配置公钥了,不需要再次输入密码,和教程不一样,还以为是哪里出错了。其实不是error,不理就可以了。又浪费了一小时,小麻。
2024-10-03 12:42:34 71
原创 书生·浦语大模型全链条——浅显理解
用当前模型进行辅助数据、指令优化,用于预训练数据和对齐数据,得到更好模型。随后这个更好模型又进行辅助优化,加速自身迭代。预训练:InternEvo,性能超过DeepSpeed,显存、分布式优化。微调:XTuner,微调和偏好对齐算法。在消费级设备上,1.8B模型也无法全参数微调。长文理解、精确处理,使用大海捞针实验,7B模型已可以实现百万级token的长文理解。部署:LMDeploy,性能超过vllm。MindSearch 思索式搜索应用。数据 :书生·万卷,多媒体语料库。MinerU 文档解析。
2024-10-03 11:23:49 185
原创 书生大模型:Python 基础知识
应该是个挺容易的题。但是不知道python多行字符串怎么输入,属实给我整麻了。输入的多行字符串必须在python的控制台输入,在pycharm运行输入的话,会被换行符中断输入流。
2024-10-02 22:20:57 199
TA创建的收藏夹 TA关注的收藏夹
TA关注的人