- 博客(3)
- 收藏
- 关注
原创 关于书生·浦语大模型全链路开源体系 笔记
涵盖了从数据、预训练、微调、部署评测和应用框架的完整链条,个人理解书生体系在数据集开放、微调工具以及最为知名的openCompass工作确实做的还不错,知名度还可以,花了很长时间功夫来实现了整体开源体系;高质量的语料也应用在书生内生大模型体系当中,高质量语料的数据吻合效应更加突出,对于Loss分布图中就能够看出来,以更少的模型参数,实现更强的性能;2. 微调能力,X-tuner,是书生体系重点打造的能力,比较重要的一点是上海人工智能实验室有很强的显卡储备,可以实现全链路纳管;
2024-08-01 11:21:14
49
原创 InternVL - Lab 入门岛闯关-第二关 Python
1. wordcount 编程:难度并不是很大,主要考察对于str 的熟悉程度,以及一些正则表达式,不过也可进行穷举方法,这一块还是自己手写了一下,不要用LLM 作弊哦。这一块不是很明确,在针对比较复杂的依赖关系的时候,为什么使用命令行,优势到底是什么,难道是减少中间的繁琐过程吗,希望在后续学习中对这个问题保持持续关注。2.1.1 主要对换行、标点符号的处理结果上,看看是否列的全,这个地方可以用正则表达式也可只保留空格和大小字母和` 字符,其他都不要,因人而异。2.1.2 转换为小写是否正确;
2024-07-21 21:17:13
205
原创 InternVL - Lab 入门岛闯关-第一关 Linux
1.1 总体评估:没有什么难度,教程每一步都介绍的详细也很实用,尤其是在端口映射、开发机、docker和VS code链接上教程的很详细,通过端口映射,使得在VS Code 上很轻量级的与开发机进行安全隧道链接,并进行实时开发和运行测试。试了很多个,再次不再一一展示了,tumx组件非常好用,且很有意义,解决session单一对话不便批量处理且attach的问题,这个后面要好好研究;整体来说,这个教程化繁为简,把复杂的问题简化,不过分叙述概念和专业术语,先有感性认识和上手,非常不错。
2024-07-21 21:03:38
100
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人