- 博客(12)
- 收藏
- 关注
原创 L1G6000OpenCompass 评测书生大模型实践
发现这个数据集生成文件之前已经存在了,但是最后一行写的是[0:4],我修正成了[0,1]cmmlu_datasets只是读取数据等的配置,具体数据需要去.cache里面读取。由于这里只评测了一个问题,所以每个学科的正确率只有0或者100%
2024-12-26 20:44:18
132
原创 L1G4000InternLM + LlamaIndex RAG 实践
RAG的主要原理是为外置一个知识库,然后将其分块,向量化,将问题也向量化,检索相似度接近的块,然后将块和问题一起作为提示输入到LLM中。使用rag之后,成功回答了出来,不过个人感觉也是根据xtuner的readme做出的回答。xtuner是上海ailab推出的微调框架,明显是模型出现了幻觉,回答错了。原来chat类的界面都是用streamlit搭建的。成功部署llamaindex 的网页版。
2024-12-24 23:43:58
240
原创 L1G1000书生大模型全链路开源体系
rag的一般步骤,对新唐书进行拆分,做向量化,然后再把问题做向量化,看可以匹配到哪些分块,再喂给llm,但是做跨文档的任务的时候不行。1.8B的模型注重在端侧运行,7B模型微调之后可能还只是根据训练数据做一些检索,20B模型才出现一些涌现能力,泛化能力加强。mineru高效文档解析工具,方便对pdf,word等文档数据进行解析,返回文本格式内容。灵笔主要是图文多模态模型,数学专门做数学题的,文曲星专门做高考题的。从训练数据、预训练、微调、部署、评测、应用,全链路开源。
2024-12-22 17:45:34
162
原创 L0G4000玩转HF/魔搭/魔乐社区
按照文档去huggingface上创建了项目,然后clone到codespace里。接着修改代码后上传,遇到access token问题,解决后继续上传。进入codespace进行pip安装。运行所给代码,成功下载。
2024-11-28 21:57:43
177
原创 L0G3000Git 基础知识
按照教程克隆自己fork的仓库下来,列出所有分支,并创建自己的本地分支class追踪远方仓库的class分支,最后创建自己的本地分支。维护了一个视频生成模型的笔记仓库。
2024-11-27 23:57:49
639
原创 L0G2000 Python 基础知识
直接运行示例代码会出现如图错误,打断点之后,res的值为'```json\n{\n "model_name": "书生浦语InternLM2.5",\n "developer": "上海人工智能实验室",\n "parameter_versions": ["1.8B", "7B", "20B"],\n "max_context_length": 1000000\n}\n```'
2024-11-27 17:38:08
195
原创 第四期书生大模型实战营 L0G1000 Linux 基础知识
成功在/root/demo中运行hello_world.py,原来share中的文件没有写的权限,安装gradio着实卡了一会。添加了公钥和配置文件的私钥地址,进行秘钥连接。这里直接通过vscode配置文件连接开发机。完成SSH连接与端口映射并运行。
2024-11-26 22:04:54
268
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人