得见-CSDN博客

原创 L1G6000OpenCompass 评测书生大模型实践

发现这个数据集生成文件之前已经存在了，但是最后一行写的是[0:4]，我修正成了[0,1]cmmlu_datasets只是读取数据等的配置，具体数据需要去.cache里面读取。由于这里只评测了一个问题，所以每个学科的正确率只有0或者100%

2024-12-26 20:44:18 132

原创 L1G5000XTuner 微调个人小助手认知

首先成功安装XTuner，可以看到整体能微调的模型还是挺多的。成功微调出lora层。

2024-12-26 15:06:26 200

原创 L1G4000InternLM + LlamaIndex RAG 实践

RAG的主要原理是为外置一个知识库，然后将其分块，向量化，将问题也向量化，检索相似度接近的块，然后将块和问题一起作为提示输入到LLM中。使用rag之后，成功回答了出来，不过个人感觉也是根据xtuner的readme做出的回答。xtuner是上海ailab推出的微调框架，明显是模型出现了幻觉，回答错了。原来chat类的界面都是用streamlit搭建的。成功部署llamaindex 的网页版。

2024-12-24 23:43:58 240

原创 L1G3000浦语提示词工程实践

以kimi为例，对“strawberry”中有几个字母“r”这个任务进行实践。

2024-12-22 20:49:04 121

原创 L1G2000玩转书生「多模态对话」与「AI搜索」产品

2024-12-22 19:35:37 110

rag的一般步骤，对新唐书进行拆分，做向量化，然后再把问题做向量化，看可以匹配到哪些分块，再喂给llm，但是做跨文档的任务的时候不行。1.8B的模型注重在端侧运行，7B模型微调之后可能还只是根据训练数据做一些检索，20B模型才出现一些涌现能力，泛化能力加强。mineru高效文档解析工具，方便对pdf，word等文档数据进行解析，返回文本格式内容。灵笔主要是图文多模态模型，数学专门做数学题的，文曲星专门做高考题的。从训练数据、预训练、微调、部署、评测、应用，全链路开源。

2024-12-22 17:45:34 162

原创 L0G4000玩转HF/魔搭/魔乐社区

按照文档去huggingface上创建了项目，然后clone到codespace里。接着修改代码后上传，遇到access token问题，解决后继续上传。进入codespace进行pip安装。运行所给代码，成功下载。

2024-11-28 21:57:43 177

原创 L0G3000Git 基础知识

按照教程克隆自己fork的仓库下来，列出所有分支，并创建自己的本地分支class追踪远方仓库的class分支，最后创建自己的本地分支。维护了一个视频生成模型的笔记仓库。

2024-11-27 23:57:49 639

原创 L0G2000 Python 基础知识

直接运行示例代码会出现如图错误，打断点之后，res的值为'```json\n{\n "model_name": "书生浦语InternLM2.5",\n "developer": "上海人工智能实验室",\n "parameter_versions": ["1.8B", "7B", "20B"],\n "max_context_length": 1000000\n}\n```'

2024-11-27 17:38:08 195