- 博客(229)
- 收藏
- 关注
原创 【LLM】Llama-Factory + 大模型必备的 “数据处理”
"prompt": "question", # 你的字段名: 标准字段名"question": "什么是AI?","answer": "AI是人工智能的缩写..."原始数据↓数据探索统计(了解数据基本情况)↓数据清洗(去空、去短、去长、去乱码)↓去重处理(去除重复样本)↓格式转换(转为Alpaca或ShareGPT格式)↓质量评估(检查指令清晰度、输出有效性、有害内容)↓数据增强(可选,同义改写、回译等)↓。
2026-04-25 22:46:00
378
原创 【多模态大语言模型】Qwen-VL 系列解读,持续更新中。。。
网上关于QwenVL系列整理的不太好看,自己整理整理,方便自己看。问最新的AI,回复的也不是最新的进展。模态编码器(Modality Encoder):将多模态的数据编码成向量空间特征,该模块通常是单独进行预训练的,典型的方法有基于CNN的ResNET,基于Transformer的ViT等。输入投影层(Input Projector):将模态编码器的输出映射到LLM的输入特征空间的适配层,一般模型结构比较简单,不同的多模态模型一般是随机初始化该模块的参数做冷启训练。
2026-04-17 00:58:25
808
原创 【论文阅读】Equivariant Contrastive Learning for Sequential Recommendation
【论文阅读】Equivariant Contrastive Learning for Sequential Recommendation
2023-11-03 23:29:10
1730
1
原创 【论文阅读】Tiny-NewsRec: Effective and Efficient PLM-based News Recommendation(LLM4RS)
大模型在推荐系统上的应用。Tiny-NewsRec: Effective and Efficient PLM-based News Recommendation(LLM4RS)
2023-10-16 20:56:56
549
2
原创 【论文阅读】EasyEdit:Editing Large Language Models: Problems, Methods, and Opportunities (三)
【论文阅读】EasyEdit:Editing Large Language Models: Problems, Methods, and Opportunities (三)
2023-10-11 15:50:00
590
图数据集(图结构数据集)+图神经网络-深度学习
2023-03-09
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅