热门RAG文章摘译:https://zhuanlan.zhihu.com/p/673392898
背景:图像模型在特殊业务场景下幻觉严重。
解决方案:
1.微调图像模型。
2.图像文本 rag
多模态RAG:https://zhuanlan.zhihu.com/p/678812531
https://blog.csdn.net/cycyc123/article/details/137225998
https://github.com/GoogleCloudPlatform/generative-ai/blob/main/gemini/use-cases/retrieval-augmented-generation/intro_multimodal_rag.ipynb
https://docs.llamaindex.ai/en/stable/use_cases/multimodal/
比较好的RAG论文:
https://arxiv.org/abs/2403.14374