
LLaVaVision: 革新视觉辅助技术的开源项目
LLaVaVision是一个简单而强大的'Be My Eyes'网络应用,它的后端基于llama.cpp和LLaVA(Large Language and Vision Assistant)模型。该项目由GitHub用户@lxe创建,灵感来源于Fuzzy-Search/realtime-bakllava项目。LLaVaVision的核心功能是实时描述摄像头捕捉的图像内容,并通过Web Speech API将文字转换为语音输出,为视障用户提供即时的环境描述。


















