问题
想找一个支持中文的embedding模型(把一段文本转化成多维度的向量)。Hugging Face平台上面共享了很多开源模型,算是这年头(2025年),大家都把自己开源模式都往上放的地方了吧。现在去这个平台上面找一个开源embedding模型。
解决
打开huggingface首页,找到Models页面如下图:
打开这个页面https://huggingface.co/models,开始查找你需要的模型:
选择任务为特征提取(Feature Extraction)的意思就是做embedding。接下来继续:
接下来继续:
这里的开源协议选择MIT协议。接下来选择能否试用:
这里的标签意思就是能在HF平台上面直接通过API使用的。到这里平台支持中文,支持MIT协议,能直接在HF平台上面试用的embedding模型就只剩这个了。
总结
HF平台能够直接试用模型看效果,不用关心模型部署细节挺好。