每个文本的语义都可以表示为一个多维空间内的点,相似文本的点应该距离相对较近,反之,语义无关的点距离应该相对较远。 文本的语义向量有较多的应用场景,比如:EBR(embedding retrieval)、相似文本聚类等。接下来的3个章节将具体讲述文本的语义编码及其应用。 文本语义编码 模型框架训练数据获取模型蒸馏模型效果评测服务部署 干预平台相同语义话术召回 相同语义话术召回逻辑向量检索系统Milvus键值对存储Redis 长尾query进行相似语义聚类 聚类算法大数据下spark聚类评价指标