bert存在问题:
共现: bert 模型的原理,利用上下文c对token的概率求导,本质是 c与token的共现关系
编辑距离与similarity关系:bert模型编辑距离越大,similarity越小,edit-distance越小,similarity越大, bert-flow则相反,均匀分布,similarity与编辑距离无关
高频词低频词与均值的分布关系,语义不完整的空间存在:以整体语义向量均值为原点, 高频词接近原点,低频词远离,分布不均,不在同一个空间
bert存在问题:
共现: bert 模型的原理,利用上下文c对token的概率求导,本质是 c与token的共现关系
编辑距离与similarity关系:bert模型编辑距离越大,similarity越小,edit-distance越小,similarity越大, bert-flow则相反,均匀分布,similarity与编辑距离无关
高频词低频词与均值的分布关系,语义不完整的空间存在:以整体语义向量均值为原点, 高频词接近原点,低频词远离,分布不均,不在同一个空间