文章目录 流式变换BERT-flow带白化处理的BERT-whitening对比学习的SimCSE BERT encode出来的文本向量有两个问题: BERT encode出来的向量表达具有各向异性: 用不同的方式去衡量向量,表现出来不同的语义,差别很大,也就是不能完整的衡量出 BERT 向量中全部语义信息。分布不均匀,低频词分布稀疏,高频词分布紧密 : 也就是高频词会集中在头部,离原点近;低频词会集中在尾部,离原点远;高频词与低频词分布在不同的区域,那高频词与低频词之间的相识度也就没法计算了。这也反映出来的就是明显的低频词没有得到一个很好的训练。同时,高频词频次高,也会主宰句子表达。 流式变换BERT-flow 带白化处理的BERT-whitening 对比学习的SimCSE