**
1 LASER 给指定文件计算句子向量
**
./embed.sh raw.txt zh zh_embeddings.raw
raw.txt:未经处理的文件
zh_embeddings.raw:句子向量
假设raw.txt是中文。raw.txt是未分词的数据,未经tokenizer.perl处理的数据,处理过程中用jieba进行分词,并进行bpe切分,之后再计算得到zh_embeddings.raw
**
2.用得到的句子向量计算句子相似度
**
zh_embeddings.raw和en_embeddings.raw是两个平行语料分别计算的句子向量,用句子向量计算平行语料中每对句子的相似度