[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8V89rCkp-1647711740516)(C:\Users\admin\AppData\Roaming\Typora\typora-user-images\image-20220316201046269.png)]
- 一个query一一对应一个doc
- 长度、关键词、
- 思路:
代码baseline
- 上分点:品牌词典
- 有没有必要使用已有的词向量?没有,因为数据足够
- IDF:计算单词重要性即识别出哪些词在数据中是重要的
- simCSE以上0.2
- 先做无监督再做有监督、先做无监督再做有监督。
最近太忙了55555,我明天继续补补,更新task2。