视源NLP面经二面 2021-05-14

最新推荐文章于 2022-06-07 16:04:57 发布

Sudan_大树

最新推荐文章于 2022-06-07 16:04:57 发布

阅读量248

点赞数 2

分类专栏：面经

本文链接：https://blog.csdn.net/weixin_44929977/article/details/116799385

版权

3 篇文章 0 订阅

订阅专栏

一面过了，今天就二面了
加粗的就是答不上来的
面试方式：电话面试

说我经历很丰富，疯狂问项目的idea和细节，问得我有点害怕

比赛的主要贡献是什么？
不就是清洗数据、数据增强、调参这些琐事不停的做吗
数据清洗有用过哪些方式；
不同的bert预训练模型的特别之处；还了解过哪些预训练模型
这次大概能说出一些了：roberta就动态mask；wwm就整个中文词mask；还有ELMO和GPT讲了一通
中文NER如何加入词语信息
可惜我lattce-lstm和Ma的论文只粗略看了一下，但还是大概了解的
又问了NER大小实体覆盖怎么解决？
比赛遇到过，直接加规则，把大的或者小的删掉
追问：还有别的吗
或者用每一种实体单独预测边界，遇到多重预测就删大或者删小（其实也差不多）

教育软件的问题分类，按照知识点分
肯定有关键词，直接上注意力，不如直接上BERT，BERT forever，yyds
如果是多级分类呢，先分大类，再分大类中的小类
粗暴就直接三次分类，改进一点就把大类的概率×各个小类的概率
又问了一次错误传播问题，大类分错了怎么办
又回答了一次联合学习，大类小类一起分
说我联合学习也是一种解决方式，但如果想加一些限制呢，比如一类分到了函数这个大类，但是二级分类时分到了几何那边
粗暴就直接加规则，但我说出了一个精妙的方法，用CRF的标签转移矩阵，设置一个类别转移，学习一个大类转移到一个小类的概率。
不得不说我觉得我最后提出的这个解决方案我觉得还是挺精妙的，完美ending。

二面面了一个小时，聊的还是挺愉快的，也有所收获，了解了这个公司的大概一些落地场景。

关注