2021年10月25日-京东NLP工程师一面面试题分享

最新推荐文章于 2024-07-31 11:44:59 发布

niuyunpang

最新推荐文章于 2024-07-31 11:44:59 发布

阅读量176

点赞数

文章标签：自然语言处理机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/niuyunpang/article/details/121265401

版权

问题1：如何计算文本相似度？

直接使用词向量做平均得到句向量，通过余弦相似度来计算

直接使用词向量做平均得到句向量，通过向量距离来计算

使用sentenceBert输出两个句子各自的句向量，通过余弦相似度来计算

使用sentenceBert输出两个句子各自的句向量，拼接起来，通过全连接层，再做二分类

使用simCSE输出两个句子各自的句向量，通过余弦相似度来计算。

福利：七月在线干货组最新整理的《名企AI面经100篇》&《机器学习十大算法系列》PDF，文末免费领！

问题2：Bert模型的输出一般接上一个全连接层做下游的任务，是否可以用xgboost代替全连接层？为什么？

不能使用xgboost代替

不能使用任何非参数模型代替全连接层，比如以树模型为基础的模型，SVM。

因为Bert中的参数的调整是需要通过梯度反向传播来进行梯度下降来更新的，如果梯度都没有，那么如何更新参数。如果需要梯度的话，就必须上可对参数求导的模型，如果参数可求导，那么一定是有参数模型，比如逻辑回归，全链接层。

问题3：描述下Roberta模型和bert有什么不同？

Roberta可以直接看成收敛后的bert模型

在更加大量的数据集上做了Bert预训练任务

取消了NSP任务，只关注MLM任务

使用了动态的MASK方

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。