阿里nlp算法实习记录

最新推荐文章于 2024-08-16 11:24:16 发布

吴允泰

最新推荐文章于 2024-08-16 11:24:16 发布

阅读量3.2k

点赞数

分类专栏：笔记文章标签：阿里巴巴实习面试

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Woody0729/article/details/79508194

版权

这篇博客记录了作者在阿里巴巴NLP算法实习的面试经历，包括电话一面的编程题、模型理论、优化方法、过拟合解决、HMM与CRF的区别、GRU与LSTM的讲解，以及面对数据问题的解决方案。面试中讨论了正则化、数据噪声处理、知识表示模型等话题。

摘要由CSDN通过智能技术生成

开贴记录实习面试,为了以后找工作备用

电话一面:

在线编程, 求两个有序数组交集, 我写了一个比暴力法强一点的版本,从头遍历A和B,A大B往后移动,B大A往后移动.时间复杂度O(M+N)

他: 如果其中一个数组很长怎么办?

当时太紧张没答出来.应该是用二分查找

他: variance和bias是什么, 如果这两个东西高了分别代表什么?

我: variance是方差, bias是误差. variance高了代表过拟合, bias高了代表欠拟合.

他:优化方法了解哪些?

我:SGD,牛顿法,最小二乘法

他:说一下momentum?

我:不太了解,但是我的理解可能是梯度,梯度就是更新的方向,学习率就是步长.

他: 过拟合有什么方法解决?

我: 正则化, dropout,early stopping

他: 正则化介绍一下

我: 有L1和L2正则化,比较常用的L2正则化

他:有什么区别?为什么好用?

我: L1正则化是一范数,L2是二范数.在损失后面加正则项一起优化,相当于给参数加了一层限制,也就是所谓的权重衰减,这样可以避免过大和过小的数据对模型影响太大.

他:还可以,能不能说一下隐马尔可夫和条件随机场?

我:HMM是生成模型, 它是对X,Y的联合分布对P(X,Y)建模, 预测时利用P(X, Y)和输入的P(X)反推P(Y | X). CRF是判别模型,直接对P(Y|X)建模

他:你说的是模型上的区别, 能不能从理论上讲一下?

我: HMM是根据马尔科夫假设, 当前状态只和前一个状态有关, 他只考虑前面的.而CRF是在全局范围内的状态转移.

他:GRU和LSTM都知道吧,说一说GRU吧

我:GRU没怎么用过, 能不能说一说LSTM?

他:不行

我:(不知道对不对)GRU和LSTM不同点是他没有LSTM的cell状态, 它的输入通过sigmoid和tanh,巴拉巴拉,全是乱说

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

吴允泰 CSDN认证博客专家 CSDN认证企业博客

码龄8年

7: 原创

115万+: 周排名

74万+: 总排名

3万+: 访问

: 等级

411: 积分

2: 粉丝

7: 获赞

3: 评论

10: 收藏

私信

关注

热门文章

分类专栏

笔记 11篇

最新评论

python命令行下运行找不到文件的问题
吴允泰回复 dgysxc: 加入sys.path.append(os.path.abspath('%s/../..' % sys.path[0]))，用绝对路径
python命令行下运行找不到文件的问题
dgysxc: 所以要怎么办啊
阿里nlp算法实习记录
QIstay_foolish: 大佬，你好，很认真的看了几遍你写的实习面试问题，前一段时间投了华为的nlp，估计是挂掉了，没有回答好，请问你现在入职阿里了吗，希望有时间多分享分享大佬的经验。

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。