回顾去年nlp面试所得

亮哥总结的“获取/增长知识的3种方式”:
1、看书/视频/上课等形式的学习。
2、与人交流。
3、工作。

注:“与人交流”的面试,受益很多。

①(某建筑科技公司)只是匹配搜索,只分词匹配也可大致满足(百度就是这么做的);

充分shuffle打乱洗牌,说是有研究:“每次换3张,效果最好”;

O(n)复杂度的算法 + 过多的数据量,比如样本量巨大的统计/搜索,如何优化:分片并行,或者,随机抽样(对样本的均衡有要求)

②为什么要用neo4j图数据库:多对多的关系。

③(百度)工业界sigmoid二分类应用。

判断某商家允不允许带宠物(数据可能是大众评论?)

④沈geng老师。为快速搜索,使用什么数据结构,存储海量的手机号:类似“10叉树” 。

(联想下,小写英文字母/拼音组合,比如26叉树)

另,短暂共事中,他提到,语义向量距离远不远(差别大不大)! 👍🏻👍🏻👍🏻

⑤某国际证券。文章中“匹配/NER”出上市公司:使用的捷径“斯坦福的模型?”

⑥中关村科技大厦?政府下辖Ai学院? tfidf:“我有你没有”!👍🏻👍🏻👍🏻

⑦做公安项目的公司。推荐算法应该是传统机器学习?没细研究。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

符小东

你的鼓励将是我创作的最大动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值