回顾去年nlp面试所得_cvte nlp面试-CSDN博客

本文链接：https://blog.csdn.net/m0_60500450/article/details/125164116

亮哥总结的“获取/增长知识的3种方式”：
1、看书/视频/上课等形式的学习。
2、与人交流。
3、工作。

注：“与人交流”的面试，受益很多。

①（某建筑科技公司）只是匹配搜索，只分词匹配也可大致满足（百度就是这么做的）；

充分shuffle打乱洗牌，说是有研究：“每次换3张，效果最好”；

O(n)复杂度的算法 + 过多的数据量，比如样本量巨大的统计/搜索，如何优化：分片并行，或者，随机抽样(对样本的均衡有要求)

②为什么要用neo4j图数据库：多对多的关系。

③(百度)工业界sigmoid二分类应用。

判断某商家允不允许带宠物(数据可能是大众评论？)

④沈geng老师。为快速搜索，使用什么数据结构，存储海量的手机号：类似“10叉树” 。

（联想下，小写英文字母/拼音组合，比如26叉树）

另，短暂共事中，他提到，语义向量距离远不远(差别大不大)! 👍🏻👍🏻👍🏻

⑤某国际证券。文章中“匹配/NER”出上市公司：使用的捷径“斯坦福的模型？”

⑥中关村科技大厦？政府下辖Ai学院？ tfidf：“我有你没有”！👍🏻👍🏻👍🏻

⑦做公安项目的公司。推荐算法应该是传统机器学习？没细研究。