亮哥总结的“获取/增长知识的3种方式”:
1、看书/视频/上课等形式的学习。
2、与人交流。
3、工作。
注:“与人交流”的面试,受益很多。
①(某建筑科技公司)只是匹配搜索,只分词匹配也可大致满足(百度就是这么做的);
充分shuffle打乱洗牌,说是有研究:“每次换3张,效果最好”;
O(n)复杂度的算法 + 过多的数据量,比如样本量巨大的统计/搜索,如何优化:分片并行,或者,随机抽样(对样本的均衡有要求)
②为什么要用neo4j图数据库:多对多的关系。
③(百度)工业界sigmoid二分类应用。
判断某商家允不允许带宠物(数据可能是大众评论?)
④沈geng老师。为快速搜索,使用什么数据结构,存储海量的手机号:类似“10叉树” 。
(联想下,小写英文字母/拼音组合,比如26叉树)
另,短暂共事中,他提到,语义向量距离远不远(差别大不大)! 👍🏻👍🏻👍🏻
⑤某国际证券。文章中“匹配/NER”出上市公司:使用的捷径“斯坦福的模型?”
⑥中关村科技大厦?政府下辖Ai学院? tfidf:“我有你没有”!👍🏻👍🏻👍🏻
⑦做公安项目的公司。推荐算法应该是传统机器学习?没细研究。