- 写到index_buffer里的数据能检索到么? 来自大厂
- 挺多面试官会问es是实时系统嘛 一般看网上文章都是近实时 需要一秒才能查询的到 ,但我都会跟他门说其实可以实时查询 , 我前公司之前曾经业务上没判好需求 ,直接替代mysql了 ,可以支持交易 , 只是我门用的是32c 128 g内存的机器去做…
- 请问为什么es id 路由 是使用hash算法 ,貌似不是一致性hash? 使得不能动态分片 ,像目前如果需要分片都需要reindex ?
- 今天面试腾讯的运维,被问到es 如何进行分片,结果回答的不是很满意
- 最近在面试,就在这个下面总结吧,今天上午问了ES的规模,数据量,聚合遇到什么问题,不管在集群还是聚合等其他方面有没有做过调优,排序是怎么排序的;语言方面问了GC,线程池,HashMap,算法是两个有序数组合并。
- Lucene的底层结构,如何设计一个分词器
- 下午问了下搜索集群的优化,同义词,点击量高的商品如何提高排序,对特定用户查询符合标签的商品,java问了下线程池的参数,怎么定义的
- 早上面还是问集群的规模,节点,数据量等,集群的优化,es写入流程,查询流程,分词器相关的内容,java问的string的区别,jvm内存模型,垃圾收集算法,优缺点
- 早上问的:主要负责什么项目,ES有没有什么优化,对GC有没有什么优化,ES和Redis按ID查询有什么区别,有没有插件开发的经验,最近好几个大点的公司都在问这个插件开发,因为没有做过,所以就过了,算法左旋转字符串,吐槽下牛客的手写算法必须写main函数,输入输出打印出来,在这个上面磨了有10分钟。
- 请问各位大佬,有没有关于lucene底层数据类型例如double等等的具体算法文章?昨天面试回答es的分布式查询写入原理都答的还可以,问到底层就蒙了…
- 数据写入流程,同一批写入如何避免数据冲突,如果副本存在但是写入时没响应怎么办
- 数据查询流程
- 集群状态同步发生在什么时候,包含什么数据,是如何进行的
- es选主流程
- 公司es集群规模,用什么样的策略规划,如何应对写入性能不足和查询性能不足
- es里用了哪些索引(正排、倒排…)分别用来解决什么问题
- ES深度分页的方案
- ES生产集群数据节点扩容
- ES集群运行时内存cache有那些
- ES集群的数据写入原理
小结 :
面试了大概七八家公司,都是搜索相关的岗位,大公司小公司都有,总结下吧,小公司基本上主要问项目,项目有没有什么优化点,ES大概主要问集群规模,查询或者集群有没有优化,写入流程,查询流程,可能小公司对ES的研究不会很深,ES问的也都是一些基础的东西;其他的就是语言相关的,HashMap,JVM,线程池。大公司的话可能基础偏多一点,项目会问的深一点;算法必问,这个剑指offer和LeetCode最好刷个几百道,还有就是计算机网络,操作系统这些底层的,设计模式,还有一些场景题,如果基础没问题的话在项目上多下点功夫,如果问到项目中的一个点,最好研究的透彻一点,一般会问的很深。如果想要换工作的话最好是真的想好了,准备充分了,再投简历面试,我是裸辞+裸面准备的太少了,很多机会都没有把握住,还有就是项目一定要找一些优化点,比我我优化了一个高基数下的聚合查询这几天说了快有10遍,把这个优化点搞清楚了面试就有的说了,而且是越说越流利;面大厂的话可以先面面小公司找找感觉,面多了就有把握了。