蚂蚁金服面试题 小文件的合并MR与Spark的区别关注哪些名人的博客对大数据领域有什么自己的见解平常怎么学习大数据的StringBuilder与StringBuffer的区别HashMap与Hashtable的区别谈谈你对数的理解数据库索引的实现jvm的内存模型jvm的垃圾收集器jvm的垃圾收集算法HDFS架构HDFS读写流程Hadoop3.0做了哪些改进谈谈YARN为什么项目选择Spark,你觉得Spark的优点在哪里了解Flink与Storm吗,它们与Spark Streaming的区别在哪里1TB文件,取重复的词,top5指定的资源的场景下,如何快速统计出来