大数据工程师面试宝典
常耀斌
CTO,AI科学家。清华社发行《大数据架构之道和项目实战》2018年12月出版,《AI赋能企业数字化转型》2024年8月出版,《深度学习和大模型实战》2024年9月出版
展开
-
关于网速带宽和吞吐量的详细阐述
目录服务器如何发送数据?数据在网线中的速度什么是带宽?带宽的单位什么影响了数据发送速度(带宽)?运营商为什么要限制带宽?什么是共享带宽?什么是独享带宽?什么是响应时间?系统吞度量要素?服务器如何发送数据服务器程序将需要发送的数据写入该程序的内存空间中; 服务器程序通过操作系统的接口向内核发出系统调用; 系统内核将用户态内存空间中的数据复制到内核缓冲区中去...原创 2018-09-10 11:23:30 · 5828 阅读 · 0 评论 -
测评您的大数据薪资水平
包括Java/J2EE/Hadoop/机器学习/Spark部分,共20题,每一题是5分。Mina的线程工作原理,如何在业务中使用?如何进行性能调优?答:参见https://blog.csdn.net/Peter_Changyb/article/details/82557080针对上百个设备的高并发数据上传,如何构建业务树代码框架实现迭代和递归数据包,实现高可扩展?答:参见https:/...原创 2018-09-09 14:27:12 · 1533 阅读 · 0 评论 -
大数据开发的高质量面试题
面试官:您好,请讲述一个自己最熟悉的项目,自己在其中的贡献?最优解答:l项目规模和介绍:某项目,是为多少用户提供什么服务,哪些功能和核心模块。 l技术架构:遇到高并发,高可用的实际问题是什么,因此采用Hadoop离线处理和Spark实时计算。 l技术难点一:离线处理中的数据处理,比如数据表的行转列,JSON转Java,复杂的SQL语句等。 l技术难度二:实时处理时的常见内存溢出问题和...原创 2019-03-13 15:57:30 · 2109 阅读 · 1 评论