大数据面试题

1.你用过哪些机器学习/数据挖掘工具或框架?
2.你在项目中主要用过哪些机器学习/数据挖掘的算法?
3.给你公司内部群组的聊天记录,怎样区分出主管和员工?
4.海量数据分布在100台电脑中,如何高效统计出这批数据的TOP10?
5.100w个数中找出最大的100个数。
6.海量日志数据,提取出某日访问百度次数最多的那个IP。
7.路段平均车速反映了路况,在道路上布控采集车辆速度,如何对路况做出合理估计?采集数据中的异常值如何处理?
8.数据一般都是用什么导入到数据库的?导入到什么数据库?
9.针对“准确提升教师教学水平”这一目标,如何开展大数据挖掘?
10.针对“准确提升教师教学水平”这一目标,请设计针对教师的调查问卷。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值