大数据面试问题
小涛手记
这个作者很懒,什么都没留下…
展开
-
某司大数据开发笔试题
1、找出一个字符串中含有多少个a字符例如:写一段SQL判断字符串“accumulate”中有多少个“a”字符。select length('accumulate') - length(replace('accumulate','a',''))2、如何判断用户的最长连续活跃天数例如:写一段SQL判断用户2021年5月连续访问淘宝网站的最大天数。源表表名:page_view源表字段:user_id代表用户ID,visit_time代表访问时间(格式:yyyy-MM-dd HH:mm:ss),sit原创 2021-06-21 19:46:15 · 785 阅读 · 0 评论 -
hivesql 连续活跃类需求
1.求出连续活跃用户,连续活跃天数以及连续活跃用户的平均年龄源表:guidagetime0001182021-02-250002222021-02-250002222021-02-26…计算:with o as(selectuid,max(days) as days,max(age) as agefrom( select uid, age, days from ( select uid,原创 2021-04-29 16:11:16 · 154 阅读 · 1 评论 -
某某证券大数据开发工程师招聘笔试题
某某证券大数据开发工程师招聘笔试题一、基础知识(单选题,每题1分,共10分)1、实现两个远程主机之间的文件复制是用 ( D ) .A . mv B . cp C . cut D. scp2、一个IP地址是由网络地址和 ( D ) 两部分组成.A .广播地址 B .多址地址 C .主机地址 D .子网掩码3、网络中的任何一台计算机必须有一个地址,而且 ( B ) .A、 不同网络中的两台计算机的地址不允许重复B、 同一个原创 2021-04-07 15:27:24 · 2228 阅读 · 7 评论 -
某家面试笔试题
一.a,b两hive表结构如下,基于hivesql回答下述问题:解答1题:selectif(a.key = b.key,concat(a.key,',',b.key),if(a.key is null,b.key,a.key)) as key,a.value,b.valuefrom a full join bon a.key = b.key;数据+------+----------+----------+--+| key | a.value | b.value |+---原创 2021-04-01 16:06:59 · 87 阅读 · 0 评论 -
java程序根据词典wordDict给字符串s进行分词,返回用“|“链接的字符串
1.根据词典wordDict给字符串s进行分词,返回用"|"链接的字符串示例:输入:s=“今天天气不错”,wordDict=[“今天”,“天天”,“天气”,“不错”,“错”]输出∶今天|天气|不错代码:package participle;import java.util.*;/** * @author :xiaotao * @date :2021/3/29 10:58 * @description: */public class Participle { publ原创 2021-03-29 12:36:37 · 590 阅读 · 1 评论 -
请编写UDF,功能是解析url并提取指定的key及其value
请编写UDF,功能是解析url并提取指定的key及其value。示例:输入∶url="http://test.cn/images/o.gif?pid=1&_t=1466417152472&module=mark&uid=6161545&pageType=2&collection_id=1104&question_id=2430782&count=0&action=body.click",key="uid"输出∶value="616原创 2021-03-29 21:04:14 · 308 阅读 · 1 评论 -
大数据开发工程师基础面试题
Hadoop1.组成2.Hdfs 文件上传3.Hdfs 文件下载4.MR 流程5.MR 中combine6.Yarn的运行流程7.Yarn 的资源调度类型8.Zookeeper 功能9.Zookeeper 的主从选取机制10.Mr 程序wordcount11.Mr中的缓存 chickpointSpark2.Spark 资源调度过程3.Spark 运行流程4.Shuffle5.Spark 常用算子6.缓存catch和chickpoint7.Spark 程序 wordcoun原创 2021-03-28 12:20:58 · 603 阅读 · 0 评论