大数据最新大数据开发项目-电信项目1-生产数据(2),2024年最新大数据开发工程师面试题目和答案

img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化资料的朋友,可以戳这里获取

此情此景,对于该模块的业务,即数据生产过程,一般并不会让你来进行操作,数据生产是一套完整且严密的体系,这样可以保证数据的鲁棒性。但是如果涉及到项目的一体化方案的设计(数据的产生、存储、分析、展示),则必须清楚每一个环节是如何处理的,包括其中每个环境可能隐藏的问题;数据结构,数据内容可能出现的问题。

3、数据展示

在这里插入图片描述

4、源码

package producer;

import java.io.FileNotFoundException;

import java.io.FileOutputStream;

import java.io.IOException;

import java.io.OutputStreamWriter;

import java.text.DecimalFormat;

import java.text.ParseException;

import java.text.SimpleDateFormat;

import java.util.*;

/**

  • @author xh

*/

public class ProducerLog {

/**

  • 设置起始时间和结束时间 */

private String startTime = “2018-01-01”;

private String endTime = “2018-12-31”;

/*用于存放电话号码 和电话号码+姓名/

private List phoneList = new ArrayList<>();

private Map<String,String> phoneNameMap = new HashMap<>();

public void initPhone(){

phoneList.add(“17078388295”);

phoneList.add(“13980337439”);

phoneList.add(“14575535933”);

phoneList.add(“19902496992”);

phoneList.add(“18549641558”);

phoneList.add(“17005930322”);

phoneList.add(“18468618874”);

phoneList.add(“18576581848”);

phoneList.add(“15978226424”);

phoneList.add(“15542823911”);

phoneList.add(“17526304161”);

phoneList.add(“15422018558”);

phoneList.add(“17269452013”);

phoneList.add(“17764278604”);

phoneList.add(“15711910344”);

phoneList.add(“15714728273”);

phoneList.add(“16061028454”);

phoneList.add(“16264433631”);

phoneList.add(“17601615878”);

phoneList.add(“15897468949”);

phoneNameMap.put(“17078388295”, “李雁”);

phoneNameMap.put(“13980337439”, “卫艺”);

phoneNameMap.put(“14575535933”, “仰莉”);

phoneNameMap.put(“19902496992”, “陶欣悦”);

phoneNameMap.put(“18549641558”, “施梅梅”);

phoneNameMap.put(“17005930322”, “金虹霖”);

phoneNameMap.put(“18468618874”, “魏明艳”);

phoneNameMap.put(“18576581848”, “华贞”);

phoneNameMap.put(“15978226424”, “华啟倩”);

phoneNameMap.put(“15542823911”, “仲采绿”);

phoneNameMap.put(“17526304161”, “卫丹”);

phoneNameMap.put(“15422018558”, “戚丽红”);

phoneNameMap.put(“17269452013”, “何翠柔”);

phoneNameMap.put(“17764278604”, “钱溶艳”);

phoneNameMap.put(“15711910344”, “钱琳”);

phoneNameMap.put(“15714728273”, “缪静欣”);

phoneNameMap.put(“16061028454”, “焦秋菊”);

phoneNameMap.put(“16264433631”, “吕访琴”);

phoneNameMap.put(“17601615878”, “沈丹”);

phoneNameMap.put(“15897468949”, “褚美丽”);

}

/**

数据形式:主叫-被叫-通话建立时间-通话时长

数据形式对应字段名:caller,callee,buildTime,duration

*/

public String product(){

/*主叫、被叫电话号/

String caller = null;

String callee = null;

//主叫、被叫姓名

String callerName = null;

String calleeName = null;

/* 取得主叫好吗 */

int callerIndex = (int) (Math.random() * phoneList.size());

caller = phoneList.get(callerIndex);

callerName = phoneNameMap.get(caller);

/*

取得被叫号码

*/

int calleeIndex = (int) (Math.random() * phoneList.size());

callee = phoneList.get(callerIndex);

calleeName = phoneNameMap.get(callee);

while (true){

/**

*random()左闭右开

  • 取得被叫号码*/

calleeIndex = (int) (Math.random() * phoneList.size());

callee = phoneList.get(calleeIndex);

calleeName = phoneNameMap.get(callee);

if (!caller.equals(callee)){

break;

}

}

//第三个参数:随机通话建立时间

String buildTime = randomBuildTime(startTime,endTime);

img
img
img

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化资料的朋友,可以戳这里获取

-K8uCxPHD-1715447658992)]

既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,涵盖了95%以上大数据知识点,真正体系化!

由于文件比较多,这里只是将部分目录截图出来,全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频,并且后续会持续更新

需要这份系统化资料的朋友,可以戳这里获取

  • 3
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
当谈到大数据开发工程师面试题时,这里有一些常见问题和示例答案供参考: 1. 请解释什么是大数据(Big Data)? 大数据是指无法在一定时间范围内用传统的数据处理工具进行捕捉、管理和处理的大规模数据集。它通常包含了结构化、半结构化和非结构化的数据,并且具有高速度、高卷度和高多样性的特点。 2. 请介绍一下大数据处理的常见技术栈。 大数据处理的常见技术栈包括: - 分布式存储系统:如Hadoop Distributed File System(HDFS)、Amazon S3等。 - 分布式计算框架:如Apache Spark、Apache Hadoop MapReduce等。 - 数据流处理平台:如Apache Kafka、Apache Flink等。 - 数据仓库:如Apache Hive、Apache HBase等。 - 数据可视化工具:如Tableau、Power BI等。 3. 请解释一下MapReduce的工作原理。 MapReduce是一种用于并行计算的编程模型。它将任务划分为两个阶段:Map和Reduce。在Map阶段,输入数据被分割为若干个独立的片段,并由多个Map任务并行处理。在Reduce阶段,Map任务的输出结果被合并和排序,然后由多个Reduce任务并行处理并生成最终的输出结果。 4. 请解释一下Hadoop和Spark的区别。 Hadoop和Spark都是用于大数据处理的工具,但它们有一些区别。Hadoop是一个分布式计算框架,主要基于MapReduce模型进行数据处理。而Spark是一个快速、通用、内存计算引擎,可以处理更复杂的数据处理任务,并且支持多种计算模型,如批处理、流处理和机器学习。 5. 请介绍一下数据仓库和数据湖的区别。 数据仓库是一种用于存储结构化数据的中心化存储系统,通常采用关系型数据库来管理和查询数据。而数据湖是一种存储大规模原始和未处理数据的中心化系统,通常采用分布式文件系统来存储数据数据仓库侧重于处理结构化数据,而数据湖则更适合存储和处理各种类型的数据,包括结构化、半结构化和非结构化数据。 这些问题只是大数据开发工程师面试中的一小部分,希望对你有所帮助。如果你有其他特定的问题,请告诉我,我将很乐意为你解答。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值