自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 计算机网络大题速成Day2

2.

2023-12-27 23:17:51 405 1

原创 计算机网络期末复习(谢仁希第八版)三天速成版Day1

课后习题(2-10,2-13,2-16)1.常用的传输媒体有哪几种?各有何特点?答:1.双绞线其特点是成本低、灵活性强,通常用于局域网的传输。但传输距离较短,抗干扰能力相对较弱。2.光纤。主要特点是传输速度快、传输距离远、抗干扰能力极强、信号质量稳定。光纤已广泛应用于通信、广播、电视等领域3.同轴电缆,可用于模拟信号和数字信号的传输,特点是传输距离长、带宽大、抗干扰能力强,但成本较高。4.无线电,主要特点是传输距离远、灵活性高、无需布线、易于移动,但受环境因素和干扰较为严重568B。

2023-12-26 17:07:30 996 1

原创 零基础入门金融风控-贷款违约预测大作业学习笔记

赛题以预测用户贷款是否违约为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postCode和title等信息进行脱敏。数据可在阿里云学习赛中获得。考虑用卡方检验进行特征选择。数据探索性分析:(eda)将正样本排在负样本前面。

2023-12-25 17:40:06 482 1

原创 云计算复习之Spark(Scala版)期末复习整理

shark直接从hive里面搬过来的,只有蓝色部分,转换成spark,提升性能。

2023-12-22 11:34:58 1421

原创 云计算复习之MapReduce & YARN期末复习整理

自定义分区一个例题:最终输出:思考之后发现这个就是把表中的商品id和点击次数去进行一个排序再输出。主要难点在于怎么去构造map和reduce的过程。先来看看MapReduce的流程:分布式程序有三个流程:(1)MRAppMaster (2)MapTask (3)ReduceTask说白了就是首先申请资源,然后执行分而治之的过程,把一个大任务拆分

2023-12-22 00:07:42 1021

原创 云计算复习之Hive数据仓库期末复习整理

首先,hive是一个构建于hadoop集群之上的数据仓库应用。那么,得先了解一下什么是数据仓库?数据仓库是一个数据集合,用于支持管理决策。简单来说就是为了分析数据而设计的仓库。那么hive就好理解了,hive是一个翻译器,不具备计算能力,存储能力,是一个构建于hadoop集群之上的系统,用于存储和处理数据。而它将得到的数据映射到一张数据表,然后存储在hafs之上。

2023-12-20 23:26:30 1538 5

原创 Kafka基本概念及其配置--docker desktop下的配置(尚未更新完成)

Apache Kafka 是一款开源分布式流处理平台。可以用来发布和订阅数据以及对数据进行实时或者离线处理。

2023-12-18 16:28:28 1042 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除