- 博客(7)
- 收藏
- 关注
原创 计算机网络期末复习(谢仁希第八版)三天速成版Day1
课后习题(2-10,2-13,2-16)1.常用的传输媒体有哪几种?各有何特点?答:1.双绞线其特点是成本低、灵活性强,通常用于局域网的传输。但传输距离较短,抗干扰能力相对较弱。2.光纤。主要特点是传输速度快、传输距离远、抗干扰能力极强、信号质量稳定。光纤已广泛应用于通信、广播、电视等领域3.同轴电缆,可用于模拟信号和数字信号的传输,特点是传输距离长、带宽大、抗干扰能力强,但成本较高。4.无线电,主要特点是传输距离远、灵活性高、无需布线、易于移动,但受环境因素和干扰较为严重568B。
2023-12-26 17:07:30 996 1
原创 零基础入门金融风控-贷款违约预测大作业学习笔记
赛题以预测用户贷款是否违约为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postCode和title等信息进行脱敏。数据可在阿里云学习赛中获得。考虑用卡方检验进行特征选择。数据探索性分析:(eda)将正样本排在负样本前面。
2023-12-25 17:40:06 482 1
原创 云计算复习之MapReduce & YARN期末复习整理
自定义分区一个例题:最终输出:思考之后发现这个就是把表中的商品id和点击次数去进行一个排序再输出。主要难点在于怎么去构造map和reduce的过程。先来看看MapReduce的流程:分布式程序有三个流程:(1)MRAppMaster (2)MapTask (3)ReduceTask说白了就是首先申请资源,然后执行分而治之的过程,把一个大任务拆分
2023-12-22 00:07:42 1021
原创 云计算复习之Hive数据仓库期末复习整理
首先,hive是一个构建于hadoop集群之上的数据仓库应用。那么,得先了解一下什么是数据仓库?数据仓库是一个数据集合,用于支持管理决策。简单来说就是为了分析数据而设计的仓库。那么hive就好理解了,hive是一个翻译器,不具备计算能力,存储能力,是一个构建于hadoop集群之上的系统,用于存储和处理数据。而它将得到的数据映射到一张数据表,然后存储在hafs之上。
2023-12-20 23:26:30 1538 5
原创 Kafka基本概念及其配置--docker desktop下的配置(尚未更新完成)
Apache Kafka 是一款开源分布式流处理平台。可以用来发布和订阅数据以及对数据进行实时或者离线处理。
2023-12-18 16:28:28 1042 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人