自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 收藏
  • 关注

原创 spark

因此还会单独写一份索引文件,其中标识了下游各个task的数据在文件中的start offset与end offset。

2023-10-27 11:40:48 745 1

原创 操作系统总结

高响应比优先(HRRN,Highest Response Ratio Next):非抢占式调度算法,最高响应比是一种折中的算法,先来先服务主要考虑的是作业的等待时间而未考虑到作业的执行时间,短作业优先主要考虑的是作业的执行时间而未考虑作业等待时间。,这就保证了等待时间相同的情况下,作业执行的时间越短,响应比越高,同时响应比会随着等待时间减小而变大,优先级会提高,能够避免饥饿现象,适用于批处理系统。优点:相比FCFS 算法,该算法可改善平均周转时间和平均带权周转时间,缩短进程的等待时间,提高系统的吞吐量。

2023-10-16 19:58:58 79

原创 Mybatis整理

Mybatis是一个半ORM(对象关系映射)框架,它内部封装了JDBC,加载驱动、创建连接、创建statement等繁杂的过程,开发者开发时只需要关注如何编写SQL语句,可以严格控制sql执行性能,灵活度高。作为一个半ORM框架,MyBatis 可以使用 XML 或注解来配置和映射原生信息,将 POJO映射成数据库中的记录,避免了几乎所有的 JDBC 代码和手动设置参数以及获取结果集。

2023-10-07 23:10:13 388

原创 rpc网络

Provider: 暴露服务的服务提供方Consumer: 调用远程服务的服务消费方Registry: 服务注册与发现的注册中心Monitor: 统计服务的调用次数和调用时间的监控中心Container: 服务运行容器服务容器负责启动,加载,运行服务提供者。服务提供者在启动时,向注册中心注册自己提供的服务。服务消费者在启动时,向注册中心订阅自己所需的服务。注册中心返回服务提供者地址列表给消费者,如果有变更,注册中心将基于长连接推送变更数据给消费者。

2023-09-27 09:46:28 1398

原创 数据分析总结

反映用户在一段时间内持续访问的情况,如访问频率、访问间隔时间等。黏性指标可以衡量用户对产品的依赖程度和忠诚度,以及产品的粘性和活力。:反映用户访问的参与度和深度,如平均停留时间、平均访问页面数、活跃用户数等。活跃指标可以衡量用户对产品的兴趣和价值感知,以及产品的吸引力和留存力。:反映用户对产品的贡献和影响,如消费金额、推荐次数、口碑评价等。产出指标可以衡量用户对产品的满意度和认可度,以及产品的盈利能力和可持续性。

2023-09-22 21:53:34 229

原创 数据仓库整理

包括了数据域划分和构建总线矩阵,数据域就是指 将业务过程或者维度进行抽象的集合,在划分数据域的时候,应该尽可能保证当前划分的能够覆盖所有的业务需求,又能在新业务进入时无影响的被包含到已有的数据域中或者扩展新的数据域,国际化数仓里面的数据域包括司机域,乘客域,交易域,客服域,安全域等等,阿里巴巴就会有 商品域 会员域 店铺域 交易域 日志域等等。b)声明粒度 ,粒度就是用于确定事实表中一行所表示的业务的细节层次,通常在设计事实表的时候,粒度定义的越细越好,比如订单明细表的粒度就是 订单级别。

2023-09-22 15:43:34 868 1

原创 Pyspark+TIDB

Spark 提供了大量内建函数,它的灵活性让数据工程师和数据科学家可以定义自己的函数。这些函数被称为用户自定义函数(user-defined function,UDF)。UDF分为两种类型:临时函数和永久函数。临时函数只在当前会话中有效,退出后重新连接就无法使用;永久函数则会将UDF信息注册到MetaStore元数据中,可以永久使用。

2023-08-30 10:34:33 421

原创 HIVE笔记

Hive中对某些情况的查询可以不必使用MapReduce计算。例如:SELECT * FROM employees;在这种情况下,Hive可以简单地读取employee对应的存储目录下的文件,然后输出查询结果到控制台。在hive-default.xml.template文件中hive.fetch.task.conversion默认是more,老版本hive默认是minimal,该属性修改为more以后,在全局查找、字段查找、limit查找等都不走mapreduce。例子。

2023-05-10 11:08:25 380

原创 元数据笔记

元数据( Metadata )是关于数据的数据。元数据打通了数据源、数据仓库、数据应用,记录了数据从产生、加工到消费的全过程。在数据仓库系统中,元数据主要记录数据仓库中模型的定义、各层级间的映射关系、监控数据仓库的数据状态及 ETL 的任务运行状态。元数据可以帮助数据仓库管理员和开发人员非常方便地找到他们所关心的数据,用于指导其进行数据管理和开发工作,提高工作效率。

2023-05-10 11:06:37 180

原创 JVM八股

自定义类加载器是指程序中由开发人员自定义的一类加载器,它们继承自抽象类ClassLoader,重写它的findClass方法或loadClass方法。自定义类加载器的目的是为了加载一些系统类加载器无法加载的类,或者对类文件进行加密和解密等特殊处理。自定义类加载器也要遵循双亲委派机制,即在加载一个类时,先委托给父类加载器尝试加载,如果父类加载器无法加载该类,才由自己去加载。

2023-05-09 10:51:16 241

原创 数开面经JAVA

monitorenter指令是在编译后插入到同步代码块的开始位置;monitorexit是插入到方法结束和异常的位置(实际隐藏了try和finally),每个对象都有一个monitor与之关联,当一个线程执行到monitorenter指令时,就会获得对象所对应的monitor的所有权,也就是获得了对象的锁。

2023-04-18 08:46:07 453 1

原创 Hadoop组件原理

1、Client访问zookeeper,获取元数据存储所在的regionserver2、拿到对应的表存储的regionserver,通过刚刚获取的地址访问对应的regionserver,3、去表所在的regionserver进行数据的添加4、查找对应的region,在region中寻找列族,把数据分别写到Hlog和memstore各一份5、当memstore写入的值变多,触发溢写操作(flush),进行文件的溢写,成为一个StoreFile6、当溢写的文件过多时,会触发文件的合并(Compact)操作。合并

2023-04-18 08:45:14 254 1

原创 2020-10-08

复制粘贴的,这个概念不太理解,csdn没查到串行链路是指信息的各位数据被逐位按顺序传送的线路。串行链路特别适用于远距离通信,但传送速度较慢。同步和异步是广域网串行链路的两种传输模式。同步传输能够达到比异步传输更高的速率。使用同步传输时,字节流受到时序的影响。通俗地说,串行链路的两端试图采用同样的速度通信。但是很难制造出速度完全相同的设备,所以两端的设备只能按照同样的时钟源调整自己的设备。使用异步传输时,不需要受时序的影响。通俗地说,两端都同意采用同样的传输速率,但是它们并不检查和调整自己的速率,即使它们的

2020-10-08 08:38:08 194

原创 排序算法总结

第三章排序算法 计二 郝擎宇目标:实现三种简单排序,冒泡排序,选择排序,插入排序,实现两种复杂排序,快速排序,归并排序实现方案:一花一世界,一叶一菩提。古人云:一粒沙就可观察整个世界。所以我准备定义最简单的整型数组,用它来试试这五种排序算法。简单的整型数组可以让人把注意力放在算法实现上,而不是编程细节。(好吧,其实是俺比较菜。。。)原理介绍:(鲁迅说,善用比喻可以加强理解)冒泡排...

2020-04-18 15:49:45 169

原创 电子取证第三章

网络通信安全需求网络通信四个安全要求机密性(Privacy)完整性(Integrity)鉴别与授权(Authentication & Authorization)不可抵赖(Non-Repudiation)网络安全解决方案加密算法数字签名消息摘要,数字指纹公钥基础设施(PKI)解决网络安全的密码技术对称加密算法在两个通讯者之间需要一把共享的密钥特点速...

2019-12-08 10:19:26 502

原创 电子取证第二章

密码算法分类按密钥种类对称密码算法非对称密码算法公钥密码算法(加密的密钥时公开的,解密的密钥是保密的)按明文处理方法分组密码:将明文分成固定长度的组,用同一密钥和算法对每一块加密,输出也是固定长度的密文流密码:又称序列密码.序列密码每次加密一位或一字节的明文,也可以称为流密码。古典密码(对称的)代换技术:明文中的每个元素映射为另一元素置换技术:明文中的元素重新排列...

2019-12-08 09:03:04 220

原创 数据库简答题

数据和信息的关系信息在一种可编码符号系统下的编码就是数据。将数据理解为信息,必须在一定的符号系统下进行,否则它就只是一个数而已。一般将“信息”作为一个集合名词,而将“数据”指代为具体的操作对象。数据库应用系统由哪些部分组成(MIS)硬件。包括服务器、工作站、和网络软件:核心是DBMS,操作系统、DBMS支撑工具,接口库,开发工具等。数据库。具有持久性,结构化和可共享的数据集合。...

2019-12-07 09:16:21 4446

原创 SQL语句复习

通配符1.查询姓名以A开头的顾客SELECT CID,CNAMEFROM CustomersWHERE CNAME LIKE 'A%';排序检索数据1.查询地址为空的顾客信息,按姓名降序排列SELECT CID,CNAMEFROM CustomersWHERE ADDRESS=NULLORDER BY CNAME DESC过滤数据1.查询薪水大于3000的销售员信息,薪水...

2019-12-06 17:45:03 1489 1

原创 数据库期末复习基础题答案

名词解释符号系统不同载体上的信息虽然表现形式不同,其内在的含义是一致的,但必须通过一致的方式来记录内容,和一致的解读方式来还原内容。这种一致的记录和解读信息的方式,被称为符号系统。这种方式必须是可操作的和精确的。信息信息是世界上事物的存在、运动方式的描述信息有助于减少不确定性。信息与物质和运动的关系信息的可复制性,可传播性、可存储性数据存储在某种媒体上可加以鉴别的符号资料...

2019-12-04 21:13:02 3347 3

原创 电子取证第六章

windows系统取证诺卡德交换原理当两个对象接触时,物质会在这两个对象之间产生交换或者传送。证据保全保证数据的真实性保证数据的完整性固定证据固定易丢失的证据固定硬盘部分文件的固定文件系统概念文件系统是操作系统用于明确存储设备或分区上的文件的方法和数据结构,即在存储设备上组织文件的方法。常见的文件系统FAT文件系统NTFS文件系统ExFATExt深入...

2019-12-04 17:16:35 240

原创 电子取证第四章信息隐藏

信息隐藏为何需要让攻击者分不清哪一个是重要数据概念信息隐藏是把一个有意义的信息隐藏在另一个称为载体(Cover)的信息中得到隐蔽载体。非法者不知道这个普通信息中是否隐藏了其它的信息,而且即使知道也难以提取或去除隐藏的信息所用的载体可以是文字、图象、声音及视频等信息隐藏的分类按载体类型分类:文本,图像,视频,音频按密钥分类:对称隐藏算法,公钥隐藏算法按嵌入域分类:主要可分为空域(...

2019-12-04 16:20:17 1130

原创 网络取证

网络取证定义特点网络取证数据源收集网络通信数据检查分析网络通信数据

2019-12-04 15:23:46 1987

原创 电子取证第五章续

网络安全基础设施防火墙原理:防火墙根据网络包提供的信息实现网络通信控制,若网络包符合安全规则,就允许通过,若不符合,则不通过。安全策略有两种:只允许符合安全规则的包通过只禁止违反安全规则的包通过防火墙作用过滤非安全网络访问网络安全审计网络带宽控制协同防御:防火墙和入侵检测系统通过交换信息实现联动。防火墙实现简单的:路由器,交换机就可实现复杂的:一台或一组计算机具...

2019-12-03 21:16:07 455

原创 电子取证第五章

分层网络模型开放系统互联模型(OSI)七层,从下向上物理层:提供传输数据通路并传输数据数据链路层:网络节点之间传送帧网络层:选择合适的网间路由和节点传输层:端与端之间的数据传输和处理会话层:会话控制表示层:表示信息应用层:Email,文件传输,网络管理TCP/IP基础物理层:光电信号传递数据链路层:设备之间传送帧网络层:地址管理和路由选择传输层:两台主机间的数据传...

2019-12-03 19:34:26 339

原创 电子取证第一章

计算机犯罪特点隐蔽性犯罪主体和手段的智能性犯罪主体和犯罪对象的复杂性跨国性匿名性计算机犯罪类型非法侵入计算机信息系统罪破坏计算机信息系统罪利用计算机实施金融诈骗、盗窃、贪污、挪用公款、窃取国家秘密罪计算机犯罪形式数据欺骗,非法篡改输入/输出数据获取个人利益意大利香肠术,侵吞存款利息余额,积少成多的一种作案手段特洛依木马 ,表面上来看是正常合适的,但在内部却隐藏秘...

2019-12-01 15:21:44 1212

原创 常微分方程数值解

Euler方法提出问题对于以下一个常微分方程y′(x)=f(x,y(x))y(a)=y0\begin{aligned}&y'(x)=f(x,y(x))\\&y(a)=y_{0}\end{aligned}​y′(x)=f(x,y(x))y(a)=y0​​求出y=f(x)y=f(x)y=f(x)的方程,画出它的曲线解决问题思路:模仿插值,找出n个样本点,通过样本点...

2019-11-29 11:55:48 317

原创 Lagrange插值

Lagrange插值问题提出如果要确定一条函数图像,那我们能得到的点越多越好,最好任取一点都可以确定才好。但是实际应用中不可能确定无数个点,我们要做的就是根据已知的几个点来确定一条误差不太大的曲线。多项式函数来模拟我们希望能构造一个多项式函数来模拟,多项式函数满足以下条件(用多项式的原因是因为求导方便?后续再学)。pn(xi)=yi,i=1,2,3...,n,n+1p_{n}(x_{i...

2019-11-28 21:53:59 519

原创 关于学习的一点想法

学习知识上了十几年学,才发现自己很多本质的问题从来没有想过。为什么要学习知识人类在发展过程中会遇到各种各样的问题,面对各种各样的问题,人们提出了各种解决方法。但是如果不用文字记录下来,让更多的人看到,实现知识的传播,那么未来的人类面对相同的问题就会一脸懵逼,然后花很多重复时间解决一个解决过的问题。所以人类把各种问题的解决方法记录下来,统称为知识。为了保存这些知识,人类用文字记录,用书籍保存。...

2019-11-28 20:25:42 156 1

原创 共用体

共用体例题程序 《数据结构》陈越老师#include<stdio.h>int main(){union key{int k;char ch[2];}u;u.k=258;printf("%d\n%d\n",u.ch[0],u.ch[1]);return 0;}//编译结果如下图课本:看看输出结果是什么?为什么?我:一脸懵逼。并没有对字符数组赋值呀?查阅资...

2019-09-04 22:27:18 1859 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除