自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 资源 (2)
  • 收藏
  • 关注

原创 大数据之信息论

大数据之信息论信息越确定,越单一,信息熵越小信息越不确定,越混乱,信息熵越大信息量香农公式

2019-03-13 20:07:37 566

原创 大数据之指标

大数据之指标转换率=点击数/推送数指标的共性:1、数字化2、易衡量3、意义清晰4、周期适当5、尽量客观指标的构建1、指标考核的对象2、指标的周期3、指标的比较4、复合指标...

2019-03-13 20:04:03 3694

原创 大数据之分布

大数据之分布高斯分布(正态分布)一般般的很多,极端的很少泊松分布(离散概率分布)泊松分布需要满足的条件1、小概率事件2、每次的发生都是相互独立的3、事件的概率是固定的伯努利分布(离散分布)只有两种结果:成功和失败,概率分别为p和q,p+q=1备注:公式不在此展示...

2019-03-13 19:58:47 632

原创 大数据之统计

大数据之统计加和值、平均值、加权平均值和标准差标准差是体现与均值的差距的,不如分析学生个人的偏科情况等欧氏距离:就是与平均值差值的平方曼哈顿距离:两点之间坐标的x坐标相减的绝对值与y坐标相减的绝对值的和众数、中位数同比和环比同比:与相邻周期的同一时期比较环比:和上一个报告期比较抽样是一种非常好的了解大量样本空间分布情况的方法,样本越大,抽样带来的收益越明显...

2019-03-13 19:45:18 1230

原创 大话大数据

大话大数据大数据可以分为几个部分数据收集、数据存储、数据建模、数据分析、数据变现数据承载了信息的东西信息消除随机不定性的东西

2019-03-13 19:30:15 316

原创 大数据人才方向

大数据人才方向大数据人才方向1、偏重基建与架构的大数据架构方向主要方向架构理论:高并发、高可用、并行计算、mapreduc、spark等数据流应用:flume、fluentd、kafka、zmq等存储应用:hdfs、ceph等软件应用:hive、hbase、cassandra、prestodb等可视化应用:hightchart、echarts、d3、html5、css3等2、偏重...

2019-03-13 19:30:05 232

原创 大数据之概率论

大数据之概率论排列组合公平的决断(古典概型)非古典概型应用示例双色球彩票购车摇号德州扑克具体的分析可以在网上查看,不做具体分析

2019-03-13 19:29:40 1961

原创 linux文件和文件流

linux文件和文件流文件类型根据数据存储方式,分为两类:1、文本文件:ascii文件,每个字节存放一个ascii码字符,文本文件存储量大,速度慢,便于对字符操作。此类文件以EOF结束。2、二进制文件:数据按其在内存中的存储形式原样存放,二进制文件存储量小,速度快,便于存放中间结果。根据程序对文件的访问方式,分为两类:1、带缓冲区的文件操作(用户空间自动为正在使用的文件开辟内存缓冲区)...

2019-03-04 10:12:07 1406

原创 linux可执行文件结构

linux可执行文件结构ELF格式文件在存储时分为:1、代码区2、数据区3、未初始化数据区代码区(text segment)存放cpu执行的机器指令。通常,代码区数据是可共享的,目的是频繁调用的代码在内存中只保留一份,代码区是只读的,避免程序被意外改写。常量数据在编译时在代码段中分配空间。代码区的指令包括操作码和操作对象。如果是立即数,将直接包含在代码中,如果是局部数据,将在运行时...

2019-03-04 09:19:28 1132

原创 linux makefile

跟我一起学习makefile编译链接在此,我想多说关于程序编译的一些规范和方法,一般来说,无论是C、C++、还是pas,首先要把源文件编译成中间代码文件,在Windows下也就是 .obj 文件,UNIX下是 .o 文件,即 Object File,这个动作叫做编译(compile)。然后再把大量的Object File合成执行文件,这个动作叫作链接(link)。 编译时,编译器需要的是语法的...

2019-02-28 15:11:47 113

原创 滑动窗口协议

滑动窗口协议概述滑动窗口协议是用于网络数据传输时的流量控制,以避免拥塞的发生。该协议允许发送方在停止并等待确认前发送多个数据分组。由于发送方不必每发一个分组就停下来等待确认,因此该协议可以加速数据的传输,提高网络吞吐量。背景如果过多的源同时以很快的速度发送大量的数据包,而此时接收方并没有如此高的接收数据的能力,因此极易导致网络的拥塞。所以,为了控制发送方的发送速度,防止发送方并考虑到受发送...

2019-02-21 14:08:41 335

原创 Linux与vxWorks的区别

Linux与vxWorks的主要区别1、内核结构微内核:是一种只提供必要服务的操作系统内核;这些必要的服务包括任务管理、中断处理、内存管理等。其他服务,如文件管理、网络支持等通过接口连到微内核。在微内核中,用以完成系统调用功能的程序模块通常只进行简短的处理,而把其余工作通过消息传递交给内核之外的进程来处理。在典型情况下,每个系统调用程序模块都有一个与之对应的进程,微内核部分经常只不过是一个...

2019-02-21 14:02:19 8067

原创 网管工具-snmpset使用总结

snmpset使用总结环境Windows命令提示符命令格式snmpset [COMMON OPTIONS] OID TYPE VALUE [OID TYPE VALUE]…实际使用如下:Snmpset –c 【配置的community】 -v 2c 【AC地址】 【 字段的OID 或 字段名+表索引】 【字段的类型】 【字段的值】例如设置ping表的操作,该表两个索引,都是字...

2019-02-21 11:32:06 13425

原创 linux进程间通信总结

linux进程间通信总结无名管道只支持单向数据流(0读1写);只能用于具有亲缘关系的进程之间;没有名字;管道的缓冲区是有限的(管道制存在于内存中,在管道创建时,为缓冲区分配一个页面大小);管道所传送的是无格式字节流,这就要求管道的读出方和写入方必须事先约定好数据的格式。多应用于shell,每个进程关闭自己不需要的一个连接,#include <unistd.h> int pipe...

2019-02-21 11:28:23 223

原创 linux线程

linux线程线程的优势创建线程花费的代价,比创建进程小得多,所以同一个进程的,多个线程执行多个任务——>比多个进程执行多个任务更有效率。线程分类线程也分为用户级线程、内核级线程——对于前者,多个线程之间的上下文切换,由用户决定;对于后者,则由系统决定。(二者一般是1:1或者1:n的对应关系)线程共享资源于同一进程的多个线程共享同一地址空间,所以代码段,数据段是共享的,如果定义一...

2019-02-21 11:25:51 94

原创 中国历史

@中国历史中国朝代顺序表:夏、商、周[西周、东周(春秋、战国)]、秦、汉(西汉、东汉)、三国时期(魏、蜀、吴)、晋(西晋、东晋)、五胡十六国、南北朝[南朝(宋、齐、梁、陈)、北朝(北魏、东魏、西魏、北齐、北周)]、隋、唐、五代(后梁、后唐、后晋、后汉、后周)、十国[前蜀、后蜀、吴、南唐、吴越、闽、楚、南汉、南平(荆南)、北汉]、宋(北宋、南宋)、辽、金、元、明、清。中国历史-春秋春秋周和商...

2019-02-21 11:19:37 244

ipv6、ndp过渡技术PPT

问题:开始分配时没有按连续性子网分配,导致全球现存的公网路由汇总后仍有大约23万,我国的IPv4地址多为不连续的、可划分子网范围小的地址。 为了应对IPv4地址不够用的情况,提出了IPv6。

2019-02-21

ipv6、ndp过渡技术

ipv6、ndp过渡技术,问题:开始分配时没有按连续性子网分配,导致全球现存的公网路由汇总后仍有大约23万,我国的IPv4地址多为不连续的、可划分子网范围小的地址。 为了应对IPv4地址不够用的情况,提出了IPv6。

2019-02-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除