- 博客(9)
- 资源 (2)
- 收藏
- 关注
原创 大数据之指标
大数据之指标转换率=点击数/推送数指标的共性:1、数字化2、易衡量3、意义清晰4、周期适当5、尽量客观指标的构建1、指标考核的对象2、指标的周期3、指标的比较4、复合指标...
2019-03-13 20:04:03 3700
原创 大数据之分布
大数据之分布高斯分布(正态分布)一般般的很多,极端的很少泊松分布(离散概率分布)泊松分布需要满足的条件1、小概率事件2、每次的发生都是相互独立的3、事件的概率是固定的伯努利分布(离散分布)只有两种结果:成功和失败,概率分别为p和q,p+q=1备注:公式不在此展示...
2019-03-13 19:58:47 633
原创 大数据之统计
大数据之统计加和值、平均值、加权平均值和标准差标准差是体现与均值的差距的,不如分析学生个人的偏科情况等欧氏距离:就是与平均值差值的平方曼哈顿距离:两点之间坐标的x坐标相减的绝对值与y坐标相减的绝对值的和众数、中位数同比和环比同比:与相邻周期的同一时期比较环比:和上一个报告期比较抽样是一种非常好的了解大量样本空间分布情况的方法,样本越大,抽样带来的收益越明显...
2019-03-13 19:45:18 1245
原创 大数据人才方向
大数据人才方向大数据人才方向1、偏重基建与架构的大数据架构方向主要方向架构理论:高并发、高可用、并行计算、mapreduc、spark等数据流应用:flume、fluentd、kafka、zmq等存储应用:hdfs、ceph等软件应用:hive、hbase、cassandra、prestodb等可视化应用:hightchart、echarts、d3、html5、css3等2、偏重...
2019-03-13 19:30:05 236
原创 linux文件和文件流
linux文件和文件流文件类型根据数据存储方式,分为两类:1、文本文件:ascii文件,每个字节存放一个ascii码字符,文本文件存储量大,速度慢,便于对字符操作。此类文件以EOF结束。2、二进制文件:数据按其在内存中的存储形式原样存放,二进制文件存储量小,速度快,便于存放中间结果。根据程序对文件的访问方式,分为两类:1、带缓冲区的文件操作(用户空间自动为正在使用的文件开辟内存缓冲区)...
2019-03-04 10:12:07 1423
原创 linux可执行文件结构
linux可执行文件结构ELF格式文件在存储时分为:1、代码区2、数据区3、未初始化数据区代码区(text segment)存放cpu执行的机器指令。通常,代码区数据是可共享的,目的是频繁调用的代码在内存中只保留一份,代码区是只读的,避免程序被意外改写。常量数据在编译时在代码段中分配空间。代码区的指令包括操作码和操作对象。如果是立即数,将直接包含在代码中,如果是局部数据,将在运行时...
2019-03-04 09:19:28 1148
ipv6、ndp过渡技术PPT
2019-02-21
ipv6、ndp过渡技术
2019-02-21
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人