![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
算了,随便
这个作者很懒,什么都没留下…
展开
-
大数据人才方向
大数据人才方向 大数据人才方向 1、偏重基建与架构的大数据架构方向 主要方向 架构理论:高并发、高可用、并行计算、mapreduc、spark等 数据流应用:flume、fluentd、kafka、zmq等 存储应用:hdfs、ceph等 软件应用:hive、hbase、cassandra、prestodb等 可视化应用:hightchart、echarts、d3、html5、css3等 2、偏重...原创 2019-03-13 19:30:05 · 228 阅读 · 0 评论 -
大话大数据
大话大数据 大数据可以分为几个部分 数据收集、数据存储、数据建模、数据分析、数据变现 数据 承载了信息的东西 信息 消除随机不定性的东西原创 2019-03-13 19:30:15 · 314 阅读 · 0 评论 -
大数据之概率论
大数据之概率论 排列组合 公平的决断(古典概型) 非古典概型 应用示例 双色球彩票 购车摇号 德州扑克 具体的分析可以在网上查看,不做具体分析原创 2019-03-13 19:29:40 · 1948 阅读 · 0 评论 -
大数据之统计
大数据之统计 加和值、平均值、加权平均值和标准差 标准差是体现与均值的差距的,不如分析学生个人的偏科情况等 欧氏距离:就是与平均值差值的平方 曼哈顿距离:两点之间坐标的x坐标相减的绝对值与y坐标相减的绝对值的和 众数、中位数 同比和环比 同比:与相邻周期的同一时期比较 环比:和上一个报告期比较 抽样 是一种非常好的了解大量样本空间分布情况的方法,样本越大,抽样带来的收益越明显 ...原创 2019-03-13 19:45:18 · 1216 阅读 · 0 评论 -
大数据之分布
大数据之分布 高斯分布(正态分布) 一般般的很多,极端的很少 泊松分布(离散概率分布) 泊松分布需要满足的条件 1、小概率事件 2、每次的发生都是相互独立的 3、事件的概率是固定的 伯努利分布(离散分布) 只有两种结果:成功和失败,概率分别为p和q,p+q=1 备注:公式不在此展示 ...原创 2019-03-13 19:58:47 · 623 阅读 · 0 评论 -
大数据之指标
大数据之指标 转换率=点击数/推送数 指标的共性: 1、数字化 2、易衡量 3、意义清晰 4、周期适当 5、尽量客观 指标的构建 1、指标考核的对象 2、指标的周期 3、指标的比较 4、复合指标 ...原创 2019-03-13 20:04:03 · 3688 阅读 · 0 评论 -
大数据之信息论
大数据之信息论 信息越确定,越单一,信息熵越小 信息越不确定,越混乱,信息熵越大 信息量 香农公式原创 2019-03-13 20:07:37 · 561 阅读 · 0 评论