数据自习室
CCESARE
专业水文创作者。 大数据开发hadoop/Hive/Hbase/Spark/Flink
展开
-
数据自习室第二周·Python数据分析基础0722-0728
文章目录 Numpy(Numerical Python) Pandas 补充 Numpy(Numerical Python) 是一个功能强大的Python库,主要用于对多维数组执行计算,其提供了大量的库函数,可应用于矩阵的计算,图像的处理、各类数学任务计算(例如,微积分)等,是一种基于Python的MATLAB的快速替代。下面通过代码块展示Numpy部分可实现的功能: # 使用NumPy...原创 2019-07-29 10:14:01 · 189 阅读 · 0 评论 -
数据自习室第一周·数据的描述性统计0715-0721
学习笔记第一周 数据的描述性统计0715-0721 目录 一、数据的集中趋势 1.众数: 一组数据中,出现次数最多的那个数,用大写字母 M 表示。一组数据可以有多个众数,也可以没有众数。用众数代表一组数据,可靠性较差,不过众数不受极端数据的影响,并且求法简便。在一组数据中,如果个别数据有很大的变动,选择中位数表示这组数据的“集中趋势”就比较适合。众数的三种求解方法...原创 2019-07-22 00:15:04 · 537 阅读 · 0 评论 -
数据自习室第三周·常见概率分布0728-0804
基本概念 随机变量 1.连续性随机变量 如果随机变量X的所有可能取值不可以逐个列举出来,而是取数轴上某一区间内的任一点的随机变量 2.离散型随机变量 设X是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X为一个离散型随机变量 古典概率 古典概率通常又叫事前概率,是指当随机事件中各种可能发生的结果及其出现的次数都可以由演绎或外推法得知,而无需经过任何统计试验...原创 2019-08-05 03:02:35 · 349 阅读 · 0 评论