自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(36)
  • 收藏
  • 关注

原创 Part 4 描述性统计分析(占比 10%)——下

的变量数量:单相关,复相关(多重相关);2. 从变量相关关系的表现形式:线性相关(散布图接近一条直线);非线性相关(散布图接近一条曲线);3. 从变量相关关系变化的方向:正相关(变量同方向变化,同增同减),负相关(变量反方向变化,一增一减);4. 从变量相关程度看:完全相关、不相关、不完全相关;

2023-02-16 13:28:42 557

原创 Part 4 描述性统计分析(占比 10%)——中

6表示将随机变量X转换为服从标准正态分布,取标准正态分布函数的函数值即可。标准正态分布表大数定律和中心极限定理。

2023-02-09 17:40:38 779

原创 Part 4 描述性统计分析(占比 10%)——上

在风险管理当中,较大程度的负偏是需要格外关注的问题,因为这可能导致大的损失的发生。其中n为样本数量,k为被限制的条件数或变量个数,或计算某一统计量时用到其它独立统计量的个数。对于峰度而言,尖峰态的峰度大于3,低峰态的峰度小于3,而正态分布的峰度正好等于3。那么就变成了尖峰态的峰度大于0,低峰态的峰度小于0,而正态分布的峰度等于0。离散系数是测度数据离散程度的相对统计 量,主要是用于比较不同样本数据的离散程度。较高的峰度通常表明数据的变动是由一些极值相对于期望的变动引起的,而非许多相对较小的差异。

2023-02-08 23:09:38 1366

原创 Part 3 数据库应用(占比 17%)——下

where型子查询:指把内部查询的结果作为外层查询的比较条件。from型子查询:把内层的查询结果当成临时表,供外层sql再次查询。in子查询:内层查询语句仅返回一个数据列,这个数据列的值将供外层查询语句进行比较。exists子查询:把外层的查询结果,拿到内层,看内层是否成立,简单来说后面的返回true,外层(也就是前面的语句)才会执行,否则不执行。any子查询:只要满足内层子查询中的任意一个比较条件,就返回一个结果作为外层查询条件。

2023-02-01 22:56:02 489

原创 Part 3 数据库应用(占比 17%)——上

关系型数据库(Relational Database Management System:RDBMS)是数据库应用的主流,关系型数据库以行和列的形式存储数据,这一系列的行和列被称为表,一组表组成了数据库。当前主流的关系型数据库有Oracle、DB2、Microsoft SQL Server、MySQL等。数据库是存储、调用、分析数据的仓库。数据库通常分为层次式数据库、网络式数据库和关系式数据库三种。而不同的数据库是按不同的数据结构来联系和组织的。

2023-01-31 22:35:02 1123 1

原创 Part 2 数据结构(占比15%)

可以使用**全连接(full join)、去重合并(union)或全合并(union all)**来进行表结构数据的纵向合并。将数据从数据源端经过抽取(Extract)、清洗转换(Transform)之后加载(Load)到数据仓库。,提供了表示实体类型、属性和联系的方法,用来描述现实世界的概念模型。表与表的关系有:一对一,一对多,多对多。(5)确定联系的类型,在用线将表示联系的菱形框联系到实体集时,在线旁注明是1或n(多)来表示联系的类型。(4)确定实体集的关键字,用下划线在属性上表明关键字的属性组合;

2023-01-31 17:06:58 597

原创 Part 1 数据分析概述与职业操守(占比3%)

可以认为数据分析涉及到公司运营的方方面面,这包括对企业部门经营情况的评估、内部员工的管理、生产流程的监管、产品结构优化与新产品开发、财务成本优化、市场结构的分析和客户关系的管理。企业在收集用户的个人信息之前,必须向用户说明:将收集用户的哪些信息、收集到的信息将如何进行存储、存储的信息会如何使用、企业的联系方式等等。,包含业务理解、数据采集、数据清洗、数据探索、数据可视化、数据建模、模型结果可视化、分析结果的业务应用等步骤在内的一整套分析流程。:是以数据为分析对象,以探索数据内的有用信息为主要途径,

2023-01-30 23:02:21 1308 4

原创 Python之布尔类型

一、基本知识2020年3月,龟叔首次在PEP285中首次明确在python中引进布尔类型,并包括两个实例True False。继承于int,布尔类型是int的一个子类,意味着True=1,False=0,支持简单的计算 。True+2=323*False=0首字母必须大写。除了0(各种数值下的0)、空字符串、空列表等以及特殊的None值为False,其他都为真。布尔类型只有两个值,所以内存地址都是一样的。逻辑运算符,and、or和not,三种逻辑运算优先级为not>and&gt

2021-12-19 21:13:23 800

原创 Python之整型

1、python中一切都是对象,因此python中其实根本不存在int float这些类型。2、int其实是一个python对象。3、整数类型 int,在python中实际是上长整型,理论是可以存储无限大小的整型数,正数负数和0。一、int类型的结构python中的一个int(或其他)映射到c语言中是一种复杂结构体。所以所占的字节比C语言中大很多。python实际的值只是相应C结构中的一个属性,难怪python的int占28个字节,而C语言只需要4个字节,因为python还存储了很多相关的其他信息

2021-12-19 20:38:33 3407

原创 Python之进制转换

一、Python中的各种进制表示方法二进制以0b开头,每一位都是0或者1#定义一个二进制数print(bin(0b1010)) # 0b1010八进制以0o开头,每一位都是0-7之间的数#定义一个八进制数print(oct(0o1700)) # 0o1700十六进制以0x开头,每一位都不超过15,超过9的数字分别用A(10)、B(11)、C(12)、D(13)、E(14)、F(15)来代替,十六进制中是不区分大小写的#定义一个十六进制数print(hex(0xaE10)) # 0xaE

2021-12-19 20:25:20 2499

原创 Python之ASCII码

python之ASCII码

2021-12-19 20:01:24 21311

原创 Win10 Sublime3配置Python3环境

python3,sublime3,win10,环境配置

2020-10-13 20:49:38 112

原创 Window10 Java安装及环境配置

Java安装,环境配置,win10

2020-10-06 20:13:39 198

原创 Hive常用函数大全

Hive常用函数大全

2020-09-20 15:02:54 1652

原创 Hive学习之一 ——时间日期相关

Hive日期时间相关总结

2020-09-17 17:50:21 1368

转载 Markdown语法大全

包括基本语法、数学公式,希腊字母,各种运算符,括号,字体大小,微分积分,矩阵、行列式、方程组、箭头、文本字体,颜色、图形,圆,正方形,菱形,扑克牌符号等

2024-06-05 21:04:27 35

原创 第六章——抽样分布

统计量的分布称为抽样分布,在使用统计量进行统计推断时常需要知道它的分布。当总日的分布函数已知时,抽样分布是确定的,然而要求出统计量的精确分布,一般来说是困难的。下面介绍来自正态总体的几个常用统计量的分布样本均值服从正态分布。

2023-02-16 13:23:42 1252

原创 第四章——随机变量的数字特征

实际或理论问题中,人们感兴趣的是某些能描述随机变量某一种特征的常数,例如,一个篮球队上场比赛的运动员的身高是一个随机变量,人们常关心的是上场运动员的平均身高;一个城市一户家庭拥有汽车的数是一个随机变量,在考察城市的交通情况时,人们关心的是每户平均拥有汽车的数量;评价棉花的质量时,既需要注意纤维的平均长度,有需要注意纤维长度与平均长度的偏离程度,平均长度较大,偏离程度较小,质量就较好。由随机变量的分布所确定的,能够刻画随机变量某一方面的特征的常数统称为数字特征。

2023-02-09 22:08:08 742

原创 概率论与数理统计——常用的概率分布表

概率论与数理统计相关图表

2023-02-09 21:42:35 2370

原创 第五章——大数定律和中心极限定理

极限定理是概率论的基本理论,在理论研究和应用中起着重要的作用,其中最重要的是称为大数定律和中心极限定理的一些定理。

2023-02-09 17:01:32 1723

原创 描述性统计图表——箱线图

另一方面,箱形图判断异常值的标准以四分位数和四分位距为基础,四分位数具有一定的耐抗性,多达25%的数据可以变得任意远而不会很大地扰动四分位数,所以异常值不能对这个标准施加影响,箱形图识别异常值的结果比较客观。***各批数据的四分位距大小,正常值的分布是集中还是分散,观察各方盒和线段的长短便可明了。比较标准正态分布、不同自由度的t分布和非对称分布数据的箱形图的特征,可以发现:***对于标准正态分布的大样本,只有 0.7%的值是异常值,中位数位于上下四分位数的中央,箱形图的方盒关于中位线对称。

2023-02-08 21:25:35 3257

原创 描述性统计图表——散点图

不仅如此,如果有三个变量,并且自变量为分类变量,散点图通过对点的形状或者点的颜色来区分,即可了解这些变量之间的关系。如果所有的变量为连续性变量,还可以在许多统计软件中绘制高维散点图。如果把一些个案也就是同一个自变量的点连接起来,就成为了线图,也就是表示因变量指标是上升还是下降的。适用范围:当估计两个变量之间存在相关关系时,用散点图进行确认,并观察和确定两者的关系强度。气泡图是散点图的一个变种,是将另一个数值型变量映射给了点的大小,所以,气泡散点图需要有三个数值型变量,而颜色的透明度可以表现气泡的密集程度。

2023-02-05 22:46:28 5171

原创 描述性统计图表——直方图

这里规格的上限用Tu表示,Tl为规格的下限,公差中心M=(Tu+Tl) ,样本的分布中心(平均值)为x ,样本的标准差为s。

2023-02-05 22:41:46 4896

原创 Sql语句执行顺序

在实际执行过程中,每个步骤都会为下一个步骤生成一个虚拟表,这个虚拟表将作为下一个执行步骤的数据。

2023-01-31 10:54:51 864

原创 二、面向对象基础(中)——多态和抽象类

多态和抽象类,虚方法和非虚方法,静态分派和动态绑定,Object类,GC,垃圾回收,toString,getClass,finalize,hashCode,equals

2022-05-22 21:48:43 227

原创 二、面向对象基础(中)——封装和继承

封装和继承,就近原则和追根溯源原则,final,this,super,初始化,构造器,javabean

2022-05-22 18:49:30 290

原创 二、面向对象基础(上)

面向对象编程,类,对象,方法重载,构造方法,变量,面向对象和面向过程的区别

2022-05-22 18:15:00 84

原创 一、Java基础之二——基础语法(三)

顺序查找,冒泡排序,Java,数组,入门基础

2022-05-22 17:59:49 102

原创 一、Java基础之二——基础语法(二)

Java基础,循环语句,for,while,do...while,break,continue,九九乘法表,三角形,菱形

2022-05-22 17:08:56 114

原创 一、Java基础之二——基础语法(一)

Java注释,Java关键字,Java标识符,Java数据类型,Java运算符,自加和自减,计算机存储数据

2022-05-22 16:23:16 161

原创 一、Java基础之一——环境配置

Java,Java基础,Java从入到精通,JDK下载,JDK安装,JDK环境配置

2022-05-22 15:31:34 626

原创 Python之浮点型

python默认的是17位小数的精度,不支持32bit的单精度浮点数,如果程序需要精确控制区间和数字精度,可以考虑使用numpy扩展库一、单精度和双精度的区别内存不同单精度浮点数占用4个字节(32位)存储空间,符号位1位,阶码8位,位数23位。双精度浮点数使用8个字节(64位)存储空间来存储一个浮点数,包括符号位1位,阶码11位,尾数52位。所存的数值范围不同单精度浮点数的数据范围-3.4E38到3.4E38,双精度浮点数可以表示的数字绝对值范围大约为-2.23E308到1.79E308

2021-12-19 21:06:41 5087

原创 Python转义符

python转义符

2021-12-19 19:00:40 354

原创 Hive学习之三——Hive常用操作

Hive常见操作Hive建表Hive建表CREATE [TEMPORARY] [EXTERNAL] TABLE [IF NOT EXISTS] [db_name.]table_name -- (Note: TEMPORARY available in Hive 0.14.0 and later) [(col_name data_type [COMMENT col_comment], ... [constraint_specification])] [COMMENT table_commen

2021-12-19 18:39:48 123

原创 Python3.9安装及环境配置

python,安装,环境配置,最新

2020-10-06 20:46:40 16313 3

原创 Hive学习之二——group by和grouping sets的区别

group by和grouping sets的区别

2020-09-18 16:08:22 4047 1

概率论与梳理统计-回归分析

包括一元和二元回归模型。线性回归模型的建立、参数的估计、线性假设的显著性检验、参数的置信区间、函数值的点估计和置信区间、函数值Y的点预测和预测区间以及可化为一元线性回归模型的例子

2023-02-09

概率论与数理统计-方差分析

包括单因素方差分析和双因素方差分析的数学模型建立过程及计算过程,误差平方和的统计特性等

2023-02-09

概率论与数理统计-假设检验

包括假设检验的步骤,正态总体均值的假设检验、正态总体方差的假设检验、置信区间与假设检验之间的关系、样本容量的选取、假设检验问题的p值法等内容

2023-02-09

概率论与数理统计-参数估计

包含点估计、矩估计、区间估计、估计量的评选标准,置信区间的解释,正态总体均值与方差的区间估计,单侧置信区间等内容

2023-02-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除