- 博客(5)
- 收藏
- 关注
原创 sql执行顺序小思考
SQL题:查看下面的SQL,select sale as saleroom, comm as commissionfrom tb_empwhere saleroom > 3000;请问是否能执行成功?请给出理由。解答:不能;因为列的别名不能在where条件使用,具体原因:where子句比select子句先执行,在where执行前列的别名还没有生效。引自:【每日一练:SQL】where子句使用列别名的解答——debimeng然而 from后面可以加别名。因为from是第一个执.
2020-12-29 22:12:37 98
原创 统计学整理(四)
一元回归分析方差分析,介绍了分类型自变量对数据型因变量影响的分析方法。下面来研究数值型自变量和数值型因变量之间关系的分析方法。拿到数据,首先画散点图,观察散点图的分布情况,再考虑建模,不要为了建模而建模。要根据数据特征和分析目的确定分析方法。一、模型设定线性:Y=β0+β1x+ε非线性:Y=β0+e^β1x+εβ0+β1*x—固定效应的部分,代表Y和X的固定关系ε:不可控的噪声因素,一定是没有意义的。如果仍然有意义,那么方程有问题,没有完全提取X与Y的信息。参数如何估计未知β:最大似
2020-12-10 23:00:08 1898
原创 统计学整理(三)
分类数据分析之前我们回顾了一下从2个连续型数据的估计和检验。现在要展开2个分类型数据的拟合优度和独立性的检验(列联表),再到一个分类数据一个连续数据的方差分析。什么是对分类数据进行分析?就是对不同类别下产生的频数进行统计,进而看类别与类别之间相互作用的关系。一般用χ^2检验一、χ^2统计量χ^2分布用于测定两个分类变量之间的相关程度。统计量公式:描述了观察值与期望值之间的接近程度。自由度越大,越趋近于正态分布。二、拟合度检验(1个分类变量的相关性检验)1.主要用来判断:各分类的
2020-12-08 22:43:37 4535
原创 统计学整理(二)
前情回顾:之前通过学习不同随机变量的各种概率密度函数,通过已知总体的分布,来推算样本的概率分布。又由中心极限定理可知,大样本量下,样本服从正态分布。所以,下面我们开始讨论,如何通过样本估计总体。一、参数(样本)估计(一)点估计和区间估计估计前提:知道总体服从什么样的分布。点估计:总体中μ和σ^2未知,用抽取样本计算样本μ和σ ^2 的估计值 代替 总体真值。但 由于点估计无法确定可靠度量性,因此不能依赖点估计,而是围绕点估计构造总体参数的区间。区间估计:由点估计统计量加减估计误差,.
2020-12-07 11:15:09 2896
原创 统计学整理(一)
统计学整理一、数据的类别:1.离散型数据:只能用自然数或整数单位计算的数据。(一般按类别计数)2.连续型:可在区间内连续分割的数值。分类数据、顺序数据、数值型数据:https://blog.csdn.net/YPP0229/article/details/105042302横截面数据:某一个类别的,多变量数据(一个病人的血型,血压,心跳等的数值)除含有时间标签的数据,都可以叫横截面数据。代表模型:多元回归、逻辑回归、托宾回归、截尾回归时间序列数据:有时间的标签,在时间维度上的某一变量数据
2020-12-02 14:04:50 3066
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人