统计学
python_new
这个作者很懒,什么都没留下…
展开
-
常见分布的概率分布及期望方差
文章转载:https://www.jianshu.com/p/c05bafb52877转载 2020-04-07 20:58:01 · 5792 阅读 · 1 评论 -
统计推断中的参数估计和假设检验
拿到一个数据之后,一般都需要用python读进来或者在excel里面观看每个变量的含义,有助于理解这个数据,同时要一个变量一个变量进行排序,看看缺失值,异常值等情况,进行数据清洗如何培养数据的敏感性??多看数据的分布图(直方图和柱形图一般就可以了),或者列联表分析图,然后基于对业务的理解,能看出来这个数据大概是个什么情况错误值的处理方法:1、首选是改对了(成本很高)2、用缺失值替换3、删...原创 2020-03-07 15:25:29 · 1880 阅读 · 0 评论 -
多元线性回归模型检验-续上篇
https://editor.csdn.net/md/?articleId=105137945其实上一篇讨论的多元线性回归还不是很全面,而且训练和测试集都没有分,在这里继续讨论多元线性回归模型检验的相关问题。多元线性回归的输出变量是连续变量,输入变量中如果包含离散变量需要做哑变量或One-hot编码,连续变量可以直接用来建模。共线性问题:https://www.sohu.com/a/326...原创 2020-04-04 20:42:46 · 3369 阅读 · 0 评论 -
统计建模-多元线性回归预测房价
持续找工作中,闲聊时间看看统计建模的相关知识,首先来看建模的一般流程:(1)获取数据,理解指标含义,对指标进行归类(2)数据(3)前期预处理:比如ID,或者该指标的取值唯一等字段就不用参与建模了(4)数据探索,看数据的分布情况,发现缺失、异常、数据均衡性问题1、自变量x和因变量y的分布情况;连续变量看均值、中位数、标准差、偏度等,离散变量看频数,占比等;...原创 2020-03-27 17:00:50 · 2928 阅读 · 0 评论 -
统计学基础-周计划1
数据的集中趋势众数概念:一组数据中出现次数最多的数,众数可以是多个,也可以没有。举个栗子:[0,0,1,1,2,3]中的众数是0和1,[0,1,2,3]中没有众数,[0,1,2,1]中的众数是1。中位数概念:一组数据中,中间位置的那个数,假设n为奇数,排序之后中间的那个值就是中位数,如果n是偶数,排序之后中间两个数的平均值即为中位数。举个栗子:假设排序之后的数据为[0,1,2,4,4]...原创 2019-07-21 08:38:53 · 400 阅读 · 0 评论