![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
DATA-OG
这个作者很懒,什么都没留下…
展开
-
机器学习与统计学的区别?
我觉得其中的一个区别是,使用场景和处理数据的理念不同。 在2015年,开始接触机器学习时,我没有只关注它的算法栈本身,更多关注的是它与统计学在使用上的区别,尤其是在处理分类与回归的问题上,两门学科都能解决,那么难免要问一问为什么他们要解决相同的问题,区别又在哪里?随着阅读大量书籍和机器学习的论文,逐渐理解了两者在处理数据理念上的不同。 在工业界中,被使用最多的一个统计学的分支是参数统计,其假设总体分布已知,需要预测的是条件均值和方差。模型选择与特征选择的指标之一是P值,但要得到准确的P值,有几个重要的假原创 2021-02-17 21:43:20 · 474 阅读 · 0 评论 -
python 逐步回归 step-wise regression
python的逐步回归 可以使用https://github.com/wangwenhao-DATA-OG/MultiProcessMStepRegression 1.支持双向逐步回归(Step_Wise) 2.支持多进程,在每步增加变量或删除变量时,使用多进程来遍历每个候选变量。Windows系统也支持多进程 3.支持使用者指定的指标来作为变量添加或删除的依据,而不是使用AIC或BIC,在处理不平衡数据时可以让使用者选择衡量不平衡数据的指标 4.支持使用者指定P-VALUE的阈值,如果超过该阈值,即使原创 2021-01-26 14:53:51 · 1617 阅读 · 0 评论