自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 LightGBM

参考文章https://blog.csdn.net/qq_24519677/article/details/82811215视频讲解https://v.qq.com/x/page/k0362z6lqix.html

2020-02-14 20:59:57 175

原创 关于机器学习简要知识点

对于机器学习中特征工程的理解 参考文章:http://blog.itpub.net/29829936/viewspace-2648602/对于模型的理解引用自一篇博客https://www.cnblogs.com/bjwu/p/8970821.htmlFeatures:numeric, categorical, ordinal, datetime, coordinate, t...

2020-02-10 18:40:48 142

原创 关于R中p值的理解

进行线性回归lm后执行summary函数之后,会有Coefficients:Estimate Std. Error t value Pr(>|t|) 这样的值出现,其中P值我是这样理解的P值是用来判定假设检验结果的一个参数,也可以根据不同的分布使用分布的拒绝域进行比较。P值(P value)就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。这样定义原假设,我们希望成立实现的研究假...

2018-06-13 16:33:01 22221

原创 R中常用英文词汇

Coefficients 系数Intercept 截距Residuals 残差1Q是第1百分位数,就是集合中,处于第25%位置的数,同理,3Q就是第3百分位,就是处于75%位置的数。里面的2Q就是median ,0%=min  100%=maxStd. Error  估计系数的标准差...

2018-06-07 14:40:05 2295

转载 R中常用统计指标含义

1、均值mean()2、方差:表示数据集中数据点的离散程度3、标准差表示的也是数据点的离散程度,与方差相比,使用标准差来表示数据点的离散程度有3个好处:表示离散程度的数字与样本数据点的数量级一致,更适合对数据样本形成感性认知。依然以上述10个点的CPU使用率数据为例,其方差约为41,而标准差则为6.4;两者相比较,标准差更适合人理解。表示离散程度的数字单位与样本数据的单位一致,更方便做后续的分析运...

2018-06-06 19:39:37 3919

原创 常用Hive语法及函数

hive使用一、joinleft join=left outer join ----返回左表所有的行,没有值的列为nulljoin=inner join ----返回匹配的行full join 返回左右表所有行二、havinghaving---对由sum或其它集合函数运算结果的输出进行限制eg:select user_id, sum(amount)/100 as amount from a ...

2018-04-12 20:12:44 431

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除