机器学习
vatermutter
越努力越幸运
展开
-
时序预测模型Prophet使用总结
模型公式:y(t)=g(t)+s(t)+h(t)+εt其中g(t)是趋势项, s(t) 是周期项,如 weekly 和 yearly 等,h(t)是节假日趋势主要调整参数:n_changepoints(拐点数量):默认为25,通常情况下,拐点数量越多,曲线拟合的越好,也容易过拟合。 yearly_seasonality(季节性标识):默认为'auto',如果数据有季节...原创 2020-03-17 16:20:34 · 1746 阅读 · 0 评论 -
Windows下安装Python机器学习相关的sklearn(scikit-learn)模块
参考官方网页:http://scikit-learn.org/dev/developers/advanced_installation.html#install-bleeding-edge截图如下:在cmd窗口下输入:pip install -U scikit-learn (安装或更新都是输入这个命令)因为我先安装了Anacon原创 2016-11-02 14:21:49 · 3675 阅读 · 0 评论 -
spark ml 随机森林源码笔记一
setMaxDepth:最大树深度setMaxBins:最大装箱数,为了近似统计变量,比如变量有100个值,我只分成10段去做统计setMinInstancesPerNode:每个节点最少实例setMinInfoGain:最小信息增益setMaxMemoryInMB:最大内存MB单位,这个值越大,一次处理的节点划分就越多setCacheNodeIds:是否缓存节点id,缓存可以...转载 2018-11-16 14:49:58 · 730 阅读 · 0 评论 -
机器不学习:如何处理数据中的「类别不平衡」?
转自:https://www.cnblogs.com/jiqibuxuexi/p/8416770.html 机器学习中常常会遇到数据的类别不平衡(class imbalance),也叫数据偏斜(class skew)。以常见的二分类问题为例,我们希望预测病人是否得了某种罕见疾病。但在历史数据中,阳性的比例可能很低(如百分之0.1)。在这种情况下,学习出好的分类器是很难的,而且在这种情况...转载 2018-11-16 14:56:59 · 437 阅读 · 1 评论