自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

xum2008的专栏

专注成就专业!!!

  • 博客(3)
  • 资源 (9)
  • 收藏
  • 关注

原创 定制带第三方库的python,解决spark/hadoop环境中sklearn的调用问题

Conda, Miniconda (Python)这是一个python定制的好工具。忙活了一整天,终于发现了它,这个工具可以让我们定制python和对应的第三方的库,方便我们在不同机器上执行这些第三方的库。http://scikit-learn.org/stable/install.htmlconda/condahttps://github.com/conda/condaMinic

2015-09-29 20:53:55 5028 1

原创 随机森林(random forest)可以解决样本分布不均匀维度大且特征缺失的问题

随机森林的定义:上世纪八十年代Breiman等人发明分类树的算法(Breiman et al. 1984),通过反复二分数据进行分类或回归,计算量大大降低。2001年Breiman把分类树组合成随机森林(Breiman 2001a),即在变量(列)的使用和数据(行)的使用上进行随机化,生成很多分类树,再汇总分类树的结果。随机森林在运算量没有显著提高的前提下提高了预测精度。随机森林对多元公线性不敏感

2015-09-20 17:02:59 38601 4

原创 处理样本分布不平衡,偏斜比较厉害的方法总结

由于,之前一直从事数据挖掘和机器学习方面的学习和工作。在学习和工作中经常会遇到训练的样本中的各个类别的数量存在比较大的差异,而这种差异给模型训练和预测到来了很多困难和挑战。针对这个问题,我们一般的处理方法有4种:1.上采样(over-sample);2.下采样(under-sample);3.smote方法;4.调整机器学习算法;一、上采样也叫过采样,是指用大于信号

2015-09-11 18:59:19 7881 1

广州多益网络2013校园招聘上机题目2

广州多益网络2013校园招聘上机题目2

2013-01-21

2011广州多益上机题

2011广州多益上机题 2011广州多益上机题 2011广州多益上机题

2013-01-21

自己动手写内核 源码

自己动手写内核 源码,一个很好的例子,希望大家喜欢

2011-02-27

编译技术期末考题-199502005

编译技术期末考题-199502005

2011-01-04

经典的课程设计,帮你解决一切!!

你还在为课程设计苦恼吗???再也不会了,我这有,完整的带注释!!!

2008-12-19

机器人足球教程,给每个热爱机器人足球的人!!!!!!!!!!

真是非常好的教学资料!!!!!!!!!!!!!

2008-12-06

链表问题,真的很有用!!!!!!!

为新手解决指针问题,真的很实用!!!!! 想从菜鸟成为老鸟吗?那就下吧,让你成功!!!!!!!!

2008-11-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除