自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

Bryan__的专栏

https://github.com/YouChouNoBB

12月 10月 09月 06月 04月 03月

原创使用spark scala计算信息熵，信息增益，信息增益率

找了下，没找到现成的代码，自己写了个，速度还能接受，可以用来做简单的特征选择 import org.apache.spark.rdd.RDD class FeatureSelect { //信息熵 def entropyRDD(data:RDD[String])={ val size=data.count() val p=data.map(x=>(x,1)).r...

2018-10-30 20:40:27 2759 2

机器学习/数据挖掘岗面试准备

参加各大公司面试时准备的复习资料，已经拿到百度，腾讯，华为offer

2016-09-26

9个大数据竞赛方案分享，其中6次获得top10

对参加过的9个大数据竞赛一个浓缩的解决方案总结其中9个比赛6次获得top10

2016-06-15

数据挖掘比赛经验

之前应老师要求，跟学弟学妹们吹了下牛。只准备了一天，水平有限，看看就好

2016-05-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除