自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

数据石

大数据工程师的修行之路

  • 博客(2)
  • 收藏
  • 关注

原创 Spark实例WordCount(统计+排序)

实例描述 读文本 分词 去标点 词频统计 排序 代码片段val conf = new SparkConf().setAppName("WordCount").setMaster("local[4]")val sc = new SparkContext(conf)val res = sc.textFile("E:\\\\The_Godfather.txt", 2)

2017-01-18 17:30:52 3105

原创 Logistic回归原理介绍

Logistic回归原理介绍模型假设根据线性回归可以预测连续的值,对于分类问题,我们需要输出0或者1。所以,在分类模型中需要将连续值转换为离散值。我们可以预测: 当hθh_\theta大于等于0.5时,输出为y=1; 当hθh_\theta小于0.5时,输出为y=0。 Logistic回归模型的输出变量范围始终在0和1之间,Logistic回归模型的假设为:hθ(x)=g(θTx)h_\theta(

2016-04-20 22:06:27 3250

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除