自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (1)
  • 收藏
  • 关注

原创 区分【生成方法】与【判别方法】

生成方法 由数据学习联合概率分布P(X,Y),然后求出条件概率分布P(Y|X)作为预测的模型,生产模型:P(Y|X)=P(X,Y)/P(X) 模型表示了给定输入X产生输出Y的生成关系。 代表方法:隐马尔可夫模型,朴素贝叶斯模型 优点:收敛快,允许存在隐变量判别方法 由数据直接虚席决策函数f(x)或者条件概率分布P(Y|X)作为预测的模型,即判别模型。关心的是对给定的输入X

2017-05-31 18:41:51 754

原创 虚拟机CentOS 7 网络连接显示"线缆被拔出"

虚拟机centOS 7显示“线缆被拔出”的原因是两个服务被禁用了。解决方法:1.首先查看网络连接方式选择菜单中的“虚拟机”,再选择“设置”,选择“网络适配器”,查看网络连接方式设置。这里我选择的是“NAT模式”。 2. 开启相关服务在桌面选中“计算机”,左键“管理”,打开计算机管理窗口。点击“服务和应用”,选择“服务”,找到VMware DHCP Service”和”VMware NAT S

2017-05-25 20:20:36 14504 13

原创 Spark学习笔记(一)——spark简介

Spark是什么spark是基于内存计算的大数据并行计算框架。09年诞生于加州大学伯克利分校AMPLab.Spark相较于Hadoop的优点Spark是MapReduce的替代方案,兼容HDFS、Hive等分布式存储层,可融入Hadoop的生态系统,以弥补MapReduce的不足。其主要优势如下:中间结果输出 可以将多stage的任务串联或者并行执行,而无需将Stage中间结果输出到HDFS

2017-05-25 19:58:07 374

MovieLens数据集

MovieLens数据集,本人正在写处理该数据集的MapReduce示例,欢迎大家下载一起交流学习

2017-07-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除