自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

JavaEdge

全是硬核干货的公众号:JavaEdge

原创 升级至macOS 10.14 Mojave后Caps lock(大写键)无法使用的解决办法

苹果最近发布了macOS 10.12开发者测试版,喜欢尝鲜的用户可以自行搜索资源下载体验,不过对于普通用户而言不建议使用开发者测试版。当你升级至macOS 10.12后默认情况下无法使用Caps lock(大写键),这是由于系统默认设置将该键用作了切换回英文。要解决这个问题,你可以参照下面的步骤:...

2019-04-26 16:25:31

阅读数 2212

评论数 0

原创 macOS下 Hive 2.x 的安装与配置

1 简介 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的[SQL]查询功能,可以将SQL语句转换为MapReduce任务进行运行。其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用...

2019-04-22 15:28:41

阅读数 157

评论数 0

原创 Spark机器学习实战 (十二) - 推荐系统实战

0 相关源码 将结合前述知识进行综合实战,以达到所学即所用。在推荐系统项目中,讲解了推荐系统基本原理以及实现推荐系统的架构思路,有其他相关研发经验基础的同学可以结合以往的经验,实现自己的推荐系统。 1 推荐系统简介 1.1 什么是推荐系统 1.2 推荐系统的作用 1.2.1 帮助顾客快速定...

2019-04-21 14:23:08

阅读数 419

评论数 0

原创 Spark机器学习实战 (十一) - 文本情感分类项目实战

0 相关源码 将结合前述知识进行综合实战,以达到所学即所用。文本情感分类这个项目会将分类算法、文本特征提取算法等进行关联,使大家能够对Spark的具体应用有一个整体的感知与了解。 1 项目总体概况 2 数据集概述 数据集 3 数据预处理 4 文本特征提取 官方文档介绍 提取,转换和...

2019-04-19 21:21:23

阅读数 308

评论数 0

原创 基于Spark的机器学习实践 (十) - 降维

通过讲解PCA算法的原理,使大家明白降维算法的大致原理,以及能够实现怎么样的功能。结合应用降维算法在分类算法使用之前进行预处理的实践,帮助大家体会算法的作用。 0 相关源码 1 PCA算法及原理概述 1.1 何为降维? ◆ 从高维度变为低维度的过程就是降维 ◆ 例如拍照就是把处在三维空间中的人或...

2019-04-18 16:00:18

阅读数 214

评论数 0

原创 基于Spark的机器学习实践 (九) - 聚类算法

0 相关源码 1 k-平均算法(k-means clustering)概述 1.1 回顾无监督学习 ◆ 分类、回归都属于监督学习 ◆ 无监督学习是不需要用户去指定标签的 ◆ 而我们看到的分类、回归算法都需要用户输入的训练数据集中给定一个个明确的y值 1.2 k-平均算法与无监督学习 ◆ k-...

2019-04-17 18:51:53

阅读数 228

评论数 0

原创 基于Spark的机器学习实践 (八) - 分类算法

0 相关源码 1 朴素贝叶斯算法及原理概述 1.1 朴素贝叶斯简介 ◆ 朴素贝叶斯算法是基于贝叶斯定理和特征条件独立假设的一种分类方法 ◆ 朴素贝叶斯算法是一种基于联合概率分布的统计学习方法 ◆ 朴素贝叶斯算法实现简单,效果良好,是一种常用的机器学习方法 1.2 贝叶斯定理 ◆ 朴素贝叶斯算法的...

2019-04-16 22:04:13

阅读数 325

评论数 0

原创 基于Spark的机器学习实践 (七) - 回归算法

0 相关源码 1 回归分析概述 1.1 回归分析介绍 ◆ 回归与分类类似,只不过回归的预测结果是连续的,而分类的预测结果是离散的 ◆ 如此,使得很多回归与分类的模型可以经过改动而通用 ◆ 因此对于回归和分类中基本原理相同或类似的模型 ,不再赘述 1.2 Spark中集成的回归算法 ◆ Spark...

2019-04-15 14:56:13

阅读数 206

评论数 0

原创 基于Spark的机器学习实践 (六) - 基础统计模块

0 相关源码 1 基础统计模块及常用统计学知识介绍 ◆ Spark 的基础统计模块即MLlib组件中的Basic Statistics部分 ◆ Basic Statistics主要包括Correlation 与Hypothesis testing等 ◆ 其大多被封装在orq.apache spa...

2019-04-12 19:04:17

阅读数 202

评论数 0

原创 基于Spark的机器学习实践 (四) - 数据可视化

0 相关源码 1 数据可视化的作用及常用方法 1.1 为什么要数据可视化 1.1.1 何为数据可视化? ◆ 将数据以图形图像的形式展现出来 ◆ 人类可以对三维及以下的数据产生直观的感受 1.1.2 数据可视化的好处 ◆ 便于人们发现与理解数据蕴含的信息 ◆ 便于人们进行讨论 1...

2019-04-09 17:26:55

阅读数 392

评论数 0

原创 基于Spark的机器学习实践 (三) - 实战环境搭建

0 相关源码 1 Spark环境安装 ◆ Spark 由scala语言编写,提供多种语言接口,需要JVM ◆ 官方为我们提供了Spark 编译好的版本,可以不必进行手动编译 ◆ Spark安装不难,配置需要注意,并且不一定需要Hadoop环境 下载 解压 tar zxvf sp...

2019-04-09 15:40:08

阅读数 322

评论数 0

原创 基于Spark的机器学习实践 (二) - 初识MLlib

1 MLlib概述 1.1 MLlib 介绍 ◆ 是基于Spark core的机器学习库,具有Spark的优点 ◆ 底层计算经过优化,比常规编码效率往往要高 ◆ 实现了多种机器学习算法,可以进行模型训练及预测 1.2 Spark MLlib实现的算法 ◆ 逻辑回归 朴素贝叶斯 线性回归...

2019-04-09 00:07:13

阅读数 302

评论数 0

原创 基于Spark的机器学习实践 (一) - 初识机器学习

1 导学 1.1 开源大数据技术 1.2 提高竞争力必备 1.3 教程规划 1.7 预备知识 了解大数据相关基础知识 熟悉Linux基本命令 熟悉Scala语言的编程方法 有一定的数学基础 1.8 环境参数 Spark : 2.3.0 JDK : 1.8 IDE...

2019-04-08 18:49:00

阅读数 728

评论数 0

原创 重磅 Spring Boot 2.1.4 正式版发布!

期待已久的Spring Boot 2.1.4 RELEASE版本已于今天四月初正式发布!  Spring Boot版本很多,作为使用Spring Boot的技术人而言,版本的选择也尤为重要 登录 官网 不难发现 Spring Boot已...

2019-04-04 17:05:33

阅读数 1650

评论数 0

提示
确定要删除当前文章?
取消 删除