自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (1)
  • 收藏
  • 关注

原创 Python到pyspark中的py-files的问题

在spark平台上执行Python算法涉及到Python程序的改写,其中import部分需要额外注意。如果我们在执行某个test.py程序时需要调用另外一个common.py,需要在test.py内部添加import common,而此时的import common 不能放在程序头部,需要放在context之后。同时在执行程序时需要–py-files 参数指定引用模块的位置。图2为通过livy调用...

2019-01-18 17:17:29 6561 1

转载 tensorflow+tensorflowonspark+GPU学习笔记

TensorFlow能够让你直接解决各种机器学习任务。目标就是在一般情况下,无论你遇到什么问题,TensorFlow都可以在一定程度上提供API的支持。总的来说TensorFlow就是为了快而设计的,所以它针对你实际使用的硬件和平台做了优化。其中在机器学习框架方面,TensorFlow的真正独特之处在于,能够在5行或者10行代码中构建模型。然后应用这个模型,进行扩展做出产品。因此,你能够在几...

2019-01-09 14:15:47 2370 1

原创 Hive安装

一、简介hive是用类SQL语句(HiveQL)来实现对hadoop下的数据管理。hive属于数据仓库的范畴,那么,数据库和数据仓库到底有什么区别了,这里简单说明一下:数据库侧重于OLTP(在线事务处理),数据仓库侧重OLAP(在线分析处理);也就是说,例如mysql类的数据库更侧重于短时间内的数据处理,反之。无hive:使用者…->mapreduce…-&a

2019-01-08 22:12:03 209

原创 sqoop1.99.7安装、使用及部分问题

一、安装环境已具备java和hadoop的环境,本文的版本为ubuntu16.04、java1.8.0、hadoop2.7.5。安装选择sqoop1.99.7,注意sqoop2中的sqoop1.99.6和1.99.7安装区别较大。二、sqoop2下载安装1.直接在sqoop的官网下载选择sqoop1.99.7版本。我直接下的bin版本,这个版本已经编译好了,直接用。sqoop1.99.7...

2019-01-04 23:42:56 1684 2

MATLAB最大似然互信息MLMI.zip

《Approximating Mutual Information by Maximum Likelihood Density Ratio Estimation》互信息在各种数据处理任务中是有用的,如特征选择或独立的组件分析..本文提出了一种基于密度比函数最大似然估计的相互信息逼近方法。我们的方法称为最大似然互信息(MLMI),具有几个有吸引力的特性,例如不涉及密度估计,它是一个单一的过程,全局最优解可以有效地计算,并且交叉验证可用于模型选择。数值实验表明,MLMI与现有方法相比具有较好的优越性。

2019-11-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除