- 博客(7)
- 资源 (3)
- 收藏
- 关注
原创 解决Maven下载依赖慢的问题
使用Maven构建项目时,项目中有的依赖包可能下载的非常慢,我们可以通过配置镜像来解决这个问题。 之前开源中国的那个好像已经关闭了,于是我找到了一个阿里的来解决。 在Maven的配置文件(%MAVEN%/conf/setting.xml)中的< mirrors> 标签中加入 <!-- 阿里云仓库 --> <mirror> <id>alimaven</id>
2017-03-27 13:55:31 807
原创 CDH5.10.x安装
1.CDH (Cloudera’s Distribution, including Apache Hadoop),是Hadoop众多分支中的一种,由Cloudera维护,基于稳定版本的Apache Hadoop构建,并集成了很多补丁,可直接用于生产环境。 Cloudera Manager则是为了便于在集群中进行Hadoop等大数据处理相关的服务安装和监控管理的组件,对集群中主机、Hadoop、Hiv
2017-03-26 00:11:33 3556
原创 Centos7安装并配置mysql5.7完美教程
1、配置YUM源下载mysql源安装包shell> wget http://dev.mysql.com/get/mysql57-community-release-el7-8.noarch.rpm安装mysql源shell> yum localinstall mysql57-community-release-el7-8.noarch.rpm 检查mysql源是否安装成功 shell> yum
2017-03-25 20:12:46 743
原创 CentOS7环境搭建
1.安装 VirtualBox 5.1.14软件 推荐官方下载最新版,下载地址: https://www.virtualbox.org/wiki/Downloads 2.运行VirtualBox 5.1.14,新建3台虚拟机,并安装CentOS7操作系统 CentOS7下载地址: https://wiki.centos.org/Download 真实环境下,需要远程登录,所以我们需要使用桥
2017-03-25 20:02:11 623
原创 Kettle-7.0使用举例
1.使用举例 1.1建立转换 选中列表中的的“表输入”、“表输出”、“插入/更新”,拖拽到右侧工作区。鼠标选中节点键盘按shift键,拖拽即可连线。下图是一个转换,有两个动作,一是直接从数据源表同步数据到目标表,一是检查源表的插入和更新,同步到目标表。黑色线为生效,灰色线为失效,节点和连接可双击进行编辑。双击编辑表输入动作。可预览数据是否正确。双击编辑表输出动作。要获取的字段设置如下所示:点击“
2017-03-10 16:59:53 10377 2
原创 Win7下Kettle-7.0安装部署
1、Kettle概念 Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。 Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。 Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么
2017-03-10 13:36:52 29581 4
原创 什么是Elasticsearch?
一、Elasticsearch简介Elasticsearch是一个分布式的搜索引擎,可以实时分析。可以扩展到数百台服务器,检索巨大的数据。集成在一个独立的服务器,你可以通过REST风格的API来访问。Elasticsearch是建立在Lucene之上,Lucene是一个全文搜索引擎库,最先进的,丰富特点的搜索引擎库。(Lucene只是一个库,要驾驭它,你需要用java集成Lucene,更糟糕的是,你
2017-03-06 14:28:09 1963
数据科学入门
2018-02-08
TensorFlow+官方文档中文版.pdf
2018-02-07
面向机器智能的TensorFlow实践
2018-02-07
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人