自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

leofionn的博客

求内推,求砸offer~

  • 博客(10)
  • 资源 (5)
  • 收藏
  • 关注

原创 kafka安装配置

一.Zookeeper部署 1.下载解压zookeeper-3.4.6.tar.gz # tar -xvf zookeeper-3.4.6.tar.gz # mv zookeeper-3.4.6 zookeeper #chown -R root:root zookeeper 2.修改配置 # cd zookeeper/conf # cp zoo_sample.cfg z...

2018-04-29 21:37:22 108

原创 CentOS6安装telnet

一.CentOS下查看系统是否已安装telnetrpm -qa | grep telnettelnet-0.17-48.el6.x86_64telnet-server-0.17-48.el6.x86_64telnet 是挂在 xinetd 底下的,所以同时查看是否安装了xinetd服务rpm -qa | grep xinetdxinetd-2.3.14-39.el6_4.x86_64两者都没有的安...

2018-04-29 19:52:53 2662

原创 量化交易研究———数据获取

关于开发工具的选择,经过一些对比研究后,决定使用Anaconda ,用anaconda集成的ipython做工作台,做一些分析和小节程序调试的工作。Anaconda是一个用于科学计算的Python发行版,支持Linux,Mac,Windows系统,提供了包管理与环境管理的功能,可以很方便地解决多版本python并存,切换以及各种第三方包安装问题。 Anaconda利用工具/命令conda来进行包和...

2018-04-17 16:57:40 2594

转载 pandas.read_csv参数整理

pandas.read_csv参数整理 读取CSV(逗号分割)文件到DataFrame也支持文件的部分导入和选择迭代更多帮助参见:http://pandas.pydata.org/pandas-docs/stable/io.html参数:filepath_or_buffer : str,pathlib。str, pathlib.Path, py._path.local.LocalPath or a...

2018-04-17 15:15:51 350

转载 python pandas IO tools 之csv文件读写

源地址:https://blog.csdn.net/ly_ysys629/article/details/55107237python pandas IO tools 之csv文件读写英文原文:pandas IO tools读取csv文件:pd.read_csv(),写入csv文件:pd.to_csv() pandas还可以读取一下文件: read_csv, read_excel, read_hd...

2018-04-17 15:15:35 485

原创 CentOS6.5 安装Python3.6

首先去python官网下载python3的源码包,网址:https://www.python.org/进去之后点击导航栏的Downloads,也可以鼠标放到Downloads上弹出菜单选择Source code,表示源码包,这里选择最新版本,当然下面也有很多其他历史版本,点进去之后页面下方可以看到下载链接,包括源码包、Mac OSX安装包、Windows安装包Python安装之前需要一些必要的模块...

2018-04-15 08:06:08 1498

原创 阿里云虚拟机转让(RAM创建账户)

前段时间阿里云虚拟机大量便宜出售。100元一年,但是仅限于新用户。本人因学习需要在已有情况下,用他人账号重新购买了一台。但是需要他人的账号密码,极度不方便,现找到好的方法进行管理。也就是阿里云的新功能,RAM账户设置点击授予/收回RAM角色按操作引导创建授权后做如下操作:为自己的子账户给予权限(谨慎!!!!!!!!!)自己设置一个企业别名就可以登入了!也就意味着,可以让他人购买云虚拟机而自己操作了...

2018-04-10 17:04:40 794

原创 Flume介绍

一、Flume是一种分布式,可靠且可用的服务,用于高效地收集,汇总和移动大量日志数据。它具有基于流式数据流的简单而灵活的架构。它具有可靠的可靠性机制和许多故障转移和恢复机制,具有强大的容错性和容错能力。它使用一个简单的可扩展数据模型,允许在线分析应用程序。二、flume中event的相关概念:flume的核心是把数据从数据源(source)收集过来,在将收集到的数据送到指定的目的地(sink)。为...

2018-04-09 22:17:04 294

原创 Spark sql DataFrame Datasets Guide

Spark SQL不是SQL !!!!!!!!一.Spark  SQL定义Spark SQL is Apache Spark's module for working with structured data.Spark结构查询语言是阿帕奇Spark用于处理结构化数据的模块。(没有体现sql)Spark SQL is not about SQLSpark SQL is about more tha...

2018-04-08 17:45:19 801

转载 总结:Hive,Hive on Spark和SparkSQL区别

转载:https://blog.csdn.net/MrLevo520/article/details/76696073Hive on MapreduceHive的原理大家可以参考这篇大数据时代的技术hive:hive介绍,实际的一些操作可以看这篇笔记:新手的Hive指南,至于还有兴趣看Hive优化方法可以看看我总结的这篇Hive性能优化上的一些总结Hive on Mapreduce执行流程执行流程...

2018-04-08 17:06:08 793

华泰人工智能系列报告1-45.rar

截止2021年5月31日全部报告

2021-05-31

apache-hive-1.1.0-cdh5.7.1-bin.tar.gz

部署安装mysql5.6, hadoop-2.6.0-cdh5.7.1 伪分布式已启动,即在hadoop上部署hive

2018-05-22

Java核心必读书(包含面试题).rar

包含:thinking in java 3 chinese 2011-2017年Java面试题集锦 The+JVM+Specification.pdf Java深度历险.pdf Java+Performance.pdf Inside+the+Java+Virtual+Machine.pdf 深入理解Java7.pdf 深入理解Java虚拟机++JVM高级特性与最佳实践.pdf 深入理解OSGi:Equinox原理、应用与最佳实践.pdf 等数十本书

2018-05-10

hadoop-2.6.0-cdh5.7.1.tar.gz(编译版)

编译环境如下: jdk1.7 apache-maven-3 protobuf-2.5.0 findbugs-1.3.9 gcc gcc-c++ make cmake openssl zlib ncurses snappy bzip2 lzo lzop autoconf automake

2018-05-10

spark-2.2.0-bin-2.6.0-cdh5.7.0.tg

spark-2.2.0-bin-2.6.0-cdh5.7.0.tg 由:Java需要7+版本,而且在Spark2.0.0之后Java 7已经被标识成deprecated了,但是不影响使用,但是在Spark2.2.0版本之后Java 7的支持将会被移除; Maven需要3.3.9+版本 hadoop2.6.0cdh5.7.0

2018-03-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除