- 博客(10)
- 资源 (5)
- 收藏
- 关注
原创 kafka安装配置
一.Zookeeper部署 1.下载解压zookeeper-3.4.6.tar.gz # tar -xvf zookeeper-3.4.6.tar.gz # mv zookeeper-3.4.6 zookeeper #chown -R root:root zookeeper 2.修改配置 # cd zookeeper/conf # cp zoo_sample.cfg z...
2018-04-29 21:37:22 108
原创 CentOS6安装telnet
一.CentOS下查看系统是否已安装telnetrpm -qa | grep telnettelnet-0.17-48.el6.x86_64telnet-server-0.17-48.el6.x86_64telnet 是挂在 xinetd 底下的,所以同时查看是否安装了xinetd服务rpm -qa | grep xinetdxinetd-2.3.14-39.el6_4.x86_64两者都没有的安...
2018-04-29 19:52:53 2662
原创 量化交易研究———数据获取
关于开发工具的选择,经过一些对比研究后,决定使用Anaconda ,用anaconda集成的ipython做工作台,做一些分析和小节程序调试的工作。Anaconda是一个用于科学计算的Python发行版,支持Linux,Mac,Windows系统,提供了包管理与环境管理的功能,可以很方便地解决多版本python并存,切换以及各种第三方包安装问题。 Anaconda利用工具/命令conda来进行包和...
2018-04-17 16:57:40 2594
转载 pandas.read_csv参数整理
pandas.read_csv参数整理 读取CSV(逗号分割)文件到DataFrame也支持文件的部分导入和选择迭代更多帮助参见:http://pandas.pydata.org/pandas-docs/stable/io.html参数:filepath_or_buffer : str,pathlib。str, pathlib.Path, py._path.local.LocalPath or a...
2018-04-17 15:15:51 350
转载 python pandas IO tools 之csv文件读写
源地址:https://blog.csdn.net/ly_ysys629/article/details/55107237python pandas IO tools 之csv文件读写英文原文:pandas IO tools读取csv文件:pd.read_csv(),写入csv文件:pd.to_csv() pandas还可以读取一下文件: read_csv, read_excel, read_hd...
2018-04-17 15:15:35 485
原创 CentOS6.5 安装Python3.6
首先去python官网下载python3的源码包,网址:https://www.python.org/进去之后点击导航栏的Downloads,也可以鼠标放到Downloads上弹出菜单选择Source code,表示源码包,这里选择最新版本,当然下面也有很多其他历史版本,点进去之后页面下方可以看到下载链接,包括源码包、Mac OSX安装包、Windows安装包Python安装之前需要一些必要的模块...
2018-04-15 08:06:08 1498
原创 阿里云虚拟机转让(RAM创建账户)
前段时间阿里云虚拟机大量便宜出售。100元一年,但是仅限于新用户。本人因学习需要在已有情况下,用他人账号重新购买了一台。但是需要他人的账号密码,极度不方便,现找到好的方法进行管理。也就是阿里云的新功能,RAM账户设置点击授予/收回RAM角色按操作引导创建授权后做如下操作:为自己的子账户给予权限(谨慎!!!!!!!!!)自己设置一个企业别名就可以登入了!也就意味着,可以让他人购买云虚拟机而自己操作了...
2018-04-10 17:04:40 794
原创 Flume介绍
一、Flume是一种分布式,可靠且可用的服务,用于高效地收集,汇总和移动大量日志数据。它具有基于流式数据流的简单而灵活的架构。它具有可靠的可靠性机制和许多故障转移和恢复机制,具有强大的容错性和容错能力。它使用一个简单的可扩展数据模型,允许在线分析应用程序。二、flume中event的相关概念:flume的核心是把数据从数据源(source)收集过来,在将收集到的数据送到指定的目的地(sink)。为...
2018-04-09 22:17:04 294
原创 Spark sql DataFrame Datasets Guide
Spark SQL不是SQL !!!!!!!!一.Spark SQL定义Spark SQL is Apache Spark's module for working with structured data.Spark结构查询语言是阿帕奇Spark用于处理结构化数据的模块。(没有体现sql)Spark SQL is not about SQLSpark SQL is about more tha...
2018-04-08 17:45:19 801
转载 总结:Hive,Hive on Spark和SparkSQL区别
转载:https://blog.csdn.net/MrLevo520/article/details/76696073Hive on MapreduceHive的原理大家可以参考这篇大数据时代的技术hive:hive介绍,实际的一些操作可以看这篇笔记:新手的Hive指南,至于还有兴趣看Hive优化方法可以看看我总结的这篇Hive性能优化上的一些总结Hive on Mapreduce执行流程执行流程...
2018-04-08 17:06:08 793
apache-hive-1.1.0-cdh5.7.1-bin.tar.gz
2018-05-22
Java核心必读书(包含面试题).rar
2018-05-10
hadoop-2.6.0-cdh5.7.1.tar.gz(编译版)
2018-05-10
spark-2.2.0-bin-2.6.0-cdh5.7.0.tg
2018-03-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人