- 博客(6)
- 收藏
- 关注
原创 Anaconda安装及介绍
Anaconda安装 基本介绍 数据科学环境–集成了大多数的数据科学工具包 Anaconda 是一个用于科学计算的 Python 发行版,提供了包管理与环境管理的功能。Anaconda 利用 conda 来进行 package 和 environment 的管理,并且已经包含Python 和相关的配套工具。 Anaconda2对应的是Python2.x,直接点击下一步安装即可 An...
2019-12-31 10:49:09 254
原创 jar包冲突解决,jar包分析工具,spring boot
jar包冲突解决 jar包分析工具 spring boot启动的时候报错信息 SLF4J: Class path contains multiple SLF4J bindings. SLF4J: Found binding in [jar:file:/Users/tongqinyuan/.m2/repository/org/slf4j/slf4j-log4j12/1.7.25/slf4j-lo...
2019-12-06 14:57:05 680
原创 Kettle的安装和使用
Kettle的安装和使用 1.本地环境安装 解压文件,双击Spoon.bat操作文件 使用Mysql相关的表输入输出组件以及hive的组件需要自己上传mysql驱动 本机整合大数据环境 整合Hadoop平台 hadoop下载核心配置文件 sz /export/servers/hadoop-2.6.0-cdh5.14.0/etc/hadoop/hdfs-site.xml sz /...
2019-11-25 15:30:07 446
原创 flume1.7 新特性
flume1.7 新特性 1.taildir 1.7版本之前 在flume1.7之前如果想要监控一个文件新增的内容,我们一般采用的source 为 exec tail ,但是这会有一个弊端,就是当你的服务器宕机重启后,此时数据读取还是从头开始,这显然不是我们想看到的! 在flume1.7没有出来之前我们一般的解决思路为:当读取一条记录后,就把当前的记录的行号记录到一个文件中,宕机重启时,我们...
2019-11-25 08:57:55 353
原创 CAP理论
#CAP理论 主要描述的是任何分布式系统中最多只能同时满足以下三点中的两点 Consistency(一致性):数据一致更新,所有数据变动都是同步的,强调数据的正确性 数据同步成功是一致性最根本表现 数据同步不成功,用户访问同步失败的副本节点时不返回数据或者返回错误信息也是一致性 Availability(可用性):良好的响应性能,尽量保证正常工作,不轻易报错。 Partition tole...
2019-09-28 13:48:17 129
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人