4 - Engineering
文章平均质量分 57
汐雪池间
计算机科学与技术 -> 数据科学与工程 -> 大数据工程师
展开
-
数据库系统:持久性的技术基础
持久性在数据库中具体是如何实现的呢?原创 2019-11-27 17:40:54 · 1613 阅读 · 0 评论 -
分布式系统与 Google 早期的三篇论文
相信许多对大数据感兴趣的人都听说过 Google 在十年前发表的三项重要成果: Google File System、 MapReduce 和 Bigtable 。Google 在这些成果中,介绍了其利用通用计算设备成功搭建分布式集群的方法。其中的诸多设计思想,在后来被广泛采用。为什么要设计这些系统?这些系统都有什么用处?这些系统在实现上有哪些特点?对后来的系统设计有哪些启发意义?本文通过提出并回答一系列问题,介绍目前流行的大数据技术的核心设计理念和技术实现。原创 2019-11-10 21:59:48 · 1754 阅读 · 2 评论 -
DataX 运行时加载自定义 transformer 插件
如何让 DataX 运行时加载自定义 transformer 插件早该知道的一种更高级的 transformer 自定义方法。前言之前的文章有介绍过通过自定义 transformer 在 DataX 上实现 ETL(Extract Transform Load) 过程中定制化的数据处理,当时的实现方法是自定义插件并手写代码注册到com/alibaba/datax/core/transport...原创 2019-03-28 21:07:55 · 7636 阅读 · 6 评论 -
DataX自定义transformer编写指南
DataX自定义transformer编写指南用于数据加密jave开发环境 maven Python 2.*概述DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、DRDS 等各种异...原创 2018-04-13 19:54:52 · 8343 阅读 · 0 评论 -
【技术调研报告】DataX 离线异构数据同步框架
DataX 数据脱敏平台开发与实验 中国大陆 谨慎参考 单机 并发 DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute(ODPS)、DRDS 等各种异构数据源之间高效的数据同步功能。以星型结构进行数据传输。...原创 2018-04-10 22:47:48 · 890 阅读 · 0 评论 -
MySQL的count查询超级慢?我是这么解决的
你可能需要给 Primary Key 加上 Uniqle 约束了问题描述数据表结构: Field Type Null Key Default Extra id int(10) unsigned NO PRI NULL auto_increment mid varchar(50) NO UNI ...原创 2018-03-23 21:55:47 · 61826 阅读 · 6 评论 -
解决:Windows 上 Python2 和 Python3 共存——无痛迁徙
解决:Windows 上 Python2和Python3共存关键是 windows 环境变量的设置,我这里用了一种很粗糙的方法,有兴趣的人可以写个设置环境变量的脚本。原创 2017-04-27 15:32:31 · 433 阅读 · 0 评论 -
解决:远程服务器(阿里云 VHost)和本地文件传输 windows
解决:远程服务器(阿里云)和本地文件传输服务器:linux(centos7) 本地:Windows 10方案一:Use SSH Secure Shell ClientSuccess!下载 SSH/SFTP Secure Shell 3.2.9填写端口号和 host ,直接用登陆服务器的账户登录就好。 作者按: 虽然软件看起来不时尚,不过用着舒服、解决问题! ...原创 2017-03-28 17:02:04 · 3464 阅读 · 0 评论 -
Multithread download tool for massive tiny files.
""" Multithread download tool for massive tiny files."""原创 2017-03-16 17:53:33 · 552 阅读 · 0 评论 -
解决:linux 下关闭连接后保持程序执行
需求描述:我想让 aria2 在我关闭 ssh 连接后继续下载。方法一:nohup {{ aria2 下载命令}} &方法二:screnn 工具方法三:jobs 查看后台作业编号bg %1disown %原创 2017-04-13 10:44:27 · 1076 阅读 · 0 评论 -
Scripts to manage files
Here are several Scripts to manage files in python.原创 2017-03-31 16:29:12 · 366 阅读 · 0 评论 -
解决: 利用 Xware 在 centos 上搭建远程下载器
利用 Xware 在 centos 上搭建远程下载器Xware——迅雷提供的远程下载工具第一步:在 centos 服务器上搭建 Xware 环境这点网上已经有不少博客可以参考,所以我这里主要对自己的需求解决进行记录。步骤: 1. 下载 Xware1.0.1 (或其他版本) 解压并放到服务器上,修改 Xware 文件权限 chmod 777挂载下载目录执行lib子目录下的EmbedThunde原创 2017-03-31 13:46:26 · 2433 阅读 · 0 评论