自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 分布式调度系统的比较

一些调度系统的比较

2020-09-08 22:29:47 8335 1

原创 Nginx+WSGI生产环境static文件解决

网上很多参考写的都是开发环境的配置,原理就是给static文件添加一个static的url映射,这在用python manage.py runserver 0:8000的时候(开发环境)是由django框架自动完成的,换到uwsgi后(生产环境)他们就手动加上去了这个url映射,但是django的文档上说了这可能是不安全的。

2020-09-08 22:18:00 1036

原创 python cheat sheet

__slots__=(),限制可动态绑定的属性。def __str__(self),print的打印方式。def __iter__(self),def next(self),循环调用iter返回迭代对象(可迭代对象iterable与迭代器对象iterator)的next()方法,使类具有类似list/tuple的迭代功能。yield将函数对象变为生成器generator。with语法糖,对象必须有一个enter(),

2017-06-27 13:56:41 1369

原创 小抄:UDTF&UDAF示例

UDAF对应一行输入,forward多行输出 UDTF对应统计量的计算与统计信息的逻辑处理,返回一条结果UDAF,UDTF小抄

2017-03-01 16:39:11 661

原创 ODPS Tunnel download

Tunnel download多线程下载tunnel download -threads 查看并修改POLICY策略组 编写policy的json文件 修改策略组 set ProjectProtection=true with限制下载行数 Tunnel download -limit下载行、列分隔符 tunnel download -rd -fd指定表中时间所属时区tunnel download -tz

2017-02-28 16:47:46 3965

原创 ODPS之Tunnel上传下载

上传目录 Tunnel help upload查看上传命令参数设置 tunnel help upload; tunnel upload -threads; tunnel upload -dbr -mbr; tunnel upload -s; tunnel upload -rd -fd; tunnel upload -ni; tunnel upload -tz;

2017-02-28 01:53:51 10446 1

原创 阿里ODPS架构与SQL过程

阿里ODPS架构分为1.客户端、2.接入层、3.逻辑层、4.存储|计算层。本文声情并茂(滑稽)的介绍一下各层功能架构。大家可以脑补YARN+HBase+hive或其他大数据产品,希望对大家有所帮助,如有勘误望不吝赐教。

2017-02-26 17:42:00 7732

原创 罗马尼亚度假问题和N皇后问题

罗马利亚度假问题和N皇后问题及其主体代码

2016-11-11 12:03:45 4830

原创 PCA主成分分析与SVG隐语义

PCA与SVG

2016-11-10 22:01:39 491

原创 分类算法:ID3与C4.5及CART

原理ID3算法的介绍网上有很多,它是通过选择能获得最大信息增益的属性来构建决策树。C4.5是通过选择能获得最大信息增益率的属性来构建决策树。CART用于观察值和输出值都是连续的值的情况,它可以通过选择则最优划分点来做分类;也可以通过将最优划分点改成线性函数(使每次划分时,点均匀分布在函数两侧)来做预测。

2016-10-28 13:23:17 1095

原创 MapReduce优化

对Hadoop,MapReduce的优化主要在四个方面

2016-09-30 10:13:51 956

原创 YARN

YARN原理介绍YARN是hadoop2.x增加的资源管理器在hadoop1.x中,JobTracker负责接收taskTracker的heartbeat,得到资源使用,任务运行信息。细点讲的话,jobtracker要将作业分解为task,进行分配并对作业进行监控。与此同时它还要负责资源调度。 因此需要对它进行功能拆分,增强集群的扩展性、可靠性、高效性

2016-09-25 21:59:21 262

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除