自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Everything should be made as simple as possible, but no simpler

  • 博客(3)
  • 资源 (6)
  • 收藏
  • 关注

原创 结合Scribe/RabbitMQ/pika实现为Hive动态添加partition元数据

现有架构中通过Scribe直接向HDFS中写入数据,大部分的对数据的操作都是通过Hive来进行的,所以需要在数据进入HDFS之后就能通过Hive来访问到具体的数据,这就需要以数据驱动来添加元数据。以前使用的方式是通过按照固定的时间间隔来执行一个并行批量添加元数据的Java程序,不过那样做可能会漏掉一些没有过来的partition的添加,为此我们还必须在第二天再一次执行,确保所有的数据都被映射到了H

2013-04-25 11:15:41 1925 2

原创 一种计算留存的思路

在一些统计系统中,为了观察用户的粘度,我们会计算一系列的叫做留存的指标——次日注册留存、2日注册留存...N日注册留存,比如昨天注册了1000名用户中,在今天有300名用户又登录了,那么对应于昨天的注册留存就是30%;如果再去细究,还可以去计算活跃用户的留存情况,比如昨天登录的1000名用户中,在今天,其中的100名用户又活跃了,那么对应于昨天的活跃次日留存就是10%。如果更细究下去的话,还可以去

2013-04-13 18:06:27 4437

原创 CentOS 6 64bit下,Python数据分析环境搭建

首先是基础环境安装: wget http://download.zeromq.org/zeromq-3.2.2.tar.gz tar xvzf zeromq-3.2.2.tar.gz cd zeromq-3.2.2 ./configure && make && make install yum install gcc-gfortran yum install freetype-devel yu

2013-04-11 09:58:25 5071 3

ASGI 3.0规范中文版.pdf

ASGI规范 3.0;主要用于ASGI服务器的设计和开发提供基础协议规范,具体服务器实现有Django Daphne/Uvcorn这两个代表;现在Django 3 也直接集成了异步功能。

2019-12-20

Serious Python中文版.docx

Serious Python中文版(无关系数据库一章),希望对需要的同学有帮助。

2019-07-09

设计模式 书籍 程序设计

设计模式的经典巨著 参与写作的都是些牛人 哈

2009-03-13

Erlang programing

Erlang Programing Joe Armstrong

2008-11-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除