2013年04月_tinyid_CSDN博客

自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

Everything should be made as simple as possible, but no simpler

11月 10月 08月 07月 06月 05月 04月 03月 02月 01月

原创结合Scribe/RabbitMQ/pika实现为Hive动态添加partition元数据

现有架构中通过Scribe直接向HDFS中写入数据，大部分的对数据的操作都是通过Hive来进行的，所以需要在数据进入HDFS之后就能通过Hive来访问到具体的数据，这就需要以数据驱动来添加元数据。以前使用的方式是通过按照固定的时间间隔来执行一个并行批量添加元数据的Java程序，不过那样做可能会漏掉一些没有过来的partition的添加，为此我们还必须在第二天再一次执行，确保所有的数据都被映射到了H

2013-04-25 11:15:41 1925 2

原创一种计算留存的思路

在一些统计系统中，为了观察用户的粘度，我们会计算一系列的叫做留存的指标——次日注册留存、2日注册留存...N日注册留存，比如昨天注册了1000名用户中，在今天有300名用户又登录了，那么对应于昨天的注册留存就是30%；如果再去细究，还可以去计算活跃用户的留存情况，比如昨天登录的1000名用户中，在今天，其中的100名用户又活跃了，那么对应于昨天的活跃次日留存就是10%。如果更细究下去的话，还可以去

2013-04-13 18:06:27 4437

原创 CentOS 6 64bit下，Python数据分析环境搭建

首先是基础环境安装： wget http://download.zeromq.org/zeromq-3.2.2.tar.gz tar xvzf zeromq-3.2.2.tar.gz cd zeromq-3.2.2 ./configure && make && make install yum install gcc-gfortran yum install freetype-devel yu

2013-04-11 09:58:25 5071 3

ASGI 3.0规范中文版.pdf

ASGI规范 3.0；主要用于ASGI服务器的设计和开发提供基础协议规范，具体服务器实现有Django Daphne/Uvcorn这两个代表；现在Django 3 也直接集成了异步功能。

2019-12-20

Serious Python中文版.docx

Serious Python中文版（无关系数据库一章），希望对需要的同学有帮助。

2019-07-09

设计模式书籍程序设计

设计模式的经典巨著参与写作的都是些牛人哈

2009-03-13

Erlang programing

Erlang Programing Joe Armstrong

2008-11-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

tinyid CSDN认证博客专家 CSDN认证企业博客

码龄17年

IP 属地：北京市

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

112: 原创

4万+: 周排名

52万+: 总排名

129万+: 访问

: 等级

9279: 积分

359: 粉丝

264: 获赞

201: 评论

365: 收藏

私信

关注

热门文章

分类专栏

最新评论

理解Celery的worker
北风之神c: 总结的很全面，写得赞，博主用心了。 celery对目录层级文件名称格式要求太高，只适合规划新的项目，对不规则文件夹套用难度高。所以新手使用celery很仔细的建立文件夹名字、文件夹层级、python文件名字。所以网上的celery博客教程虽然很多，但是并不能学会使用，因为要运行起来需要以下6个方面都掌握好，博客文字很难表达清楚或者没有写全面以下6个方面。 celery消费任务不执行或者报错NotRegistered，与很多方面有关系，如果要别人排错，至少要发以下6方面的截图，因为与一下6点关系很大。 1)整个项目目录结构, 2）@task入参 ,3）celery的配置，4）celery的配置 include ,5）cmd命令行启动参数 --queues= 的值,6）用户在启动cmd命令行时候，用户所在的文件夹。在不规范的文件夹路径下，使用celery难度很高，一般教程都没教。 [项目文件夹目录格式不规范下的celery使用演示](https://github.com/ydf0509/celery_demo) 。此国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/zh-cn/latest/articles/c1.html ，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等20个方面全方位超过celery。发布性能提高1000%，消费性能提高2000%。 python万能分布式函数调度框架funboost支持python所有类型的并发模式和一切知名消息队列中间件，python函数加速器，只需要一行代码调度任意函数，框架包罗万象,万能编程功能宝典，一统编程思维，与业务不绑定，适用范围广。 pip install funboost
利用virtualenv在Hadoop Streaming中使用完全个性化的Python解释器
我寄了张卡片: 请问下为什么虚拟环境是python2.7的怎么样生成一个Python3的虚拟环境呢？
备忘：Ngnix配置下载目录并限制并发数量与下载带宽的方法
linch64: 这种限制是针对连接的并发数, 以及限制单个连接的带宽. 有没有那种能限制总带宽, 但不限制连接数的呢?
有了HTTP/2，Websocket还有市场吗？
weixin_42279939: 总结的非常好。能对一个经典又有历史的老协议赋予新生，好处是全方位的
有了HTTP/2，Websocket还有市场吗？
weixin_42279939: 总结的非常好。能对一个经典又有历史的老协议赋予新生，好处是全方位的

最新文章

提示

确定要删除当前文章？

取消删除