关闭

redis一致性哈希算法

一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法,设计目标是为了解决因特网中的热点(Hot spot)问题,初衷和CARP十分类似。一致性哈希修正了CARP使用的简 单哈希算法带来的问题,使得分布式哈希(DHT)可以在P2P环境中真正得到应用。      一致性hash算法提出了在动态变化的Cache环境中,判定哈希算法好坏的四个定义: 1、平衡性(B...
阅读(42) 评论(0)

python slice array

python数组切片分着正序和倒序 a=[1,2,3,4,5,6,7,8] 翻转数组的另一种方式:a[::-1] 逆序slice ,start step must be bigger than end step for example you can use a[7:3:-1] to print out the slice array,but you can not use it for ...
阅读(445) 评论(0)

quick select算法

本文的主角.quick select算法.其实就类似于快排.不同地方在于quick select每趟只需要往一个方向走. 时间复杂度:O(n). def qselect(A,k): if len(A)<=k:return A pivot = A[-1] right = [pivot] + [x for x in A...
阅读(329) 评论(0)

awk删除文件的某一列

cat file |awk ' { $5=null;print $0 }'...
阅读(2531) 评论(0)

分类器的性能评估

本文转载于http://funhacks.net/2015/08/12/classifier-evaluation/ 感谢原作者的分享 1. 背景 当我们使用一个分类器进行预测时,我们会遇到一个很重要的问题:如何评价这个分类器的预测效果?这里我构造一个场景作为例子来说明。 现在有10个人,其中1个人有感冒症状,9个人没有感冒症状。现在让医生进行诊断,判断哪些人有感冒,哪...
阅读(1957) 评论(0)

HBase优化实战

背景 Datastream一直以来在使用HBase分流日志,每天的数据量很大,日均大概在80亿条,10TB的数据。对于像Datastream这种数据量巨大、对写入要求非常高,并且没有复杂查询需求的日志系统来说,选用HBase作为其数据存储平台,无疑是一个非常不错的选择。 HBase是一个相对较复杂的分布式系统,并发写入的性能非常高。然而,分布式系统从结构上来讲,也相对较复杂,模块繁多,...
阅读(769) 评论(0)

机器学习中的数学(1)-回归(regression)、梯度下降(gradient descent)

版权声明:    本文由LeftNotEasy所有,发布于http://leftnoteasy.cnblogs.com。如果转载,请注明出处,在未经作者同意下将本文用于商业用途,将追究其法律责任。 前言:    上次写过一篇关于贝叶斯概率论的数学,最近时间比较紧,coding的任务比较重,不过还是抽空看了一些机器学习的书和视频,其中很推荐两个:一个是stanford的machin...
阅读(343) 评论(0)

Best Practices for YARN Resource Management

In this blog post, I will discuss best practices for YARN resource management. The fundamental idea of MRv2(YARN) is to split up the two major functionalities—resource management and job scheduling/mo...
阅读(491) 评论(0)

Yarn下的YarnChild启动个数决定参数

Yarn下的mapper和reducer并发执行个数有什么决定的呢? 由调度的资源决定的,也就是说启动的YarnChild个数多少取决于资源的分配和free的资源量 参数说明: conf/yarn-site.xml yarn.nodemanager.resource.memory-mb NodeManager总的可用物理内存,默认值是8192MB,一般情况下不要修改 yarn.node...
阅读(1167) 评论(0)

ftp命令

一、vsftp安装篇 复制代码代码如下: # 安装vsftpd yum -y install vsftpd # 启动 service vsftpd start # 开启启动 chkconfig vsftpd on 二、vsftp相关命令之服务篇 复制代码代码如下: # 启动ftp服务 service vsftpd start # 查看ft...
阅读(465) 评论(0)

Longest Substring Without Repeating Characters

Given a string, find the length of the longest substring without repeating characters. For example, the longest substring without repeating letters for "abcabcbb" is "abc", which the length is 3. Fo...
阅读(235) 评论(0)

redis持久化

官方文章http://redis.io/topics/persistence redis持久化主要分为两种RDB和AOF       Redis支持2种持久化策略:snapshot方式和commandlog方式,前者通过将当前内存数据快照周期性写入RDB文件来实现;后者通过在log中记录Redis进程收到的写操作来实现,下次Redis重启时,回放commandlog来恢复数据状态。 ...
阅读(242) 评论(0)

Eclipse下安装Scala插件

scala版本为2.10.4 http://scala-ide.org/download/prev-stable.html Eclipse 3.8-4.3 (Juno and Kepler) For Scala 2.11.2 Install New Software', and paste this URL into the dialog box. Then,...
阅读(11934) 评论(0)

Generics are not supported at this language level

选择File---->Project Structure  修改Project language level为7...
阅读(4013) 评论(1)

Two Sum

Given an array of integers, find two numbers such that they add up to a specific target number. The function twoSum should return indices of the two numbers such that they add up to the target, whe...
阅读(217) 评论(0)
166条 共12页1 2 3 4 5 ... 下一页 尾页
    个人资料
    • 访问:153413次
    • 积分:2291
    • 等级:
    • 排名:第17473名
    • 原创:65篇
    • 转载:101篇
    • 译文:0篇
    • 评论:8条
    文章分类
    最新评论