淘知道-CSDN博客

转载 linux 命令后台运行

Linux 技巧：让进程在后台可靠运行的几种方法想让进程在断开连接后依然保持运行？如果该进程已经开始运行了该如何补救？如果有大量这类需求如何简化操作？我们经常会碰到这样的问题，用 telnet/ssh 登录了远程的 Linux 服务器，运行了一些耗时较长的任务，结果却由于网络的不稳定导致任务中途失败。如何让命令提交后不受本地关闭终端窗口/网络断开连接

2015-05-21 10:36:03 623

转载进程与线程的代码实现，本质区别

多线程 or 多进程 (转强力推荐)在Unix上编程采用多线程还是多进程的争执由来已久，这种争执最常见到在C/S通讯中服务端并发技术的选型上，比如WEB服务器技术中，Apache是采用多进程的（perfork模式，每客户连接对应一个进程，每进程中只存在唯一一个执行线程）， Java的Web容器Tomcat、Websphere等都是多线程的（每客户连接对应一个线程，所有线程都在一个进程

2015-05-21 10:07:54 2734

原创 java 实现占用特定百分比的CPU资源

使用java实现占用特定数量的CPU 资源，可以通过控制空闲时间和繁忙时间的比例，来控制占用CPU的多少，空闲时间和繁忙时间从命令行输入

2015-05-21 10:00:28 837

原创 Spark框架上DeltaSimRank算法的实现

package main.scalaimport org.apache.spark._import SparkContext._object SparkDeltaSimRank { def main(args: Array[String]) { val iters = 10 val conf = new SparkConf() .s

2015-05-09 18:23:14 1367

原创 Spark上SimRank算法的实现

SimRank算法是对象相似度计算算法，常被应用在推荐系统中，进行产品推荐和好友推荐等，这里给出Spark框架上SimRank算法的实现代码，采用Scala语言实现

2015-05-09 18:18:02 3901

转载 Google云计算核心技术大揭秘

Google云计算核心技术大揭秘发表于2010-06-07 11:01| 来源博客| 作者王丽兵搜索引擎数据结构分布式应用google云计算摘要：本系列是基于公开资料对Google App Engine是如何实现的这个话题进行深度探讨。而且在切入Google App Engine之前，首先会对Google的核心技术和其整体架构进行分析，以帮助大家之后

2015-05-09 18:02:07 720

转载 linux grep命令详解

linux grep命令1.作用Linux系统中grep命令是一种强大的文本搜索工具，它能使用正则表达式搜索文本，并把匹配的行打印出来。grep全称是Global Regular Expression Print，表示全局正则表达式版本，它的使用权限是所有用户。2.格式grep [options]3.主要参数[options]主要参数：－c：只输出匹配行的计数。

2015-05-07 20:27:20 322

转载 shell编程

SHELL编程一、Shell语法1.1、变量声明1.2、数组声明和使用1.3、特殊的变量1.4、运算和运算符1.4.1、整数运算符1.5、流程语句1.5.1、if 语句1.5.2、case语句1.5.3、select 语句1.6、循环语句1.6.1、for语句1.6.2、while 语句1.6.3、breake 和continue1.6.

2015-05-07 20:23:40 297

转载排序算法总结

概述排序有内部排序和外部排序，内部排序是数据记录在内存中进行排序，而外部排序是因排序的数据很大，一次不能容纳全部的排序记录，在排序过程中需要访问外存。我们这里说说八大排序就是内部排序。当n较大，则应采用时间复杂度为O(nlog2n)的排序方法：快速排序、堆排序或归并排序序。快速排序：是目前基于比较的内部排序中被认为是最好的方法，

2015-05-07 20:13:46 347

原创斯坦福网络数据集

http://snap.stanford.edu/data/ 有需要真实网络数据集的，可以在上面的网站上下载

2015-05-07 20:10:06 3597 1

转载十道海量数据处理面试题

第一部分、十道海量数据处理面试题　　1、海量日志数据，提取出某日访问百度次数最多的那个IP。　　此题，在我之前的一篇文章算法里头有所提到，当时给出的方案是：IP的数目还是有限的，最多2^32个，所以可以考虑使用hash将ip直接存入内存，然后进行统计。　　再详细介绍下此方案：首先是这一天，并且是访问百度的日志中的IP取出来，逐个写入到一个大文件中。注意到IP是32位的，最多有个2^32个

2015-05-07 20:03:56 280

原创 shell脚本完成冒泡排序

#!/bin/bash#wang chun leiname=(2 5 1 3 9 7 4)done;for((i=0;i for((j=0;j if [ ${name[((j+1))]} -lt ${name[$j]} ]; then tmp=${name[$j]}; name[$j]=${name[`expr $j +

2015-05-07 17:36:22 1535

转载 shell编程

SHELL编程一、Shell语法1.1、变量声明1.2、数组声明和使用1.3、特殊的变量1.4、运算和运算符1.4.1、整数运算符1.5、流程语句1.5.1、if 语句1.5.2、case语句1.5.3、select 语句1.6、循环语句1.6.1、for语句1.6.2、while 语句1.6.3、breake 和continue1.6.

2015-05-07 17:33:28 277