关闭

Linux 软件安装到 /usr,/usr/local/ 还是 /opt 目录?

Linux 的软件安装目录是也是有讲究的,理解这一点,在对系统管理是有益的 /usr:系统级的目录,可以理解为C:/Windows/,/usr/lib理解为C:/Windows/System32。 /usr/local:用户级的程序目录,可以理解为C:/Progrem Files/。用户自己编译的软件默认会安装到这个目录下。 /opt:用户级的程序目录,可以理解为D:/Softwar...
阅读(39) 评论(0)

递归算法

程序调用自身的编程技巧称为递归( recursion)。递归做为一种算法在程序设计语言中广泛应用。递归有直接递归和间接递归 •直接递归:函数在执行过程中调用本身。 •间接递归:函数在执行过程中调用其它函数再经过这些函数调用本身。 •表达方式: •递归算法有四个特性: (1)必须有可最终达到的终止条件,否则程序将陷入无穷循环; (2)子问题在规模上比原问题小,或更...
阅读(52) 评论(0)

7种回归分析方法

什么是回归分析? 回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。例如,司机的鲁莽驾驶与道路交通事故数量之间的关系,最好的研究方法就是回归。 回归分析是建模和分析数据的重要工具。在这里,我们使用曲线/线来拟合这些数据点,在这种方式下,从曲线或线到数据点的距离差异最小。我会在接下来的部...
阅读(22) 评论(0)

概率分析和随机算法

一、随机分析 考虑一个雇佣问题,面试n个人,在面试的过程中,只要更为优秀的人出现,就雇佣更为优秀的人,但是更换人选需要花费一笔费用c,现在估算这笔费用。 这个问题相当于维护一个当前的“获胜者”。 最坏的情形当然是替换n次,那么费用就会是cn. 随机的情况: 第i个人比前i-1个人更为优秀的概率为1/i,那么期望E[X] = 1/1 +1/2 +1/3 + …… = ln n + ...
阅读(29) 评论(0)

红黑树java实现

概要 前面分别介绍红黑树的理论知识、红黑树的C语言和C++的实现。本章介绍红黑树的Java实现,若读者对红黑树的理论知识不熟悉,建立先学习红黑树的理论知识,再来学习本章。还是那句老话,红黑树的C/C++/Java实现,原理一样,择其一了解即可。 目录 1. 红黑树的介绍 2. 红黑树的Java实现(代码说明) 3. 红黑树的Java实现(完整源码) 4. 红黑树的Jav...
阅读(69) 评论(0)

Django使用自己的用户系统

用过django的人应该都会知道admin,不过,需求是多变的,比如,你有一个变态的用户系统,用户可能有大中小三张头像,除了fisrt name ,last name外还有middle name,T^T name巴拉巴拉,django 的用户系统可能满足不了你的需求,这时候需要用自己的用户系统了,如何能在满足需求的时候充分又利用到django的用户系统? django使用自己的用户系统 ste...
阅读(47) 评论(0)

Centos系统下的文件目录说明

目录内容和用途 /根目录。一般不含任何文件,除了可能的标准的系统引导映象,通常叫/vmlinuz 。所有其他文件在根文件系统的子目录中。 /bin 一般用户使用的命令 /boot 放置内核及LILO、GRUB等导引程序(bootloader)的文件,用于启动。 /dev 硬盘,分区,键盘,鼠标,USB,tty等所有的设备文件都放在这个目录。 /etc 系统的所有配置文件都存放在此目录中。...
阅读(62) 评论(0)

Apache Maven 构建生命周期

Maven - 构建生命周期 什么是构建生命周期 构建生命周期是一组阶段的序列(sequence of phases),每个阶段定义了目标被执行的顺序。这里的阶段是生命周期的一部分。 举例说明,一个典型的 Maven 构建生命周期是由以下几个阶段的序列组成的: 阶段 处理 描述 prepare-resources 资源拷贝 本阶段可以自定义需要拷贝的资...
阅读(33) 评论(0)

python关键字

python3.3.2中的关键字如下: The following identifiers are used as reserved words, or keywords of the language, and cannot be used as ordinary identifiers. They must be spelled exactly as written here: F...
阅读(59) 评论(0)

JVM运行时数据区域及GC

JVM在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区域。这些区域都有各自的用途、创建和销毁的时间。本文以Sun公司HotSpot虚拟机为例进行说明,JRockit和IBM J9会有所不同。HotSpot运行时数据区分为堆和栈两种类型,堆空间为线程共享,栈空间为线程私有。堆空间又分为方法区和堆,栈细分为虚拟机栈、本地方法栈和程序计数器,但HotSpot栈的实现将本地方法栈中...
阅读(58) 评论(0)

计算机网络--HTTP协议

Fiddler介绍 Fiddler是一个http协议调试代理工具,它能够记录并检查所有你的电脑和互联网之间的http通讯,设置断点,查看所有的“进出”Fiddler的数据(指cookie,html,js,css等文件,这些都可以让你胡乱修改的意思)。 Fiddler 要比其他的网络调试器要更加简单,因为它不仅仅暴露http通讯还提供了一个用户友好的格式。 Fiddler显示IP Fiddle...
阅读(76) 评论(0)

通信协议——Http、TCP、UDP

CP   HTTP   UDP:  都是通信协议,也就是通信时所遵守的规则,只有双方按照这个规则“说话”,对方才能理解或为之服务。 TCP   HTTP   UDP三者的关系: TCP/IP是个协议组,可分为四个层次:网络接口层、网络层、传输层和应用层。 在网络层有IP协议、ICMP协议、ARP协议、RARP协议和BOOTP协议。 在传输层中有TCP协议与UDP协议。 在应用层有FTP...
阅读(16) 评论(0)

TopN算法

在系统中,我们经常会遇到这样的需求:将大量(比如几十万、甚至上百万)的对象进行排序,然后只需要取出最Top的前N名作为排行榜的数据,这即是一个TopN算法。常见的解决方案有三种: (1)直接使用List的Sort方法进行处理。 (2)使用排序二叉树进行排序,然后取出前N名。 (3)使用最大堆排序,然后取出前N名。       第一种方案的性能是最差的,后两种方案性能会好一些,但是还是不能满...
阅读(25) 评论(0)

Spark RDD

这篇文章想从Spark当初设计时为何提出RDD概念,相对于Hadoop,RDD真的能给spark带来何等优势。之前本想开篇是想总体介绍spark,以及环境搭建过程,但个人感觉RDD更为重要 铺垫 在hadoop中一个独立的计算,例如在一个迭代过程中,除可复制的文件系统(HDFS)外没有提供其他存储的概念,这就导致在网络上进行数据复制而增加了大量的消耗,而对于两个的MapReduce作业...
阅读(266) 评论(1)

SparkContext简介

本篇文章就要根据源码分析SparkContext所做的一些事情,用过Spark的开发者都知道SparkContext是编写Spark程序用到的第一个类,足以说明SparkContext的重要性;这里先摘抄SparkContext源码注释来 简单介绍介绍SparkContext,注释的第一句话就是说SparkContext为Spark的主要入口点,简明扼要,如把Spark集群当作服务端那Spark...
阅读(81) 评论(0)
42条 共3页1 2 3 下一页 尾页
    个人资料
    • 访问:26000次
    • 积分:1393
    • 等级:
    • 排名:千里之外
    • 原创:114篇
    • 转载:14篇
    • 译文:1篇
    • 评论:1条
    最新评论
  • Spark RDD

    testcs_dn: 把一个超大的数据集,切分成N个小堆,Hadoop大文件并行处理不是这样做的吗?