- 博客(30)
- 收藏
- 关注
转载 决策树 C&RT、CHAID、QUEST、C5.0的区别
决策树(Decisiontree)一般都是自上而下的来生成的。每个决策或事件(即自然状态)都可能引出两个或多个事件,导致不同的结果,把这种决策分支画成图形很像一棵树的枝干,故称决策树。优点: 1) 可以生成可以理解的规则; 2) 计算量相对来说不是很大; 3) 可以处理连续和种类字段; 4) 决策树可以清晰的显示哪些字段比较重要。缺点: 1)
2013-07-05 16:02:15 1596
转载 sqoop 导入oracle 报错 Imported Failed : Attempted to generate class with no columns问题解决办法
Imported Failed : Attempted to generate class with no columns 错误 解决办法 ./sqoop import --connect jdbc:oracle:thin:@ip:端口:sid --username 此处用户名大写 --password=*** --table TABLE --hive-import
2013-01-15 17:29:37 712
转载 应该知道的Linux技巧
这篇文章来源于Quroa的一个问答《What are some time-saving tips that every Linux user should know?》—— Linux用户有哪些应该知道的提高效率的技巧。我觉得挺好的,总结得比较好,把其转过来,并加了一些自己的理解。 首先,我想告诉大家,在Unix/Linux下,最有效率技巧的不是操作图形界面,而是命令行操作,因为命令行意味着自
2013-01-11 13:59:50 314
转载 myeclipse eclipse 不要验证 加速 优化
按照下述步骤来加速Eclipse为超快的IDE,它适用于32和64位版本的Eclipse /JDK(OS为64位Windows 7)。1.禁用防病毒软件,或将JDK、Eclipse、workspace及其它相关文件夹加入防病毒软件的白名单。2. Eclipse启动时禁用不必要的验证。验证:在Eclipse菜单 Windows - > Preferences -> Val
2013-01-09 11:12:24 343
转载 三个实例演示 Java Thread Dump 日志分析
jstack Dump 日志文件中的线程状态dump 文件里,值得关注的线程状态有:死锁,Deadlock(重点关注) 执行中,Runnable 等待资源,Waiting on condition(重点关注) 等待获取监视器,Waiting on monitor entry(重点关注)暂停,Suspended对象等待中,Object.wa
2013-01-07 23:26:43 399
转载 Java GC, HotSpot's CMS promotion buffers
Recently, I have unfairly blamed promotion local allocation buffers (PLAB) for fragmentation of old space using concurrent mark sweep garbage collector. I was very wrong. In this article, I'm going
2012-12-31 15:45:45 1932
转载 大数据计算:如何仅用1.5KB内存为十亿对象计数
摘要:AddThis的数据分析副总监Matt Abrams在High Scalability上发表了一篇文章,介绍了他们公司如何应对大数据。Matt Abrams表示,AddThis仅仅用了1.5KB内存的内存就计算了十亿个不同的对象,这与他们所使用的计算方法分不开的。AddThis(前身为Clearspring)的数据分析副总监Matt Abrams在High Scalabili
2012-12-25 14:41:59 585
转载 一些链接
Java 多线程在交易中间件测试中的应用:http://www.ibm.com/developerworks/cn/java/j-lo-multithreadtesting/index.html?ca=drs解析 Java 类和对象的初始化过程:http://www.ibm.com/developerworks/cn/java/j-lo-clobj-init/index.html推荐一
2012-12-19 10:37:00 344
转载 The Small Files Problem
Small files are a big problem in Hadoop — or, at least, they are if the number of questions on the user list on this topicis anything to go by. In this post I’ll look at the problem, and examine som
2012-12-18 12:42:04 342
转载 A Programmer's Guide to Data Mining
WelcomeA guide to practical data mining, collective intelligence, and building recommendation systems by Ron ZacharskiBefore you is a tool for learning basic data mining techniques. Mo
2012-12-17 14:28:39 921
转载 Java编程最差实践
每天在写Java程序, 其实里面有一些细节大家可能没怎么注意, 这不, 有人总结了一个我们编程中常见的问题. 虽然一般没有什么大问题, 但是最好别这样做. 另外这里提到的很多问题其实可以通过Findbugs(http://findbugs.sourceforge.net/ )来帮我们进行检查出来. 字符串连接误用 错误的写法: Java代码 String
2012-12-17 12:33:57 514
转载 Singleton pattern
单例模式的最佳实现:public class Singleton { // Private constructor prevents instantiation from other classes private Singleton() { } /** * SingletonHolder is loaded on
2012-12-14 22:10:01 685
转载 PostgreSQL的数据存储
【一】1 存储层概述【二】2 数据缓冲区和数据存储层之间的接口 2.1 存储访问接口层 【三】2.2 良好的接口层抽象【四】3 虚拟文件管理【五】4 数据存储 4.1 数据的外存形式 4.1.1 外存文件样式 【六】4.1.2 “relation”如何与外部文件对应 【七】4.
2012-12-14 10:10:01 434
转载 Top 10 Java Performance Troubleshooting Tool
Here are 10 tools useful for Java application performance troubleshooting.jconsole comes together with JDK 1.5 and above. It is a Java Monitoring and Management Console - JMX-compliant graphic
2012-12-13 14:34:45 530
转载 JVM调优总结(十一)-反思
垃圾回收的悖论 所谓“成也萧何败萧何”。Java的垃圾回收确实带来了很多好处,为开发带来了便利。但是在一些高性能、高并发的情况下,垃圾回收确成为了制约Java应用的瓶颈。目前JDK的垃圾回收算法,始终无法解决垃圾回收时的暂停问题,因为这个暂停严重影响了程序的相应时间,造成拥塞或堆积。这也是后续JDK增加G1算法的一个重要原因。 当然,上面是从技术角度出发解决垃圾回收带来
2012-12-13 14:02:19 261
转载 JVM调优总结(十)-调优方法
JVM调优工具Jconsole,jProfile,VisualVMJconsole : jdk自带,功能简单,但是可以在系统有一定负荷的情况下使用。对垃圾回收算法有很详细的跟踪。详细说明参考这里 JProfiler:商业软件,需要付费。功能强大。详细说明参考这里 VisualVM:JDK自带,功能强大,与JProfiler类似。推荐。
2012-12-13 14:01:54 308
转载 JVM调优总结(九)-新一代的垃圾回收算法
垃圾回收的瓶颈 传统分代垃圾回收方式,已经在一定程度上把垃圾回收给应用带来的负担降到了最小,把应用的吞吐量推到了一个极限。但是他无法解决的一个问题,就是Full GC所带来的应用暂停。在一些对实时性要求很高的应用场景下,GC暂停所带来的请求堆积和请求失败是无法接受的。这类应用可能要求请求的返回时间在几百甚至几十毫秒以内,如果分代垃圾回收方式要达到这个指标,只能把最大堆的设置限制在一个
2012-12-13 14:01:21 268
转载 JVM调优总结(八)-典型配置举例2
常见配置汇总 堆设置 -Xms:初始堆大小 -Xmx:最大堆大小 -XX:NewSize=n:设置年轻代大小 -XX:NewRatio=n:设置年轻代和年老代的比值。如:为3,表示年轻代与年老代比值为1:3,年轻代占整个年轻代年老代和的1/4 -XX:SurvivorRatio=n:年轻代中Eden区与两个Survivor区的比值。
2012-12-13 14:00:49 249
转载 JVM调优总结(七)-典型配置举例1
以下配置主要针对分代垃圾回收算法而言。 堆大小设置年轻代的设置很关键JVM中最大堆大小有三方面限制:相关操作系统的数据模型(32-bt还是64-bit)限制;系统的可用虚拟内存限制;系统的可用物理内存限制。32位系统下,一般限制在1.5G~2G;64为操作系统对内存无限制。在Windows Server 2003 系统,3.5G物理内存,JDK5.0下测试,最大可设
2012-12-13 13:56:35 245
转载 JVM调优总结(六)-分代垃圾回收详述2
分代垃圾回收流程示意 选择合适的垃圾收集算法串行收集器 用单线程处理所有垃圾回收工作,因为无需多线程交互,所以效率比较高。但是,也无法使用多处理器的优势,所以此收集器适合单处理器机器。当然,此收集器也可以用在小数据量(100M左右)情况下的多处理器机器上。可以使用-XX:+UseSerialGC打开。
2012-12-13 13:54:42 289
转载 JVM调优总结(五)-分代垃圾回收详述1
为什么要分代 分代的垃圾回收策略,是基于这样一个事实:不同的对象的生命周期是不一样的。因此,不同生命周期的对象可以采取不同的收集方式,以便提高回收效率。 在Java程序运行的过程中,会产生大量的对象,其中有些对象是与业务信息相关,比如Http请求中的Session对象、线程、Socket连接,这类对象跟业务直接挂钩,因此生命周期比较长。但是还有一些对象,主要是
2012-12-13 13:53:46 382
转载 JVM调优总结(四)-垃圾回收面临的问题
如何区分垃圾 上面说到的“引用计数”法,通过统计控制生成对象和删除对象时的引用数来判断。垃圾回收程序收集计数为0的对象即可。但是这种方法无法解决循环引用。所以,后来实现的垃圾判断算法中,都是从程序运行的根节点出发,遍历整个对象引用,查找存活的对象。那么在这种方式的实现中,垃圾回收从哪儿开始的呢?即,从哪儿开始查找哪些对象是正在被当前系统使用的。上面分析的堆和栈的区别,其中栈
2012-12-13 13:53:01 250
转载 JVM调优总结(三)-基本垃圾回收算法
可以从不同的的角度去划分垃圾回收算法:按照基本回收策略分引用计数(Reference Counting):比较古老的回收算法。原理是此对象有一个引用,即增加一个计数,删除一个引用则减少一个计数。垃圾回收时,只用收集计数为0的对象。此算法最致命的是无法处理循环引用的问题。 标记-清除(Mark-Sweep): 此算法执行分两阶
2012-12-13 13:52:15 258
转载 JVM调优总结(二)-一些概念
Java对象的大小 基本数据的类型的大小是固定的,这里就不多说了。对于非基本类型的Java对象,其大小就值得商榷。 在Java中,一个空Object对象的大小是8byte,这个大小只是保存堆中一个没有任何属性的对象的大小。看下面语句:Object ob = new Object(); 这样在程序中完成了一个Java对象的生命,但是它所占的空
2012-12-13 13:50:42 254
转载 JVM调优总结(一)-- 一些概念
数据类型 Java虚拟机中,数据类型可以分为两类:基本类型和引用类型。基本类型的变量保存原始值,即:他代表的值就是数值本身;而引用类型的变量保存引用值。“引用值”代表了某个对象的引用,而不是对象本身,对象本身存放在这个引用值所表示的地址的位置。基本类型包括:byte,short,int,long,char,float,double,Boolean,returnAddress
2012-12-13 13:49:55 320
转载 Squid 基本配置
1、编译安装: 从squid 网站下载,http://www.squid-cache.org/Versions/ 解压缩:tar -zxvf squid-3.2.1.tar.gz 进入解压后目录:cd squid-3.2.1********************************************************* 参
2012-12-11 16:07:23 1018
转载 深入理解JVM内幕:从基本结构到Java 7新特性
每个Java开发者都知道Java字节码是执行在JRE(Java Runtime Environment Java运行时环境)上的。JRE中最重要的部分是Java虚拟机(JVM),JVM负责分析和执行Java字节码。Java开发人员并不需要去关心JVM是如何运行的。在没有深入理解JVM的情况下,许多开发者已经开发出了非常多的优秀的应用以及Java类库。不过,如果你了解JVM的话,你会更加了解Java
2012-12-11 15:27:03 403
转载 How to Monitor Java Garbage Collection
This is the second article in the series of "Become a Java GC Expert". In the first issue Understanding Java Garbage Collection we have learned about the processes for different GC algorithms, about
2012-12-10 13:51:46 416
转载 How to Analyze Java Thread Dumps
When there is an obstacle, or when a Java based Web application is running much slower than expected, we need to use thread dumps. If thread dumps feel like very complicated to you, this article may h
2012-12-10 13:47:27 1021
转载 Understanding JVM Internals, from Basic Structure to Java SE 7 Features
Every developer who uses Java knows that Java bytecode runs in a JRE (Java Runtime Environment). The most important element of the JRE is Java Virtual Machine (JVM), which analyzes and executes Java
2012-12-10 13:37:55 962
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人