gdp5211314-CSDN博客

转载 Java多线程：volatile变量、happens-before关系及内存一致性

什么是 Volatile 变量？Volatile 是 Java 中的一个关键字。你不能将它设置为变量或者方法名，句号。认真点，别开玩笑,什么是 Volatile 变量？我们应该什么时候使用它？哈哈，对不起，没法提供帮助。volatile 关键字的典型使用场景是在多线程环境下，多个线程共享变量，由于这些变量会缓存在 CPU的缓存中，为了避免出现内存一致性错误而采用 volat

2015-12-16 16:16:51 787

转载诊断Java中的内存泄露

每次我怀疑有内存泄漏时，我都要翻箱倒柜找这些命令。所以，这里总结一下以备后用：首先，我用下面的命令监视进程：1while( sleep 1) ; dops -p $PID -o %cpu,%mem,rss ; done

2015-12-09 09:44:20 561

转载手把手教你用 Strace 诊断问题运维技巧

早些年，如果你知道有个 strace 命令，就很牛了，而现在大家基本都知道 strace 了，如果你遇到性能问题求助别人，十有八九会建议你用 strace 挂上去看看，不过当你挂上去了，看着满屏翻滚的字符，却十有八九看不出个所以然。本文通过一个简单的案例，向你展示一下在用 strace 诊断问题时的一些套路。如下真实案例，如有雷同，实属必然！让我们看一台高负载服务器的 to

2015-10-27 14:27:30 652

转载排除jar包冲突的三板斧

Maven对于新手来说是《步步惊心》，因为它包罗万象，博大精深，因为当你初来乍到时，你就像一个进入森林的陌生访客一样迷茫。 Maven对于老手来说是《真爱配方》，因为它无所不能，利如刀锋，使用Maven做开发，如饮美酒如悦美人。 Maven对于新手来说，最痛苦的一件事莫过于包之间的冲突，由于Maven的依赖传递性，当你引入一个依赖类时，其身后的依赖类也一起如过江之鲫纷至沓来了。

2015-10-15 17:50:01 1747

转载依赖注入与JSR-330的参考实现——Guice

依赖注入（控制反转的一种形式），它是Java开发主流中一个重要的编程范式（思维方式）。简单的说，使用DI技术可以让对象从别处获得依赖项，而不是由它自己来构造。使用DI有很多好处，它能降低代码之间的耦合度，让代码更易于测试、更易读。Java DI的官方标准是JSR-330，本文我们还会介绍JSR-330的参考实现Guice 3，一个轻量级的DI框架。IoC and DI使用Io

2015-08-03 16:41:30 724

转载 SCP 命令

linux之cp/scp命令＋scp命令详解名称：cp使用权限：所有使用者使用方式：cp [options] source destcp [options] source... directory说明：将一个档案拷贝至另一档案，或将数个档案拷贝至另一目录。把计-a 尽可能将档案状态、权限等资料都照原状予以

2015-07-06 15:44:55 672

转载一次寻找邻居单词列表的算法优化

朋友发来了一道题目进行讨论，题目的主体可以简化为如下：定义一个单词的邻居为，与其长度相同，有且仅有一个字母不同的其他单词。对于一个单词列表，计算所有单词的邻居列表。例如：单词son与sun为邻居，而与song不为邻居，因为它们长度不一样。读者朋友们，看完这道题目后，请先进行独立思考，然后再展开阅读。p.s. 本文将不包含具体代码。暴力法第一个想法很直

2015-06-08 13:44:10 907

转载中文分词算法之基于词典的全切分算法(有点儿柱搜索的味道)

在使用基于词典的分词方法的时候，如果我们解决了下面4个问题：1、如何把一句话中所有的词找出来呢？只要词典中有就一定要找出来。2、如何利用1中找出来的词组合成完整的句子？组合成的句子要和原句一样。3、如何保证2中组合而成的句子包含了所有可能的词序？4、如何从所有可能的词序中选择最完美的一种作为最终的分词结果？那么我们的分词方法称之为：基于词典的全切分算法。

2015-05-18 10:25:55 1594

转载整数压缩算法

1 0~255的整数可以只用一个字节表示,256~65535的数据只需2个字节，65536~16777215需要3个字节，16777216以上4个字节int uncompressed[] = {...}byte compressed[] = {...}Encode Integers:int outPos = 0, previous = 0;for (int in

2015-05-05 11:23:50 6202

转载构造模式实践

这是我第一篇文章（也是我关于这个主题的第一篇博客）。我记不清在哪读过这项内容（尽管我基本上确认是在Practices of an Agile Developer上看到的），但是写博客应该能帮助你全神贯注。具体点来说，通过花些时间来解释你所知道的东西，你能更好的理解它。这也正是我想要努力去做的，通过解释一件事，继而进一步理解这件事。并且还有个额外的好处，当我回忆曾经做过的事情时，它是一个

2015-03-04 11:31:19 530

语义分析，本文指运用各种机器学习方法，挖掘与学习文本、图片等的深层次概念。wikipedia上的解释：In machine learning, semantic analysis of a corpus is the task of building structures that approximate concepts from a large set of documents(or imag

2015-02-13 17:32:12 936

转载 awk经典总结

copy from http://blog.chinaunix.net/uid/11172773.html1 前言awk是Unix环境下一种非常好的语言，适合于文本处理和报表生成，它还有许多精心设计的特性，允许进行特殊技巧程序设计。对于短消息来说，比如处理话单文件，使用awk就非常方便，鉴于测试组大部分人对awk并不熟悉，因此仅以本文作一个提纲挈领的介绍，希望对初

2015-01-23 14:37:34 533

转载 JNA 之初识(上)

JNA(Java Native Access)框架是一个开源的Java框架，是SUN公司主导开发的，建立在经典的JNI的基础之上的一个框架。使用JNI调用共享类库（.dll/.so文件）是非常麻烦的事情，既需要编写java代码，又要编写C语言的代理方法，这其中需要很多数据类型的转换，是让人非常头痛。JNA框架就是为了解决这些问题和繁琐的事情而开发的，它提供一组Java工具类用于在运行期动态访问系统

2015-01-19 15:33:06 573

转载将JNI的dll添加到jar包并发布和执行的方法

原文链接：http://blog.csdn.net/caesarzou/article/details/5672760参考英文链接：

2014-10-30 09:39:25 1908

转载 Charles(最强大的http调试工具)详细教程（上）

2014-02-24 16:31 3064人阅读评论(0) 收藏举报目录(?)[-]界面功能初探本地代理和远程代理如何判断是否代理成功呢去除代理配置mobile代理功能试试远程代理代理配置原文链接：http://blog.csdn.net/wildfireli/article/details/19829479Charles是目

2014-10-30 09:37:30 831

转载危险！在HashMap中将可变对象用作Key

本文中我们将会讨论在Java HashMap中将可变对象用作Key。所有的Java程序员可能都在自己的编程经历中多次用过HashMap。那什么是HashMap呢？HashMap是一种用哈希值来存储和查找键值对（key-value pair，也称作entry）的一种数据结构。为了正确使用HashMap，选择恰当的Key是非常重要的。Key在HashMap里是不可重复的。内容

2014-10-22 11:01:31 1180

转载基于互信息和左右信息熵的短语提取识别

原文链接：在中文语言处理领域，一项重要的任务就是提取中文短语，也即固定多字词表达串的识别。短语提取经常用于搜索引擎的自动推荐，新词识别等领域。本文主要实现了从陌生文本中自动发现固定短语，并给出原理和步骤。测试数据算法工程师算法（Algorithm）是一系列解决问题的清晰指令，也就是说，能够对一定规范的输入，在有限时间内获得所要求的输出。如果一个算法有缺陷，或

2014-10-20 15:14:03 4508

转载线性回归与梯度下降法

前言最近在看斯坦福的《机器学习》的公开课，这个课程是2009年的，有点老了，不过讲的还是很好的，廓清了一些我以前关于机器学习懵懂的地方。我的一位老师曾经说过:什么叫理解？理解就是你能把同一个事情用自己的语言表达出来，并且能让别人听得懂。本着这样的原则，同时也为了证明自己是”理解”的，于是决定打算在学习《机器学习》公开课的时候，写一些系列文章类巩固学到的东西。机器学习中的

2014-10-14 11:50:36 934

转载 Libsvm和Liblinear的使用经验谈

Libsvm和Liblinear都是国立台湾大学的Chih-Jen Lin博士开发的，Libsvm主要是用来进行非线性svm 分类器的生成，提出有一段时间了，而Liblinear则是去年才创建的，主要是应对large-scale的data classification，因为linear分类器的训练比非线性分类器的训练计算复杂度要低很多，时间也少很多，而且在large scale data上的性

2014-09-19 16:23:56 832

转载 Java中的泛型方法

泛型是什么意思在这就不多说了，而Java中泛型类的定义也比较简单，例如：public class Test{}。这样就定义了一个泛型类Test，在实例化该类时，必须指明泛型T的具体类型，例如：Test t = new Test();，指明泛型T的类型为Object。但是Java中的泛型方法就比较复杂了。泛型类，是在实例化类的时候指明泛型的具体类型；泛型方

2014-08-12 10:02:55 513

转载 JQuery+ajax+jsonp 跨域访问

Jsonp(JSON with Padding)是资料格式 json 的一种“使用模式”，可以让网页从别的网域获取资料。关于Jsonp更详细的资料请参考http://baike.baidu.com/view/2131174.htm，下面给出例子：一.客户端Html代码 > html> head> meta http-equi

2014-07-10 15:23:10 517

转载 AJAX 跨域请求 - JSONP获取JSON数据

Asynchronous JavaScript and XML (Ajax ) 是驱动新一代 Web 站点（流行术语为 Web 2.0 站点）的关键技术。Ajax 允许在不干扰 Web 应用程序的显示和行为的情况下在后台进行数据检索。使用 XMLHttpRequest 函数获取数据，它是一种 API，允许客户端 JavaScript 通过 HTTP 连接到远程服务器。Ajax 也是许多 mas

2014-07-10 15:20:50 566

转载跨域的理解与实现

域(Domain)是Windows网络中独立运行的单位，域之间相互访问则需要建立信任关系(即Trust Relation)。信任关系是连接在域与域之间的桥梁。当一个域与其他域建立了信任关系后，2个域之间不但可以按需要相互进行管理，还可以跨网分配文件和打印机等设备资源，使不同的域之间实现网络资源的共享与管理。有一种简明的说法来解释广域跨域：跨域访问，简单来说就是 A 网站的 javascript

2014-07-10 14:40:55 538

转载有关“双重检查锁定失效”的说明

双重检查锁定（以下称为DCL）已被广泛当做多线程环境下延迟初始化的一种高效手段。遗憾的是，在Java中，如果没有额外的同步，它并不可靠。在其它语言中，如c++，实现DCL，需要依赖于处理器的内存模型、编译器实行的重排序以及编译器与同步库之间的交互。由于c++没有对这些做出明确规定，很难说DCL是否有效。可以在c++中使用显式的内存屏障来使DCL生效，但Java中并没有这些屏障。

2014-05-26 16:36:37 1031

转载 Java中的软引用，弱引用和虚引用

在Android的图片处理中，碰到的一个非常普遍的问题便是OOM错误为此网上也有很多例子，而在之前的一篇转载里提到了ListView中加载图片的ImageLoader，而其中有一处，使用到了名为SoftPreference的类这是Java中的一个类也就是所谓的软引用在查询了相关的资料以后会发现SoftPreference的特性，非常适合用来处理OOM引起的问题下面是百度文库的

2014-05-19 14:13:41 529

转载深度学习概述：从感知机到深度网络

（注：本文译自一篇博客，作者行文较随意，我尽量按原意翻译，但作者所介绍的知识还是非常好的，包括例子的选择、理论的介绍都很到位，由浅入深，源文地址）　　近些年来，人工智能领域又活跃起来，除了传统了学术圈外，Google、Microsoft、facebook等工业界优秀企业也纷纷成立相关研究团队，并取得了很多令人瞩目的成果。这要归功于社交网络用户产生的大量数据，这些数据大都是原始数据，需要被进

2014-05-15 10:08:53 1192

转载 HTTP协议缓存策略深入详解之etag妙用

Etag是什么：Etag 是URL的Entity Tag，用于标示URL对象是否改变，区分不同语言和Session等等。具体内部含义是使服务器控制的，就像Cookie那样。　　HTTP协议规格说明定义ETag为“被请求变量的实体值” 。另一种说法是，ETag是一个可以与Web资源关联的记号（token）。典型的Web资源可以一个Web页，但也可能是JSON或XML文档。服务

2014-04-29 16:42:11 558

转载 HTTP的请求头标签 If-Modified-Since

一直以来没有留意过HTTP请求头的IMS（If-Modified-Since）标签。　　最近在分析Squid的access.log日志文件时，发现了一个现象。　　就是即使是对同一个文件进行HTTP请求，第一次和第二次产生的网络流量数据也是不一致的。　　在调查的过程中，逐渐了解了HTTP的If-Modified-Since的头标签的作用。　　大家都知道客户端浏览器是有

2014-04-29 11:10:50 709

转载 Apache HTTP Server 与 Tomcat 的三种连接方式介绍

首先我们先介绍一下为什么要让 Apache 与 Tomcat 之间进行连接。事实上 Tomcat 本身已经提供了 HTTP 服务，该服务默认的端口是 8080，装好 tomcat 后通过 8080 端口可以直接使用 Tomcat 所运行的应用程序，你也可以将该端口改为 80。既然 Tomcat 本身已经可以提供这样的服务，我们为什么还要引入 Apache 或者其他的一些专门的 HTTP 服

2014-04-24 11:49:37 580

转载关于Apache/Tomcat/JBOSS/Neginx/lighttpd/Jetty等一些常见服务器的区别比较和理解

今天是个很丰富的日子，早上一上班，第一个听到的惊爆消息就是楷子得了肠胃炎，一大早去医院挂水了…… 随后风胜和笑虎也没来，后来得知他们俩去去华星现代产业园参加培训，内容是关于Apache与Nginx的。于是乎，我非常感兴趣地查了一下培训用的PPT，并跟旁边的俊牧了解了一下关于服务器的一些东西……整个交流过程中，我发现好多概念已经被我遗忘了，有的也很模糊，于是乎，我还是决定到网上查一下，并记录

2014-04-24 11:16:56 888

转载在遍历List时，对List里的对象进行remove()，此操作会改变List的大小（）

先看看代码：1for（ComType com : ComList）{2 if(!com.getName.contains("abc")){3 CosList.remove(com);4

2014-04-22 15:17:57 2695

转载【性能跟踪】btrace学习二--btrace一个简单例子

btrace安装好了，就看一些语法吧。可以到btrace的官方帮助文档中去看，基本上就可以http://kenai.com/projects/btrace/pages/UserGuide 【注：你本地的jdk要是1.6及以上才行，1.5可是不支持的】下面以一个例子来说明：新建了一个工程，目录结构如下：写btrace脚本和一般的java差别不大，只是用了一些ann

2014-03-28 16:26:27 585

转载 vtd xml example

SummaryMany readers of The Code Project are familiar with various types of XML parsers in the .NET environment. This article series introduces a new XML processing model called VTD-XML to The Code P

2014-01-27 13:32:22 1142

转载 XML解析技术之VTD-XML 简介及代码实例

第一部分：XML解析技术简介 XML(eXtensible Markup Language，可扩展标记语言)是由World Wide Web联盟(W3C)定义的元语言，即一种关于语言的语言。 Xml的优势或者说力量源于它的数据独立性，广泛应用在分布式计算领域。XML解析技术的分类根据从XML中获取数据的简易性，性能和最终所得到的数据模型的不同，XML解析

2014-01-27 10:58:24 724

转载 hive mapjoin使用

今天遇到一个hive的问题，如下hive sql：select f.a,f.b from A t join B f on ( f.a=t.a and f.ftime=20110802) 该语句中B表有30亿行记录，A表只有100行记录，而且B表中数据倾斜特别严重，有一个key上有15亿行记录，在运行过程中特别的慢，而且在reduece的过程中遇有内存不够而报错。

2014-01-07 10:45:13 638

转载 Join语法

hive表连接支持的语法如下：join_table: table_reference JOIN table_factor [join_condition] | table_reference {LEFT|RIGHT|FULL} [OUTER] JOIN table_reference join_condition | table_reference LEFT SEMI

2014-01-07 10:44:27 762

转载 Maven插件开发

Maven 插件开发—-让maven使用更加灵活对于习惯于使用maven构建、管理项目的人来说，maven就是项目开发、测试、部署的一把利器：对类库的集中管理；依赖传递、继承、重用性高；对整个项目开发生命周期的完整支持，从头到尾只需要几个简单的命令就可以快速地遍历整个开发周期，减轻了配置管理的工作量。这些优秀的功能都是通过maven插件库里提供的丰富插件来完成的。因此，掌握maven插件开

2013-11-27 17:01:38 1007

转载数据科学家杨滔揭秘阿里内部数据运用

在国内的互联网企业中，阿里巴巴算是对数据非常重视的一个。作为电商巨头，依靠淘宝和支付宝平台，本身就可以获得大量数据，此外还通过收购（友盟、高德等），来丰富数据来源。那么，这些数据具体是如何为企业运营服务，帮助业务部门提高收益的。或许可以从阿里巴巴数据科学家杨滔所分享的三个实际案例，来做些了解。下面是杨滔分享的部分内容摘录：我们团队的使命，第一个

2013-11-20 19:17:20 1266

转载判断一个数组中是否有重复的元素

判断数组中是否存在重复的元素： Java代码 import org.apache.commons.lang.ArrayUtils; public boolean isDupInArray(Object[] array) { if (ArrayUtils.isEmpty(array) == true) {

2013-11-16 21:00:56 2028

转载利特尔法则

1内容英文名：Little's law（Little's result, theorem, lemma or formula）排队理论（Theory of Queues）中：在一个稳定的系统中，长时间观察到的平均顾客数量L，等于，长时间观察到的有效到达速率λ与平均每个顾客在系统中花费的时间之乘积，即L = λW。2概念利特尔法则由麻省理工大学斯隆商学院（MIT Sl

2013-11-12 14:31:05 3354

空空如也

空空如也