- 博客(239)
- 资源 (4)
- 收藏
- 关注
转载 MSYS2的源配置
MSYS2的源配置 关于MSYS2的文章可以参考下面的链接,笔者不多赘述:msys2安装笔记 MSYS2 + MinGW-w64 + Git + gVim 环境配置 msys2环境搭建 msys2安装g++: pacman -S mingw-w64-x86_64-toolchain mingw-w64-i686-toolchain 由于GFW作怪,访问SF的源并不稳定,笔者推荐使用北京理
2015-08-13 10:43:51 14956
原创 文本分类,数据挖掘和机器学习
一。1。朴素贝叶斯算法(Naive Bayes) 贝叶斯算法关注的是文档属于某类别概率。文档属于某个类别的概率等于文档中每个词属于该类别的概率的综合表达式。而每个词属于该类别的概率又在一定程度上可以用这个词在该类别训练文档中出现的次数(词频信息)来粗略估计,因而使得整个计算过程成为可行的。使用朴素贝叶斯算法时,在训练阶段的主要任务就是估计这些值。朴素贝叶斯算法的公式只
2015-06-15 17:21:07 2104
原创 JDK7新特性--NIO2.0 文件系统
主要包括:FileSystem 提供了许多方法来获得当前文件系统的相关信息。 Path 处理路径(文件和目录),包括创建path,Paths.get(String s)获得path的详细信息 getName(),getXX()…删除path的冗余信息 toRealPath转换path toAbsolutePath()合并两个path r
2015-05-12 16:32:11 1846
转载 2014年国人开发的最热门的开源软件TOP 100
下面是 TOP 100 的软件列表:1. JFinalJFinal 是基于 Java 语言的极速 WEB + ORM 框架,其核心设计目标是开发迅速、代码量少、学习简单、功能强大、轻量级、易扩展、Restful。在拥有 Java 语言所有优势的同时再拥有 ruby、python、php 等动态语言的开发效率!开发语言:Java授权协议:Apache源码下载:
2015-04-09 14:49:20 3697
转载 java的concurrent用法详解
我们都知道,在JDK1.5之前,Java中要进行业务并发时,通常需要有程序员独立完成代码实现,当然也有一些开源的框架提供了这些功能,但是这些依然没有JDK自带的功能使用起来方便。而当针对高质量Java多线程并发程序设计时,为防止死蹦等现象的出现,比如使用java之前的wait()、notify()和synchronized等,每每需要考虑性能、死锁、公平性、资源管理以及如何避免线程安全性方面带来的
2015-04-01 14:52:09 1067
原创 Hadoop的shuffle过程
Hadoop的shuffle过程就是从map端输出到reduce端输入之间的过程,这一段应该是Hadoop中最核心的部分,因为涉及到Hadoop中最珍贵的网络资源,所以shuffle过程中会有很多可以调节的参数,也有很多策略可以研究。这里没有对shuffle做深入的分析,也没有读源代码,只是根据资料和使用的一些理解。map端map过程的输出是写入本地磁盘而不是HDFS,但是一开始数
2015-03-24 15:33:32 870 2
转载 maven常用插件: 打包源码 / 跳过测试 / 单独打包依赖项
一、指定编译文件的编码 maven-compile-plugin 1 plugin> 2 groupId>org.apache.maven.pluginsgroupId> 3 artifactId>maven-compiler-pluginartifactId> 4
2015-02-10 18:25:51 888
转载 Classifier4J的中文支持
Classifier4J是一个轻量级的分类工具,支持贝叶斯分类、向量空间模型、信息摘要等。然而它却不支持中文,异常信息大致如下:Exception in thread "main" java.util.NoSuchElementException at java.util.HashMap$HashIterator.nextEntry(HashMap.java:813) at java.ut
2015-02-03 14:29:20 2415
转载 Thrift入门及Java实例演示
[一]、概述Thrift是一个软件框架,用来进行可扩展且跨语言的服务的开发。它结合了功能强大的软件堆栈和代码生成引擎,以构建在 C++, Java, Python, PHP, Ruby, Erlang, Perl, Haskell, C#, Cocoa, JavaScript, Node.js, Smalltalk, and OCaml 等等编程语言间无缝结合的、高效的服务。Thr
2015-01-22 17:12:59 915
转载 Thrift入门及Java实例演示
[一]、概述Thrift是一个软件框架,用来进行可扩展且跨语言的服务的开发。它结合了功能强大的软件堆栈和代码生成引擎,以构建在 C++, Java, Python, PHP, Ruby, Erlang, Perl, Haskell, C#, Cocoa, JavaScript, Node.js, Smalltalk, and OCaml 等等编程语言间无缝结合的、高效的服务。Thr
2015-01-22 17:08:38 811
转载 国外程序员整理的Java资源大全
构建这里搜集了用来构建应用程序的工具。Apache Maven:Maven使用声明进行构建并进行依赖管理,偏向于使用约定而不是配置进行构建。Maven优于Apache Ant。后者采用了一种过程化的方式进行配置,所以维护起来相当困难。Gradle:Gradle采用增量构建。Gradle通过Groovy编程而不是传统的XML声明进行配置。Gradle可以很好地配合Maven进行依赖管
2015-01-16 14:57:09 1340
转载 Java程序员必须掌握的8大排序算法
本文主要详解了Java语言的8大排序的基本思想以及实例解读,详细请看下文8种排序之间的关系:1, 直接插入排序(1)基本思想:在要排序的一组数中,假设前面(n-1)[n>=2] 个数已经是排好顺序的,现在要把第n个数插到前面的有序数中,使得这n个数也是排好顺序的。如此反复循环,直到全部排好顺序。(2)实例(3)用java实现
2015-01-16 14:49:33 5806 1
转载 Java正则表达式
1. 用户名正则表达式模式^[a-z0-9_-]{3,15}$^ # 行开始 [a-z0-9_-] # 匹配列表中的字符,a-z,0–9,下划线,连字符 {3,15} # 长度至少3个字符,最大长度为15$ # 行结束2.
2015-01-16 14:46:51 916
转载 Java Map遍历方式方式及性能比较
1 如果你使用HashMap同时遍历key和value时,keySet与entrySet方法的性能差异取决于key的具体情况,如复杂度(复杂对象)、离散度、冲突率等。换言之,取决于HashMap查找value的开销。entrySet一次性取出所有 key和value的操作是有性能开销的,当这个损失小于HashMap查找value的开销时,entrySet的性能优势就会体现出来。例如上述对比
2015-01-16 14:39:51 2065
转载 Java五道输出易错题解析
收集了几个易错的或好玩的Java输出题,分享给大家,以后在编程学习中稍微注意下就OK了。1. 看不见的空格?下面的输出会正常吗?package basic;public class IntegerTest { public static void main(String[] args) { System.out.println(Integer.pa
2015-01-06 16:58:47 806
转载 5个最优秀的Java和C#代码转换工具
毋庸置疑,Java是一门最受欢迎而且使用最广泛的编程语言,目前有超过9百万的Java开发者从事web服务的开发,Java以“编写一次,可在任何地方运行”而著称,同时这也是其大受欢迎的主要原因。和Java类似,C#也是一门拥有很多现代化特性的编程语言,很多开发者处于其安全性和稳定性,会选择C#这个平台。本文介绍了几个最优秀的Java和C#代码转换工具,希望对开发者有所帮助。1、Jav
2015-01-06 16:38:52 1473
转载 eclipse 运行Maven时报错总结
No goals have been specified for this build. You must specify a valid lifecycle phase or a goal in the format : or :[:]:. Available lifecycle phases are: validate, initialize, generate-sources, proces
2015-01-06 10:41:04 41877 4
转载 京东DNN Lab首席科学家:用深度学习搞定80%的客服工作
大数据催熟深度学习深度学习是模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释和处理各种数据,包括文本数据、图像数据和语音数据等。人工神经网络具有良好的学习能力和解决问题的能力,但传统神经网络一般只有两三层的神经网络,其有限的参数和计算单元,对复杂函数的表示能力有限,学习能力受到制约,特征的开发和筛选也极为耗费人力。包含多个隐藏层的深度学习模型则不一样,根据机器学习泰斗、多伦多
2014-12-31 17:43:20 2164
转载 从机器学习谈起
转载:点击打开链接在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。这篇文档也算是EasyPR开发的番外篇,从这里开始,必须对机器学习了解才能进一步介绍EasyPR的内核。当然,本文也面对一般读者,不会对阅读有相关的前提要求。 在进入正题前,我想读者心中可能会有一个疑惑:机器学习有什么重要性,以至于要阅读完这篇非常
2014-12-31 17:39:24 949
转载 每个Java开发者都应该知道的5个JDK工具
JDK是Java语言的软件开发工具包,没有它就无法编译Java程序。目前,有许许多多的JDK工具呈现在大家面前,但最常用的莫过于java.exe、javac.exe、jar等。除了这几个,还有哪些呢?本文作者Joe拥有多年的Java开发经验,其在博客上分享了一篇文章:5 JDK Tools Every Java Developer Should Know,笔者对其进行了编译,以下为译文。
2014-12-31 17:35:39 1048
转载 分享5个可视化的正则表达式编辑工具
正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。本文推荐五款可以可视化操作的正则表达式编辑器,这些工具可以很好地帮助开发者学习正则表达式知识,并且提升开发技能。1.RegulexRegulex是一个JavaScript正则表达式可视化工具,由纯JavaScript实现,源码托管
2014-12-31 17:33:06 1250
转载 Java开源工具使用介绍-----Apache Commons Lang
一个优秀的类应该重写toString,hashCode,equals,compareTo方法,我们来看一下apache如何带我们简化这些操作,以下示例支持两种形式,一种是通过逐个参数添加从而精细控制那些参数参与比较和输出,另一种是通过反射让全部参数都参与比较和输出 Builder系列 //ToStringBuilder @Override public String toStri
2014-12-26 14:45:27 7443
转载 Java String之StringBuffer以及它的API的详细使用方法
StringBuffer 是一个线程安全的可变的字符序列。它继承于AbstractStringBuilder,实现了CharSequence接口。StringBuilder 也是继承于AbstractStringBuilder的子类;但是,StringBuilder和StringBuffer不同,前者是非线程安全的,后者是线程安全的。StringBuffer 和 CharSequenc
2014-12-26 14:21:18 3300
转载 Java String之StringBuilder以及它的API的详细使用方法(2)
1. StringBuilder 中插入(insert)相关的API源码如下(StringBuilderInsertTest.java):/** * StringBuilder 的insert()示例 * * @author skywang */ import java.util.HashMap; public class StringBuilde
2014-12-26 14:17:45 1024
转载 Java String之StringBuilder以及它的API的详细使用方法
StringBuilder 简介StringBuilder 是一个可变的字符序列。它继承于AbstractStringBuilder,实现了CharSequence接口。StringBuffer 也是继承于AbstractStringBuilder的子类;但是,StringBuilder和StringBuffer不同,前者是非线程安全的,后者是线程安全的。StringBuild
2014-12-26 14:12:29 5924
转载 Java String之String和CharSequence、StringBuilder和StringBuffer的区别(3)
9. String 完整示例下面的示例是整合上面的几个示例的完整的String演示程序,源码如下(StringAPITest.java):/** * String 演示程序 * * @author skywang */ import java.util.HashMap; import java.nio.charset.Charset; import
2014-12-26 14:09:13 749
转载 Java String之String和CharSequence、StringBuilder和StringBuffer的区别(2)
演示程序1. CharSequence下面通过示例,演示CharSequence的使用方法!源码如下(CharSequenceTest.java):/** * CharSequence 演示程序 * * @author skywang */ import java.nio.charset.Charset; import java.io.Un
2014-12-26 14:06:21 2648 1
转载 Java String之String和CharSequence、StringBuilder和StringBuffer的区别(1)
本章主要介绍String和CharSequence的区别,以及它们的API详细使用方法。String 简介String 是java中的字符串,它继承于CharSequence。String类所包含的API接口非常多。为了便于今后的使用,我对String的API进行了分类,并都给出的演示程序。String 和 CharSequence 关系String 继承于Char
2014-12-26 13:59:39 1836
转载 庖丁分词的源码分析
在网上也看到了不少庖丁分词的使用说明,但是源码分析比较少。但是我也不想死板的一步步的把代码说一遍,这个多debug几次就ok了。我想说说比较关键或有意思的地方。1 庖丁只要是同一个配置文件就会是同一个庖丁对象,所以其实你可以放心的new。 2 庖丁的配置文件改变他是会去检查的,可以通过设置paoding.dic.detector.interval这个来设置检查的时间间隔。
2014-12-25 10:47:26 1008
转载 数据结构中常见的树(BST二叉搜索树、AVL平衡二叉树、RBT红黑树、B-树、B+树、B*树)
BST树 即二叉搜索树: 1.所有非叶子结点至多拥有两个儿子(Left和Right); 2.所有结点存储一个关键字; 3.非叶子结点的左指针指向小于其关键字的子树,右指针指向大于其关键字的子树; 如: BST树的搜索,从根结点开始,如果查询的关键字与
2014-12-23 14:39:38 967
原创 基于庖丁分词的TFIDF计算
通过近期研究测试,发现庖丁分词在中文分词中效果好一点,而TFIDF是词频计算中常用方法,关于TFIDF的计算过程就不详细说明了。直接上代码:package com.util;import java.io.*;import java.util.*;import java.util.Map.Entry;import net.paoding.analysis.analyzer.Pao
2014-12-12 16:19:15 1653
转载 从一家电子商务网站学到的经验教训
一、做好商品浏览功能“当公司规模还不大的时候,不必急急忙忙地推出搜索功能。”Grace认为。因为产品库还不算丰富时,人们根本不知道该搜索什么,所以做好商品浏览功能比搜索功能更为迫切和重要。比方说服装类电商Macy,它可以让用户分层分类地逐级寻找自己想要的衣物,简单说就是导向型购物。同时,这过程中可以让Macy逐步掌握到用户的喜好和搜索习惯,为日后功能拓展提供了数据支持。此外,Gra
2014-12-01 11:56:39 1330
转载 【干货】国外程序员整理的 C++ 资源大全
关于 C++ 框架、库和资源的一些汇总列表,由 fffaraz发起和维护。内容包括:标准库、Web应用框架、人工智能、数据库、图片处理、机器学习、日志、代码分析等。标准库C++ Standard Library:是一系列类和函数的集合,使用核心语言编写,也是C++ISO自身标准的一部分。Standard Template Library:标准模板库C POSIX l
2014-12-01 11:41:48 911
转载 Apache commons IO简介
【一】Apache commons IO简介首先贴一段Apache commons IO官网上的介绍,来对这个著名的开源包有一个基本的了解:Commons IO is a library of utilities to assist with developing IO functionality. There are four main areas included: ●U
2014-11-27 16:04:19 1832
原创 MyEclipse的Workspace目录中.metadata文件夹
1、先说me_tcat:是MyEclipse记录的当前工作空间中的配置,比如当前工作空间中有哪些工程,你打开了哪些文件java类,编辑了哪些文件和Java类,MyEclipse会在启动时加载这个文件夹下的内容。如果删除了他,你再次打开MyEclipse会发现工作空间是空的,你需要重新导入工程。2、plugins:当前工作空间用到了哪些IDE插件,和你的工程无关3、lock锁:如果你用到工作
2014-11-27 10:09:37 3791
原创 基于堆实现的优先级队列:PriorityQueue 解决 Top K 问题
1、认识PriorityQueuePriorityQueue是从JDK1.5开始提供的新的数据结构接口,它是一种基于优先级堆的极大优先级队列。优先级队列是不同于先进先出队列的另一种队列。每次从队列中取出的是具有最高优先权的元素。如果不提供Comparator的话,优先队列中元素默认按自然顺序排列,也就是数字默认是小的在队列头,字符串则按字典序排列(参阅 Comparable),也可以根据
2014-11-24 11:12:02 3549
原创 Commons Math学习笔记
先列出一个目录:(这个目录是根据commons math 2.1库的结构设计的)Section 1 linear 线性代数(矩阵为主)1) Vector 向量2) Matrix 矩阵3) Matrix Decomposition 矩阵分解Section 2 analysis 数学分析(函数为主)1) Function 函数2) Polynom
2014-11-21 15:37:52 21633 2
转载 一致性哈希算法(consistent hashing)
转载请说明出处:http://blog.csdn.net/cywosp/article/details/23397179 一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法,设计目标是为了解决因特网中的热点(Hot spot)问题,初衷和CARP十分类似。一致性哈希修正了CARP使用的简 单哈希算法带来的问题,使得分布式哈希(DHT)可以在P2P环境中真正得到
2014-11-19 10:15:01 1223
转载 windows安装storm
一:安装JDK.下载地址:地址一 地址二配置java环境变量 JAVA_HOME、Path、CLASSPATH三个值分别为(按照自己安装状况设置,此处供参考):D:\java\jdk17%JAVA_HOME%/bin;%JAVA_HOME%/jre/bin.;%JAVA_HOME%/lib/dt.jar;%JAVA_HOME%/lib/tools.jar
2014-11-17 16:24:14 2373
转载 Ant之build.xml详解
Ant的概念 可能有些读者并不连接什么是Ant以及入可使用它,但只要使用通过Linux系统得读者,应该知道make这个命令。当编译Linux内核及一些软件的源程序时,经常要用这个命令。Make命令其实就是一个项目管理工具,而Ant所实现功能与此类似。像make,gnumake和nmake这些编译工具都有一定的缺陷,但是Ant却克服了这些工具的缺陷。最初Ant开发者在开发跨平台的应用时,用样也是
2014-11-17 14:19:06 901
身份认证技术分析论文
2011-04-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人