- 博客(235)
- 资源 (5)
- 收藏
- 关注
转载 java相关优秀开源项目
构建这里搜集了用来构建应用程序的工具。Apache Maven:Maven使用声明进行构建并进行依赖管理,偏向于使用约定而不是配置进行构建。Maven优于Apache Ant。后者采用了一种过程化的方式进行配置,所以维护起来相当困难。Gradle:Gradle采用增量构建。Gradle通过Groovy编程而不是传统的XML声明进行配置。Gradle可以很好地配合Maven进行依赖管理,并且把Ant
2015-05-01 09:01:22 3050
转载 欢迎使用CSDN-markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl
2015-05-01 08:57:48 789
原创 深度学习在自然语言处理相关文章
大部分文章来自:http://www.socher.org/http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial包括从他们里面的论文里找到的related work Word Embedding LearnigSENNA原始论文【ACL'07】Fast Semantic Extraction Using
2014-11-06 21:38:57 1096
原创 nlp资料库集锦
英语学习者语料库(书面语及口语)中国学习者语料库 CLEC(100万)广外、上海交大大学英语学习者口语语料库 COLSEC (5万) 上海交大香港科技大学学习者语料库 HKUST Learner Corpus 香港科技大学中国英语专业语料库 CEME (148万) 南京大学中国英语学习者口语语料库 SECCL (100万) 南京大学国际外语学习者英语口语语料库中国部分 LINS
2014-08-27 20:13:52 1195
转载 linux shell参数传递
递的参数函数和 shell 脚本的妙处之一是,通过向单个函数或脚本传递参数 能够使它们表现出不同的行为。在本节中,您将了解到如何识别和使用传递的参数。在函数或脚本中,您可以使用表 1 中列出的 bash 特殊变量来引用参数。您可以给这些变量附上 $ 符号的前缀,然后像引用其他 shell 变量那样引用它们。表 1. 函数的 Shell 参数参数目
2014-08-07 21:01:04 2234
原创 推荐一款Java代码Bug分析插件 FindBugs
findBugs是一个能静态分析源代码中可能会出现Bug的Eclipse插件工具。下载之后,把解冻后的文件拷贝到 $ECLIPSE_HOME/plugins/目录下,重新启动eclipse即完成安装。FindBugs的设置:安装好之后,可以通过 Projects > Property > FindBugs标签对其进行设置。设置方法可以根据自己的需要进行调
2014-08-06 21:00:33 1139
原创 Java程序的linux启动脚本
Java程序多数情况下都会用到一些第三方的类库,如果仅用到几个jar文件,写到java命令里就好,但是依赖的jar文件很多的情况,写到java命令里就不好了,而且如果jar文件被替换,名字变了,就需要改java命令,所以最好在启动命令里不出现jar文件名。假设程序依赖的类库jar文件存放在同级的lib目录下,简单的:java -Djava.ext.dirs=lib -Djava.libra
2014-08-05 09:03:41 899
原创 solr高亮、拼写检查及匹配相似简单实践
高亮(highlight)我们经常使用搜索引擎,比如在google 搜索 java ,会出现如下结果,结果中与关键字匹配的地方是红色显示与其他内容区别开来。solr 默认已经配置了highlight 组件(详见 SOLR_HOME/conf/sorlconfig.xml)。通常我出只需要这样请求 http://localhost:8080/solr/select?q=n
2014-08-04 14:55:08 1465
原创 Mariana: 深度学习在腾讯的平台化和应用实践
引言:深度学习是近年机器学习领域的重大突破,有着广泛的应用前景。随着Google公开Google Brain计划,业界对深度学习的热情高涨。腾讯在深度学习领域持续投入,获得了实际落地的产出。我们准备了四篇文章,阐述深度学习的原理和在腾讯的实践,介绍腾讯深度学习平台Mariana,本文为第一篇。深度学习(Deep Learning)是近年来机器学习领域的热点,在语音识别、图像识别等领域均
2014-08-04 08:41:21 2111
原创 美国人在玩什么
在美国,有2300万家小企业,每个月还会新增54.3万家小企业。所以,如果你的公司想要脱颖而出,并取得成功,不仅需要一个独一无二的价值主张,还要有多元化的收入流,以及充足、强大的创造能力。投资银行在线调研了17家独特的公司,他们的商业模式已经得到了市场的验证,这些公司的产品范围很广,从零售App应用,到时尚新贵,当然,这些公司也正在重新思索他们的收入模式,并且不断为交易双方创造令人信服的价
2014-07-29 12:40:24 1316
原创 java中使用的设计模式
来自于http://stackoverflow.com/questions/1673841/examples-of-gof-design-patternsYou can find an overview of a lot of design patterns in Wikipedia. It also mentions which pat
2014-07-18 13:26:20 922
原创 linux expr命令
expr 命令用途求表达式变量的值。语法expr Expression描述expr 命令读入 Expression 参数,计算它的值,然后将结果写入到标准输出。您必须对 Expression 参数应用以下规则:用空格隔开每个项。 用 / (反斜杠) 放在 shell 特定的字符前面。 对包含空格和其他特殊字符的字符串要用引号括起来。
2014-07-10 14:54:59 934
转载 消息队列AactiveMQ介绍
一、 概述与介绍ActiveMQ 是Apache出品,最流行的、功能强大的即时通讯和集成模式的开源服务器。ActiveMQ 是一个完全支持JMS1.1和J2EE 1.4规范的 JMS Provider实现。提供客户端支持跨语言和协议,带有易于在充分支持JMS 1.1和1.4使用J2EE企业集成模式和许多先进的功能。二、 特性1、 多种语言和协议编写客户端。语言:
2014-07-04 08:52:02 1042
转载 各种消息队列比较
目前业界有很多MQ产品,我们作如下对比:RabbitMQ是使用Erlang编写的一个开源的消息队列,本身支持很多的协议:AMQP,XMPP, SMTP, STOMP,也正是如此,使的它变的非常重量级,更适合于企业级的开发。同时实现了一个经纪人(Broker)构架,这意味着消息在发送给客户端时先在中心队列排队。对路由(Routing),负载均衡(Load balance)或者数据持久化都有很
2014-07-03 19:43:35 915
原创 ubuntu下文件名乱码的解决
2014下半年的第一天,继续加油。文件是在WIndows 下创建的,Windows 的文件名中文编码默认为GBK,而Linux中默认文件名编码为UTF8,由于编码不一致所以导致了文件名乱码的问题,解决这个问题需要对文件名进行转码。文件名转码工具convmv没安装的话用下面的命令安装:sudo apt-get install convmv复制代码
2014-07-01 16:02:04 1324
原创 用 Cobertura 测量测试覆盖率
用 Cobertura 测量测试覆盖率找出隐藏 bug 的未测试到的代码Cobertura 是一种开源工具,它通过检测基本的代码,并观察在测试包运行时执行了哪些代码和没有执行哪些代码,来测量测试覆盖率。除了找出未测试到的代码并发现 bug 外,Cobertura 还可以通过标记无用的、执行不到的代码来优化代码,还可以提供 API 实际操作的内部信息。Elliotte Rusty Harol
2014-06-29 16:18:03 993
翻译 Linux有趣的命令
1. sl 命令sl是指“steam locomotive(蒸汽机车)”,你会看到一辆火车从屏幕右边开往左边。。。。。。安装 $ sudo apt-get install sl 运行 $ sl可以通过设置别名,给别人来个恶作剧,让ta敲ls就跑出个火车出来,不知道的肯定很有效果 O(∩_∩)O$alias ls=sl2. fortune 命令输出一
2014-06-11 20:09:34 810
转载 全端工程师必备技能汇总
首先,看一张前端知识结构图: (原文:ithomer)图片的形式具有诸多的不便。缺失源图的我们,无法为此图贡献些什么,随着时间的迁移,或许有些技术点会发生改变,所以有了这个GitHub项目。我们可以通过协作的方式来共同维护这个项目。Git的历史记录也可以见证前端行业的一些变迁。尽管会变成文字的方式来维护这些内容,但是我承诺写一个小工具帮大家生成更好玩的图形(基于Dat
2014-06-11 19:58:27 1017
转载 数据挖掘技术、方法及应用
目录(?)[+]一幅凝固的油画 Keywords:data mining,Knowledge discovery in databases,DM,KDD,CRISP-DM,Internet概念基于Internet的全球信息系统的发展使我们拥有了前所未有的丰富数据。大量信息在给人们带来方便的同时也带来了一大堆问题:第一是信息过量,难以消化;第二是信息真假难以辨识;第三
2014-06-09 21:05:58 46214 1
原创 solr查询参数简介
查询参数简介(官方介绍http://wiki.apache.org/solr/CommonQueryParameters):• q (query) - 参数的主查询,默认是所有的“*:*”• fl (Field List) - 指定返回那些字段内容,用逗号或空格分隔多个。例如:“fl=id,name”意味着值列出id, ...
2014-06-08 11:28:56 222
原创 solr4.7和tomcat的整合
方法一:假定$SOLR_HOME为E:\Software\apache-tomcat-6.0.35-solr\solr步骤1,从solr-4.3.0\dist复制solr-4.3.0.war到$SOLR_HOME并重命名为solr.jar;步骤2,将solr-4.3.0\example\solr复制到$SOLR_HOME目录;步骤3,在tomcat/conf/catalina/lo
2014-06-07 21:38:03 931
原创 linux监控工具的使用总结
Linux统计/监控工具SAR详细介绍:要判断一个系统瓶颈问题,有时需要几个 sar 命令选项结合起来使用,例如: 怀疑CPU存在瓶颈,可用 sar -u 和 sar -q deng 等来查看 怀疑内存存在瓶颈,可用 sar -B、sar -r 和 sar -W 等来查看 怀疑I/O存在瓶颈,可用 sar -b、sar -u 和 sar -d 等来查看 内容提要
2014-06-05 16:40:17 824
原创 solr中关于core的管理
一、查询1.core的状态查询http://se246:8983/solr/admin/cores?action=STATUS2.指定coreName进行查询http://localhost:8983/solr/admin/cores?action=STATUS&core=core0二、创建需要提供coreName、实例路径、Config配置、schema文件及数据目录 ,
2014-05-30 14:02:18 1605
转载 深度学习
Deep Learning是机器学习中一个非常接近AI的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,最近研究了机器学习中一些深度学习的相关知识,本文给出一些很有用的资料和心得。Key Words:有监督学习与无监督学习,分类、回归,密度估计、聚类,深度学习,Sparse DBN,1. 有监督学习和无监督学习给定一组数据(input,target)为Z=
2014-05-07 10:43:44 819
索引的建立、更新策略
一、索引的建立分为三种方式:1.两遍文档倒排法第一遍文档扫描时完成一些全局信息统计,如文档集合的数量、每个文档的单词数量、词频等第二遍文档扫描的主要任务是填补每个单词的倒排列表,完全在内存中进行2.排序倒排法步骤为:排序文档ID赋值、单词ID赋值、更新词典、统计词频、构建三元组、三元组排序、写中间结果文件、合并中间结果文件。3.归并倒排法 二、索引更新...
2014-05-03 17:50:51 259
网页分类算法
网页自动分类是通过对某一特定的网页样本进行训练获得该类别网页的形式化描述,在此基础上训练分类器,进而对未知类别的网页进行类别判断的技术。常用的分类器有SVM、朴素贝叶斯、KNN、Rocchio、中心分类算法CBC(Center Based Classification)...
2014-05-03 17:26:06 648
网页去重算法
网页去重发生在网页下载后、索引建立前,典型的网页去重算法有SHINGLING、I-MATCH算法、Random Projection、SimHash算法以及SPOTSING算法
2014-05-03 17:20:20 231
关联算法总结
1.FP-growth基本原理:Frequency Pattern-growth频繁模式增长算法,也是决策树算法,在产生候选项目集的时候采用模式增长的方法递归挖掘全部频繁模式,并且只需扫描事务数据库两次。它采用分而治之的思想:经过一片扫描后,将提供频繁项集的事务数据库压缩成一颗频繁模式树,但仍保留项集的关联信息。然后,将这种压缩后的事务数据库分成一组条件数据库,每个条件数据库关联一个频繁项集,...
2014-05-03 16:37:47 680
聚类算法的MapReduce并行化分析
五一假期,还好没有出去,到处都是堵啊。闲在看看分类、聚类算法、关联算法,现总结一下常见的聚类算法并进行MR分析。1.K-means基本原理:首先随机的选择K个对象,每个对象代表一个簇的初始均值和中心;对剩余的每个对象,根据其与各个簇的均值的距离,将其指派到最相似的簇。然后计算每个簇的新均值,过程不断重复直到准则函数收敛效率分析:时间复杂度O(nki)、空间复杂度O(k)MapReduc...
2014-05-03 16:27:00 948
java动态编程简述
动态编程指的是改变经典编程方式(源文件-->编译-->二进制文件---->运行方式)的行为.1.使用Compiler Api 创建类文件,同时允许在程序运行中编译源文件。在动态使用java类时可以启用诊断信息监听器和编译选项。2.使用Instrumentation构建代理,可以用来监测JVM上的程序,一般是通过在执行某个类文件之前,对类文件的字节码适当修改来实现3...
2014-05-02 17:15:00 137
转载 mysql数据库实现类似oracle connect by prior的查询
--注下面的语句用到了表 DROP TABLE IF EXISTS `a_sys_org`; CREATE TABLE `a_sys_org` ( `org_id` varchar(32) NOT NULL COMMENT '机构号', `org_name` varchar(256) NOT NULL COMMENT '机构名称', `parent_org_id`
2014-04-12 12:16:02 2033
mysql数据库实现类似oracle connect by prior的查询
--注下面的语句用到了表DROP TABLE IF EXISTS `a_sys_org`;CREATE TABLE `a_sys_org` ( `org_id` varchar(32) NOT NULL COMMENT '机构号', `org_name` varchar(256) NOT NULL COMMENT '机构名称', `parent_org_id` varchar(32) NOT NU...
2014-04-12 12:16:00 199
原创 java标记接口
标识接口是没有任何方法和属性的接口.它仅仅表明它的类属于一个特定的类型,供其他代码来测试允许做一些事情.标识接口作用:简单形象的说就是给某个对象打个标(盖个戳),使对象拥有某个或某些特权。比如,你不能杀人,如果老习给你盖个戳,你就可以杀人了。。使用标记接口可以用instanceof进行类型查询,例如:if(obj instanceof Cloneable) {………}一些容
2014-04-09 11:48:30 959
java标记接口
标识接口是没有任何方法和属性的接口.它仅仅表明它的类属于一个特定的类型,供其他代码来测试允许做一些事情.标识接口作用:简单形象的说就是给某个对象打个标(盖个戳),使对象拥有某个或某些特权。比如,你不能杀人,如果老习给你盖个戳,你就可以杀人了。。使用标记接口可以用instanceof进行类型查询,例如:if(obj instanceof Cloneable) {………}一...
2014-04-09 11:48:00 113
转载 Java位运算优化:位域、位图棋盘等
快速小测试:如何重写下面的语句?要求不使用条件判断语句交换两个常量的值。 if (x == a) x= b; else x= a; 答案: x= a ^ b ^ x; //此处变量x等于a或者等于b 字符^是逻辑异或XOR运算符。上面代码为什么能工作呢?使用XOR运算符,一个变量执行2次异或运算与另一个变量,总是返回变量自身。
2014-04-09 11:30:30 3289
原创 java策略枚举
我们在使用Java的枚举时往往会结合Switch来进行判断以实现不同值的处理,但是我们知道多用switch不是一种很好的代码风格,不利用维护和适应变化,因为这不符合开-闭原则。为此一种方法是用策略模式来重构原有的枚举实现,但是很多时候确实需要用枚举的方法来实现,如一周的天数等等,这也是JDK5.0重新引入枚举的原因。Joshua Bloch在Effective Java(第二版)里提出了一种枚举策
2014-04-09 11:19:07 1506
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人