自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(154)
  • 资源 (5)
  • 收藏
  • 关注

原创 手机充电器的参数解释

对于现在手机的各种充电器,是否可以混用产生疑问,查了些资料,总结了一下发在这里,说明一下各项参数的意思。这里一华为P6的充电器作为参考。如下图所示输入:100-240V ~ 50/60Hz 0.2A输出:5.0V — 1.0A这里 ~ 表示交流电(AC), —表示直流电(DC)(注:应该是双线,如图中所示的那样)。这里表示交流电源输入,直流电源输出。具体解释如下:交流电

2014-01-08 16:07:32 17996

原创 MapReduce编程模型

MapReduce是一个Google发明的编程模型,也是一个处理和生成超大规模数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于对的数据集合,输出的中间结果基于对的数据集合,然后再创建一个Reduce函数用来合并所有的具有相同中间Key值的中间Value值。MapReduce架构的程序可以实现在大量普通配置的设备上实现分布式计算。在Google的集群中,每天都有1000多个Ma

2014-01-07 15:39:07 2770

原创 Google File System架构

GFS是一个面向大规模数据密集型应用的,可伸缩的分布式文件系统。GFS可以运行在廉价的设备上,并且能够提供具有容灾、高性能的服务。GFS架构:一个GFS集群包括一个单点Master,多台Chunk服务器(ChunkServer,下面也称块服务器),并且能够同时被多个客户端访问。如图1所示。所有的这些机器可以使普通的运行用户级线程的Linux机器。只要机器允许,我们完全可以将客户端与

2014-01-05 20:37:23 2078

原创 Foxit Reader出现脚本错误提示的解决方法

问题描述:我用的是Foxit Reader英文版,这几天每次打开PDF时都为提示脚本错误,查看了是软件里面半酣的jquery脚本无法访问的错误。错误提示如图。百度了一下,擦,竟然没有相似的问题出现,百度终于不知道一些事了。另外发现Start Page的“Recent Documents”竟然不显示最近浏览记录。嗯,似乎明白了点啥么。脚本未正常读取么。图1. 错误提示

2013-12-30 16:13:52 12064

原创 中心化副本控制协议:primary-secondary协议

副本控制协议指按特定的协议流程控制副本数据的读写行为,使得副本满足一定的可用性和一致性要求的分布式协议。副本控制协议可以分为两大类“中心化(centralized)副本控制协议”和“去中心化(decentralized)副本控制协议”。中心化副本控制协议的基本思路:由一个中心节点协调副本数据的更新、维护副本之间的一致性。所有副本相关的控制交由中心节点完成,并发控制由中心节点完成,从而简

2013-12-29 15:59:39 2550

原创 分布式文件系统:lease机制

Lease机制是最重要的分布式协议,广泛应用于各种实际的分布式系统中。Lease机制最重要的应用是,判断节点状态。Lease是由颁发者授予的在某一有效期内的承诺。办法者一旦发出lease,则无论接收方是否收到,也无论后续接收方处于何种状态,只要lease未过期,颁发者一定严守承诺;另一方面,接收方在lease的有效期内可以使用颁发者的承诺,则一旦lease过期,接收方一定不能继续使用颁发者的承诺。

2013-12-29 11:13:34 2626

原创 Datalog简单回顾

Datalog是一种基于逻辑的编程语言。它是一阶谓词逻辑中Horn子句逻辑的一种受限形式,只允许变量或常量作为谓词的自变元,不允许函数作为谓词的自变元。Datalog的语句由事实和规则组成,同Prolog一样,它可以实现对知识库的演绎推理,即可以从已知事实中根据跟着推理得到新的事实。一条Datalog的规则包括如下三部分的内容:            (1)规则头P           

2013-12-27 13:54:09 7472

原创 Brewer的CAP理论

CAP理论是由EricBrewer提出的分布式系统中最重要的理论之一。Brewer指出,在分布式环境中设计和部署应用的时候需要关注3点非常重要的全局因素:一致性(Consistency)、可用性(Availability)、分区(Partition)。CAP理论指出,无法设计一种分布式协议,使得同时完全具备CAP三个属性。用一个例子来解释CAP理论。假设你想在京东买一本刘兵的《Web数

2013-12-25 10:53:48 2732

原创 大数据及下一代基础设施

什么是大数据?对于大数据的概念,这里给出的定义是超出现有数据库系统处理能力的数据。由于过快的数据产生速度,以及规模巨大的数据量,这就要求使用合适的系统来处理它们。大数据的价值主要可以分为两种:数据分析、开发新产品。大数据分析能够揭露消费行为及趋势,如消费者如何受到同龄人的影响。对开发新产品而言,通过组合大量数据所透出的用户行为及群体关系,Facebook能够开发更具个性化的用户体验和独

2013-12-24 16:31:54 2256

原创 Hadoop HDFS常用命令

HDFS的特点: 一次写入,多次读取HDFS下的文件操作:1.列出HDFS文件hadoop dfs -ls//未带参数的-ls命令没有任何返回值,默认返回HDFS的“home”目录下的内容//HDFS中,没有当前工作目录这样的概念,也没有cd这个命令2.列出HDFS目录下某个文档中的文件hadoop dfs -ls in3.上传文件到HDFS(下面的命令

2013-11-29 21:18:44 1938

转载 OLTP与OLAP

联机分析处理 (OLAP) 的概念最早是由关系数据库之父E.F.Codd于1993年提出的,他同时提出了关于OLAP的12条准则。OLAP的提出引起了很大的反响,OLAP作为一类产品同联机事务处理 (OLTP) 明显区分开来。当今的数据处理大致可以分成两大类:联机事务处理OLTP(on-line transaction processing)、联机分析处理OLAP(On-LineAna

2013-11-27 10:47:01 1223

原创 在CentOS上安装Hadoop集群

Hadoop是Apache组织的一个顶级项目,它是一个分布式系统架构。Hadoop实现了一个分布式文件系统(HDFS),易于部署在低廉的硬件设备上,并且极易扩充。Hadoop的核心是HDFS和MapReduce。本篇文章主要介绍如何安装Hadoop集群,伪分布模式的安装应该是简单的,因此这里旨在在3台互通的centOS平台上安装完全分布模式的Hadoop集群。准备工作:3台装有cent

2013-11-22 00:14:58 2052

原创 CentOS下安装JDK

首先,CentOS中默认是有OpenJDK的(因为OpenOffice套件需要JDK的支持),但OpenJDK往往不能满足我们的需求,因此我们需要卸载该JDK,重装oracle提供的JDK。使用命令 java-version 查看本机已存在的JDK信息,出现如下信息java version "1.7.0_45"OpenJDK Runtime EnvironmentOpenJDK 32-

2013-11-21 21:26:06 1328

原创 JDBC入门

JDBC即Java DataBase Connectivity,是SUN公司为了使JAVA程序灵活的访问各种不同的关系型数据库而提供的规则。使用JDBC能够降低JAVA操作数据库的难度和复杂度,并且使得JAVA程序能够灵活的进行移植。JDBC的体系结构如下图所示。JDBC是一个标准的数据访问接口,能够访问各种不同的关系型数据库,它是一套类和接口,是Java的一部分。通过JDBC可以屏蔽

2013-11-18 19:58:49 1475

原创 Mysql安装入门使用指南

MySQL是一个开源的关系数据库系统,Mysql分为商业版和社区版。通常我们使用社区版。关于Mysql的安装这里不会涉及。这里主要简单说一下MySQL在使用过程中的一些使用技巧。安装好mysql后可以在环境变量的path变量中添加一下mysql主目录下的bin目录的路径,这样就可以通过在CMD中直接使用mysql命令。1)配置好mysql的环境变量后,可以使用如下命令在命令行中进入mysql:

2013-11-17 10:45:53 1319

原创 OWL API简单入门与使用

OWL即网络本体语言,用于对本体进行语义描述。本体即Ontology,可以理解为某一个领域词汇的汇集,即词汇表。OWL的最新版本为2,具体OWL语法知识这里不赘述。本篇博客主要针对OWL API的简单使用进行说明,通过一些例子说明OWL API中核心类的构建与使用。首先需要说明的是OWL API是用JAVA实现的,因此需要掌握相关的JAVA语言开发基础知识才能使用,这里一个相关的开源项目是je

2013-11-10 16:57:21 14454 1

转载 跳跃表

【引言】二叉树是我们都非常熟悉的一种数据结构。它支持包括查找、插入、删除等一系列的操作。但它有一个致命的弱点,就是当数据的随机性不够时,会导致其树型结构的不平衡,从而直接影响到算法的效率。跳跃表(Skip List)是1987年才诞生的一种崭新的数据结构,它在进行查找、插入、删除等操作时的期望时间复杂度均为O(logn),有着近乎替代平衡树的本领。 而且最重要的一点,就是它的编程复杂度

2013-11-08 16:28:04 891

原创 浅谈jsoup网页抓取技术

最近初步接触HTML的页面抓取技术,之前曾涉及较多的是XML解析,对于XML解析方法非常的多,使用dom4j是最方便的。HTML解析似乎用途会更多一些,对于HTML的页面解析却也不甚了解。查了一些资料,了解到了jsoup页面解析技术,jsoup是一款java的HTML解析器,可以直接解析某个URL地址、HTML文本内容,它提供了一套非常省力的API,可通过DOM,CSS以及类似于jquery的操作

2013-10-21 17:14:46 2290

原创 浅谈MVC

晓风well  http://blog.csdn.net/tao_sun题外话,这段时间由于课程密集,课外作业也比较多,关于JAVA这块的学习也比较滞后,想想是越学才知道自己越需要补充什么,好容易进展到WEB部分,但有时想想也不必太深入,因为在学校毕竟还是拓宽知识面更为重要。希望自己能够在一个月内结束WEB开发部分的学习,有个框架性的理解,并能够游刃于一些WEB小项目。因为研一课程学习

2013-10-21 09:13:06 1170 1

原创 基于XML数据库的学生信息管理系统的设计与实现

本项目是在学习之余写的,主要用来练习MVC+DAO的分层设计思想,项目基于一个简单的XML学生数据库,使用XML作为数据库的原因是其十分的小巧与方便,使用dom4j即可进行方便的解析。因为这段时间课程一直比较密集,在Java相关内容的学习上比较滞后。希望用这个小项目来练一练久矣不写代码的手,也作为研一一个月来的学习小结吧。不废话了,具体内容如下:项目说明:本项目提供简单的用户界面(

2013-10-12 16:43:19 4275

原创 使用Protégé修改RDF文件并生成OWL文件

1. Protégé简介及作业说明简介:由斯坦福大学医学院基于Java语言开发的本体编辑和知识获取软件,它是一个开源软件。Protégé提供了本地概念累,关系,属性和实例的构建,并且屏蔽了具体的本体描述语言,用户只需要在概念层次进行领域本地模型的构建。 作业说明:使用Protégé修改使用D2R导出的RDF文件,添加domain,range, subClassOf, 谓词逻辑等操作。

2013-10-12 15:34:59 9547

原创 使用dom4j解析xml文件,并封装为javabean对象

dom4j是一个java的XML api,性能优异、功能强大、易于使用。这里使用dom4j对xml文件进行解析,并完成对文件的封装。实现对xml文件的解析,主要使用到的是dom4j中的SAXReader类,该类的使用方法如下: SAXReader 类 //构造SAXReader SAXReader sr = new SAXReader(); //加载文件

2013-10-08 21:53:34 6249

原创 从MongoDB说起

近日MongoDB宣布完成新一轮1.5亿美元融资,投资者包括EMC、Salesforce.com、英特尔、Red Hat以及Altimeter Capital等投资机构。作为当今最流行的NoSQL数据库,MongoDB被广泛应用于web和移动应用领域,从初创公司到大型行业企业都有MongoDB的影子。随着互联网web2.0网站的兴起,传统的关系数据库在应付web2.0网站,特别是超大规模和

2013-10-05 15:05:20 1192

原创 汉诺塔问题的算法分析与实现(Java)

汉诺塔问题是源于印度一个古老传说的益智玩具。要求将圆盘从A柱移动到C柱规定,在小圆盘上不能放大圆盘,在三根柱子之间一次只能移动一个圆盘。可以先通过3个盘子的hanoi游戏得出其算法步骤如下:if n=1 , 直接将圆盘移到c棒if n>1 , 将A棒上的n-1个圆盘移到B棒上将A棒上的1个圆盘移到C棒上将B棒上的n-1个圆盘移到C棒上(图:3

2013-10-05 11:39:29 1604

原创 Linux下安装Java开发环境及Eclipse

准备工作:1)uname -a 命令查看系统版本,确定是 X86 还是 X86_642)去Oracle官网下载最新的JDK版本(相应的RPM包),这里下载的是 jdk1.7.0_403)su - 命令切换到root用户安装开始:1)这里假设下载文件放在Downloads文件夹中2)cp jdk-7u40-linux-x64.rpm /usr/local3)cd /u

2013-10-02 20:06:41 1092

原创 Stack & Heap in Java

Stack and Heap 都是Java用来在RAM中存放数据的地方。Java自动管理堆和栈,用户不能直接的设置堆或栈。Stack:存在于栈中的数据,其大小与生存周期是确定的,栈中的数据可以共享Heap:可以动态的分配内存大小,无需事先通知编译器生存周期,堆中的数据亦由Java的垃圾回收器不定期回收Integer a = new Integer(10);new 语句告诉编

2013-09-30 20:05:09 997

原创 XML Schema学习小结

因为学习Sematic Web的原因接触RDF,RDF的学习又涉及到了XML Schema,因此这里复习了一下XML Schema。-- 引入目的是克服XML DTD的局限性,并且XML Schema是W3C的正式标准特点:1)XML Schema本身也是一种XML文档2)由于特点(1),XML Schema可以用DOM\SAX\JDOM等XML API来解析其中的内容3)

2013-09-28 19:28:20 1554

原创 Java集合简单回顾总结

如图,Java集合框架如上所示,虚线框为接口,实线框为派生类。引入集合的原因是数组(Array)只能是固定大小的,在声明时必须说明其大小,并且一次分配,不能动态增长。Collection的派生接口大致分为 Map(键值对)\List(允许存在重复元素)\Set(不允许存在重复元素)\Queue等。(具体参见上面这个简单的图和Java API)List接口:定义List的两大用处

2013-09-25 21:57:11 965

原创 From Ontology to Semantic Web

Ontology(本体论)用于描述事物的本质(Gruber,1995)。这个词在人工智能、计算机语言以及数据库理论中扮演者越来越重要的作用。在实现上,本体论是概念化的详细说明,一个ontology往往就是一个正式的词汇表,其核心作用就在于定义某一领域或领域内的专业词汇以及他们之间的关系。在这一系列概念的支持下,知识的搜索、积累和共享的效率将大大提高,真正意义上的知识重用和共享也成为可能。就此意义而

2013-09-15 15:59:42 1253

原创 [Homework]Packet switching versus circuit switching

Following is the key in detail, i just implemented it in java:import java.text.DecimalFormat;public class test { public static void main(String[] args) { double sumP = 0.0; for (int i = 1

2013-09-10 22:24:06 1671

原创 使用EditPlus搭建Java开发环境

1)工具栏点击 工具->配置用户工具2)点击 组名 改名为 编译运行java3)点击 添加工具-选择应用程序菜单文字 编译Java命令 javac参数 选择 文件名初始目录 选择 文件目录动作 选择 捕捉输出4)点击 添加工具-选择应用程序菜单文字 运行java命令 java参数 文件名不含扩展名初始目录 选择 文件目录动作 选择 捕捉输出5

2013-09-09 10:07:58 925

原创 南邮本部宿舍上网IP设置方法

虽然已经毕业离开南邮了,但整理文件的时候还是发现了一些曾经的回忆。本部宿舍上网IP的设置方法如下,供学弟学妹们使用吧。

2013-09-03 17:39:27 3778

原创 使用Word对段落按照字母顺序进行排序

在写essay时,常要对references进行按字母排序。当源过多时,可以使用以下方式对references进行排序(1)选中需要排序的段落(2)插入-表格-将文本转换成表格(3)选中表格,在表格的格式选项中单击“排序A-Z”图标(4)仍然在表格的格式选项中,将表格转换为文本

2013-08-23 18:41:36 4545

原创 HTTP协议复习总结

1.基本概念HTTP协议,即超文本传输协议。用于定义客户端与Web服务器间的数据交换的格式。属于TCP/IP协议的应用层协议。2.协议版本HTTP/1.0(断开连接)客户端与web服务器建立连接后,只能获得一次web资源HTTP/1.1(保持连接)允许客户端与web服务器建立连接后,在一次连接中获取多个web资源3.HTTP请求(request)一个完整的HTT

2013-06-04 17:26:14 922

原创 tomcat学习笔记

1.web服务器的分类开源:apache、tomcat商用:weblogic 、 webshpere2.tomcat简介tomcat是apache组织的jakarta项目中的一个重要子项目,它是sun公司推荐的运行servlet和jsp的容器(引擎),其源代码是完全公开的。tomcat完全是用java写成的,使用前必须安装合适的JDK版本。tomcat具有web服务器的基本

2013-06-03 10:06:11 1267

原创 JAXP学习总结

1.JAXP简介和DOM一样,都是一种XML解析技术。JAXP开发包是JavaSE的一部分在javax.xml.parsers包中,定义了几个工厂类,通过调用这些工厂类,可以得到对XML文档进行解析的DOM或SAX的解析器对象2.SAX解析的特点不同于DOM解析,SAX无需加载整个XML文档,即在读取文档的时候便对文档进行处理SAX采用事件处理的方式解析XML文件,利用SAX解

2013-06-01 18:07:13 1250

原创 java编程练习:基于XML配置文件,解析,反射,运行程序

有如下Person类“package web.java.xml.exercise2;public class Person { public void run(String who){ System.out.println("Person::run():" + who); } public void jump(String who){ System.out.println(

2013-06-01 10:21:02 1350

原创 Java编程练习:使用分层结构,基于XML文件,实现模拟用户登录

有如下XML文件 user.xml,里面存放的是用户登录信息。 分层设计思想如下:表现层:LoginUI::input():User    LoginUI::output():String业务层:LoginBusiness::check(User):boolean 根据上面的要求,写出程序:(1)编写User类package web.java.xml

2013-06-01 10:08:57 1236

原创 Java Dao工厂设计模式

这里简要说明Java中的分层设计思想。如下图所示:将功能的实现分在两层进行,访问层和业务层。(1)设计IDao接口package web.java.xml.model;public interface IDao { public void create();}(2)设计接口实现类DaoJdbcpackage web.java.xml.model;public cl

2013-06-01 09:42:35 3712

原创 浅谈Xpath

1.Xpath简介XPath是一门在XML文档中查找信息的语言。利用XPath可以对XML文档进行元素和属性的遍历。2.包的导入(1)导入dom4j.jar包,并build path(2)导入dom4j/lib 中的 jaxen.jar包,并build path3.Demo下面的代码直接读取了price元素(car.xml)//使用xpath技术取得xml文件中任意级别

2013-05-31 17:07:09 799

Twitter storm

a workshop for twitter storm

2015-09-22

2013百度数据挖掘工程师面试题

2013百度数据挖掘工程师面试题,运用机器学习、数据挖掘技术判别海量文件的安全性,提高文件识别的准确率和自动化程度。

2014-02-25

Android应用开发揭秘PDF

Android应用开发揭秘PDF,入门最佳资料

2013-05-04

百度2013年面试题

百度2013年移动开发岗位面试题(南京)

2013-10-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除