自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(140)
  • 资源 (7)
  • 收藏
  • 关注

原创 hive表信息查询:查看表结构、表操作、建表语句

问题导读:1.如何查看hive表结构?2.如何查看表结构信息?3.如何查看分区信息?4.哪个命令可以模糊搜索表28.怎么查询创建表语句1.hive模糊搜索表  show tables like '*name*';2.查看表结构信息  desc formatted table_name;  desc table_name;3.查看分

2017-07-24 18:38:42 12029

转载 linux zip/unzip

转自 : http://www.cnblogs.com/lucyjiayou/archive/2011/12/25/2301046.html功能说明:压缩文件。语  法:zip [-AcdDfFghjJKlLmoqrSTuvVwXyz$][-b ][-ll][-n ][-t ][-][压 缩文件][文件...][-i ][-x ]补充说明:zip是个使用广泛的压缩程序,文件

2017-07-24 18:31:20 404

翻译 Programming with ZooKeeper - A basic tutorial

ZooKeeper Barrier Queue 队列

2016-01-10 23:23:24 673

翻译 ZooKeeper Java Example

zookeeper java 样例

2016-01-10 19:13:08 1153

原创 网址

nutch 网址 http://www.cnblogs.com/xia520pi/p/3615550.html

2015-08-17 18:25:31 500

原创 hadoop配置相关前置修改

1.修改主机名称[root@centos ~]# vim /etc/sysconfig/network打开文件,修改以下内容并保存  NETWORKING=yes      #使用网络  HOSTNAME=centos      #设置主机名称重启后生效然后去修改 /etc/sysconfig/network-script/ifcfg-e

2015-07-15 20:57:01 586

原创 java 对象的创建

1,虚拟机遇到一条new指令首先将去检查这个指令的参数是否能在常量池中定义到一个类的符号引用。2,并且检查这个符号引用代表的类是否被加载、解析和初始化过。如果没有,那必须先执行相应的类加载过程。3, 类加载检查通过后,虚拟机为新生对象分配内存。在Java堆中划分一块等同类大小的内存。       划分方法:碰撞指针或空闲列表法。4,如果解决多线程情况下的对象创建问题。(TLAB,T

2015-03-17 11:32:08 453

转载 eclipse导入工程后无法加入tomcat

到工程的文件夹(工作空间里),如Work Space\test\.settings\org.eclipse.wst.common.project.facet.core.xml打开这个文件,XML/HTML code?123456789xml version="1.0" encoding="UTF-8"?>fac

2014-10-19 23:15:33 6148

转载 log4j配置

log4j是一个非常强大的log记录软件,下面我们就来看看在项目中如何使log4j。 首先当然是得到log4j的jar档,推荐使用1.2.X版,下载地址:http://logging.apache.org/log4j/1.2/download.html 我们先看一个最简单的示例:【示例1】项目结构:【注:由于这里的多个项目公用一个jar档,我们可以创建一个专

2014-10-09 15:15:06 520

原创 spring3 定时器 时间配置

cronExpression表达式:字段 允许值 允许的特殊字符秒 0-59 , - * /分 0-59 , - * /小时 0-23 , - * /日期 1-31 , - * ? / L W C月份 1-12 或者 JAN-DEC , - * /星期 1-7 或者 SUN-SAT , - * ? / L C #年(可选) 留空, 1970-2099 , - * /

2014-07-31 18:56:03 709

原创 潜在语义分析Latent semantic analysis note(LSA)原理及代码实现

Latent Semantic Analysis (LSA)也被叫做Latent Semantic Indexing(LSI),从字面上的意思理解就是通过分析文档去发现这些文档中潜在的意思和概念。假设每个词仅表示一个概念,并且每个概念仅仅被一个词所描述,LSA将非常简单(从词到概念存在一个简单的映射关系)不幸的是,这个问题并没有如此简单,因为存在不同的词表示同一个意思(同义词),一个词表示多个

2014-06-13 16:40:24 17156 9

原创 java 使用htmlunit模拟登录爬取新浪微博页面

import java.io.IOException;import java.net.MalformedURLException;import com.gargoylesoftware.htmlunit.BrowserVersion;import com.gargoylesoftware.htmlunit.FailingHttpStatusCodeException;import

2014-06-09 16:34:24 16773 8

转载 张瑞敏:人不成熟的六大特征

人不成熟的六大特征:立即要回报;不自律;经常被情绪左右;不愿学习,自以为是,没有归零心态;做事情靠直觉,不以事实为根据;做事情不靠信念,靠人言。只要你相信你自己能够战胜自己的不成熟,你就会逐渐的成长、成熟起来,你就会得到你想要的那种生活,你就会实现你时间自由、财务自由、精神自由的人生梦想! 人成熟与不成熟跟年龄没有关系,人成熟不成熟,就是你能不能站在对方的角度去看待事物,就是能不能

2014-06-06 16:27:43 1626

转载 Java 解决采集UTF-8网页空格变成问号乱码

昨天发现,用 HtmlDecode() 去解码后,“ ”不是被解码为半角的空格(ASCII码0x20)而是变成半角问号“?”(ASCII码0x3F)。而且奇怪的是,只有每行前面的空格才会出问题,如果前面后面有汉字的话,空格就还是空格。但是更加奇怪的是,如果直接在HtmlDecode()的后面直接加上trim()的话,这个问号会被去掉。而正常的情况下,问号是不会被去掉的,只有空格才会被去掉

2014-05-26 17:43:54 14028 4

转载 svm 入门

发表于 2009-11-5 11:06:29|只看作者Arguments 前面提到,在 train 的时候可以下一些参数。 ( 直接执行 svm-train 不指定输入档与参数会列出所有参数及语法说明 ) 这些参数对应到原始 SVM 公式的一些参数,所以会影响 predict 的正确与否。举例来说,改个 c=10: ./svm-train -c 10 heart_sca

2014-04-20 20:38:05 709

原创 爬虫相关网站

开源爬虫调研http://blog.sina.com.cn/s/blog_6d0b92d90100w6p7.html正文抽取算法http://wenku.baidu.com/link?url=U07Qfde4TZE52Oa1aQF71GI_vyauyfRmgakWHp2CcQM1n8EyBpZnnU6sm4qcqiIOi_cApIwSxIVieMDRTskSjYmyAJSBUB

2014-03-25 17:24:07 529

原创 推荐系统

推荐系统评测指标1、用户满意度2、预测准确度评分指标TopN推荐覆盖率(准确率、召回率曲线)覆盖率衡量函数(信息熵,基尼系数)多样性新颖性 (用户是否听说过这个结果)惊喜度(如果推荐结果和用户的历史兴趣不相似,但却让用户觉得满意,那么就可以说推荐结果的惊喜度高)信任度实时性健壮性(尽量使用代价比较高的用户行为)离线优化指标

2014-03-23 17:02:25 795

原创 js 调用天气预报webservice

控制台运行结果:  黑龙江,3113  吉林,3114  辽宁,3115  内蒙古,3116  河北,3117  河南,3118  山东,3119  山西,31110  江苏,31111  安徽,31112  陕西,31113  宁夏,31114  甘肃,31115  青海,31116  湖北,31117  湖南,31118

2014-03-20 22:44:29 4158 2

原创 spring 事物学习

事物:以可控的方式对数据资源访问的一组操作。四个属性:原子性一致性隔离性持久性事物的家族成员:Resource Manager  RMTransaction Processing Moniter   :管理多个RM之间的协调Transaction MoniterApplication全局事物:整个事物处理过程中有多个RM参与。

2014-03-02 23:22:59 543

转载 solr date时间差8小时解决办法

solr因为时区设置问题,导致正常入索引后的date类型的时间会减少8小时,跟多初学者会为此苦恼,今天我把个人解决的方案给大家说一下,希望能帮助到大家. 方案一:对date类型的时间字段,如果可以的话,可以将solr的时间field的类型改为string类型,这样也就不存在时差的问题了,这个方案是可行的. 方案二:既然知道solr入索引时,时间类型的字段会减少8小时,那么我

2014-02-24 13:29:49 6053 1

转载 svn 服务器搭建

搭建svn服务的方法步骤问题,主要有七个部分 。下面是具体的步骤介绍。一、准备工作1、获取S version服务器程序到官方网站(http://s version.tigris.org/)下载最新的服务器安装程序。目前最新的是1.5版本,具体下载地址 在:http://s version.tigris.org/servlets /ProjectDoc

2014-02-17 14:36:23 552

转载 myeclipse svn插件安装

方法一:在线安装 1.打开HELP->MyEclipse Configuration Center。切换到SoftWare标签页。 2.点击Add Site 打开对话框,在对话框Name输入Svn,URL中输入:http://subclipse.tigris.org/update_1.6.x3.在左边栏中找到Personal Site中找到SVN展开。将Core

2014-02-17 10:41:48 624

转载 windows server 2008做NTP时间服务器

windows server 2008做NTP服务器与H3C网络设备组网首先WINDOWS SERVER 2008默认是关闭NTP服务的,需要通过修改注册表开启方法如下:------------------------------------------------------------------------服务端:    默认情况下,独立服务器WINDOWS SERVER

2014-02-12 11:50:30 38511

转载 Myeclipse的java工程转web工程

修改工程目录下的.project文件普通工程下的该文件内容是:UTF-8"?> xxx org.eclipse.jdt.core.javabuilder org.eclipse.jdt.core.javanature 替换成下面UTF-8"?> Pro com.genuitec.ecli

2014-02-11 11:49:05 689

原创 LingoClusteringAlgorithm 算法

LingoClusteringAlgorithm 继承 ProcessingComponentBase 实现 IProcessingComponentProcessingComponentBase的生命周期有方法:    public void init(IControllerContext context)    {    }    public void b

2013-12-30 13:36:09 681

转载 Apache Commons工具集简介

(转)Apache Commons工具集简介Apache Commons包含了很多开源的工具,用于解决平时编程经常会遇到的问题,减少重复劳动。我选了一些比较常用的项目做简单介绍。文中用了很多网上现成的东西,我只是做了一个汇总整理。一、Commons BeanUtilshttp://jakarta.apache.org/commons/beanutils/index.html说明:针

2013-12-25 16:09:36 543

原创 solr自动补全

http://192.168.10.50:8082/solr/terms?terms.fl=itemdesc&terms.sort=itemdesc&terms.prefix=中国请使用非谷歌浏览器打开,使用谷歌浏览器打开会有转义问题参考http://wiki.apache.org/solr/TermsComponent

2013-12-17 17:18:14 789

转载 solr 层面搜索

转自http://macrochen.iteye.com/blog/1337576solr将以导航为目的的查询结果称为facet. 它并不会修改查询结果信息, 只是在查询结果上根据分类添加了count信息, 然后用户根据count信息做进一步的查询, 比如淘宝的查询列表中, 上面会表示不同的类目相关查询结果的数量.比如搜索数码相机, 在搜索结果栏会根据厂商, 分辨率等维度列出, 这

2013-12-17 17:16:15 1989

原创 第一天、开始编译vlc

准备做一个收录程序,并且是可以转码的程序。目标还还宏大啊!好吧,天才第一步,雀氏纸尿裤。照着下面demo做没有做成功,我真是适合去做测试啊,各种好程序到我手里必须经过好多关才能正常运行。我先安装一个vlc,先从一点小成功做起,呵呵!安装一个总不能出错吧,呵呵!1. 到 http://www.videolan.org/vlc/download-sources.html 下载最新的

2013-09-02 23:58:46 623

原创 VC++的工程文件说明

dsw, aps, clw, plg这些文件都可以删除。只保留 H,C,CPP,DSP,RC,剩余文件去除只读属性,其余全部删除。然后打开DSP 有提示选 YES,就可以了。    *.dsp(DeveloperStudio Project):是VC++的工程配置文件,比如说你的工程包含哪个文件,你的编译选项是什么等等,编译的时候是按照.dsp的配置来的。    *.dsw(Develop

2013-08-26 15:43:09 673

转载 查看sqlserver被锁的表以及如何解锁

查看sqlserver被锁的表以及如何解锁 查看被锁表:  www.2cto.com  select   request_session_id   spid,OBJECT_NAME(resource_associated_entity_id) tableName   from   sys.dm_tran_locks where resource_type='OBJECT' 

2013-08-06 23:04:51 435

原创 xml 选取指定节点

使用dom4j读取xml'时,当需要根据路径读取时,需要使用jaxen-1.1-beta-6.jar,        File f = new File("B://workplace//InterfaceSystem//src//com//tmzs//xml//编目信息.xml");        FileReader fr = new FileReader(f);    

2013-07-10 21:01:29 1180

原创 Axis 1.4 使用指南

根据wsdl开成webservice的java客户 例子:1、执行以下命令生成客户端代码Java -Djava.ext.dirs=lib org.apache.axis.wsdl.WSDL2Java http://localhost:8080/axis/Hello.jws?wsdl  该命令的参数格式从最简单的开始 ,-uri 指定wsdl文件> WSDL2Java -ur

2013-07-06 21:14:38 2054

原创 朴素贝叶斯算法

贝叶斯定理由英国数学家贝叶斯 ( Thomas Bayes 1702-1763 ) 发展,用来描述两个条件概率之间的关系,比如 P(A|B) 和 P(B|A)。按照乘法法则:P(A∩B)=P(A)*P(B|A)=P(B)*P(A|B),可以立刻导出贝叶斯定理公式:P(A|B)=P(B|A)*P(A)/P(B)如上公式也可变形为:P(B|A)=P(A|B)*P(B)/P(A)

2013-06-06 23:30:36 681

转载 Heritrix配置

转自http://yourlei.blog.sohu.com/111046417.html自己上班搞了2年多的蜘蛛和采集,只是一直是使用自己的程序,今天抽时间想看看其他蜘蛛的情况,于是下载了heritrix-1.14.2。搜索了一下相关的安装介绍。基本步骤如下:    (1)解压下载的heritrix-1.14.2.zip的压缩包,如将其放在E:\datasource\heritrix

2013-05-27 00:20:32 594

转载 JNDI全攻略(一)

关键字:JNDI,J2EE,Java,命名和目录接口,Java Naming and Directory Interface摘要:本文详细介绍了JNDI的架构与实现,JNDI的工作原理,并给出了具体代码,帮助读者更理解J2EE主要常用技术---JNDI.本文为系列文章的第一篇,其它相关文章会在近期推出。 名词解释    jndi是Java 命名和目录接口(J

2013-04-11 20:54:10 528

原创 RPC 远程过程调用

为一个进程访问其他进程服务的能力。这些进程往往处于不同的计算机。RPC是一种客户机/服务器形式的服务,一个客户机进程可以执行另一台计算机上的进程,向这个进程提供数据,获取这个进程运行的结果。

2013-04-11 15:56:10 500

转载 eclipse生成jar包

http://www.cnblogs.com/lan0725/archive/2008/08/28/1873947.html第一:普通类导出jar包,我说的普通类就是指此类包含main方法,并且没有用到别的jar包。 1.在eclipse中选择你要导出的类或者package,右击,选择Export子选项; 2.在弹出的对话框中,选择java文件---选择JAR file,单

2013-04-03 15:28:32 459

原创 ubuntu 10.04安装gcc-c++

apt-get install build-essential

2013-03-29 23:15:31 3419

原创 Ubuntu linux安装ssh server

sudo apt-get install openssh-server如果报 “Couldn't find package”sudo gedit /etc/apt/sources.list添加: www.2cto.com   修改了sources.list要sudo apt-get upgrade一下.自动启动 ( 好像安装后默认地已经以openssh-daem

2013-03-29 22:23:05 675

javascript编程入门到精通

javascript编程入门到精通,一本不错的书。

2013-02-03

c经典100例

c语言经典的100个例子,有问题描述以及详细的注释,很不错。0分贡献给大家。

2013-02-03

Natural.Language.Processing.with.Python

Natural Language Processing with Python,一本不错的学习nlp和phthon的书。英文版,但简单易懂。刚刚得到,分享给大家。

2012-03-10

A_Practical_Guide_to_Ubuntu_Linux.pdf

A_Practical_Guide_to_Ubuntu_Linux.pdf

2011-10-30

C++课程设计课后习题集

C++课程设计课后习题集

2007-11-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除