自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(46)
  • 收藏
  • 关注

原创 Vim批量注释--记录

Vim批量注释方法一ctrl+v 进入列编辑模式,向下或向上移动光标,把需要注释的行的开头标记起来,然后按大写的I(shift+i),再插入注释符,比如"//",再按Esc,就会全部注释了批量去掉注释ctrl+v,进入列编辑模式,横向选中列的个数(如"//"注释符号,需要选中两列),然后按d, 就会删除注释符号方法二使用下面命令在指定的行首添加注释::起始行号,结束行号s...

2014-10-28 20:04:45 207

原创 云----OpenStack的灵魂keystone

   Openstack是一个SOA的架构,理论上各个子项目独立提供相关的服务,互不依赖。例如Nova提供计算服务,Swift提供对象存储服务,Glance提供镜像服务等。但是实际上(至少从Openstack目前开源实现上来看),所有组件都依赖于Keystone提供3A(Account, Authentication, Authorization)服务。除了3A之外,Keystone还对外提供服...

2014-10-09 22:40:15 203

原创 看13位CEO、创始人和高管如何提高工作效率(转)

每个人都想在工作的时候变得更有效率,但这是一个艰巨的任务,因为繁杂的现实生活往往会拖累你。 一些CEO在问答网站Quora上做了很多关于如何提高个人生产力的分享,告诉人们如何把事情做得更有效率。 下面就让我们一起来看看吧! 1. 项目协作与任务管理工具Asana创始人兼CEO、Facebook联合创始人Dustin Moskovitz:星期三无会议 Asana创始人...

2014-09-02 15:04:03 532

原创 Linux系统中查看日志的常用命令

cattail -f查看日志文件:(向曙光朋友学习总结的)/var/log/message 系统启动后的信息和错误日志,是Red Hat Linux中最常用的日志之一/var/log/secure 与安全相关的日志信息/var/log/maillog 与邮件相关的日志信息/var/log/cron 与定时任务相关的日志信息/var/log/spoole...

2014-08-29 12:16:56 208

原创 我激动的一天(续)

今天真的非常激动。为什么激动呢?待续吧。等有时间了一定好好整理整理。 感谢宋老师。谢谢你认可我感谢今天的何老师。谢谢你相信我,也许我今天表现的不好,但是今后看我的实际行动和努力。呵呵感谢另外两位老师(我真的不知道什么名字了,以后肯定会知道,呵呵),真的非常感谢二位对我的第一感觉,以后的日子,可能还要不断地向二位学习,我会用实际行动为咱们团队添加正能量的还要感谢联系我的金同学...

2014-08-25 18:46:47 156

原创 linux 监控命令图谱

今天在查找一个命令时,在网上看到一张图,感觉非常好。就记录下来,以备。 

2014-08-22 14:15:06 174

原创 Linux Shell之sort命令

转自http://www.cnblogs.com/51linux/archive/2012/05/23/2515299.htmlsort是在Linux里非常常用的一个命令,管排序的,集中精力,五分钟搞定sort,现在开始! 1 sort的工作原理sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。[rocr...

2014-07-30 19:39:12 121

原创 数据挖掘-文本分类:特征选择方法总结

一、概念二、特征选择方法总结 一、概念   特征词选择和特征词权重   1.特征词选择:特征词选择是为了降低文本表示的维度,而特征词权重是为了表示文本表示中每一个特征项的重要程度。   常见的且基础的文本特征选择的算法有基于文档频率(DocumentFrequency)、信息增益(InformationGain,IG)、开方拟和检验方法(CHI统计)、互信息(mutua...

2014-07-27 16:02:50 2315

原创 一个IT公司技术总监的职责

转自:http://www.360doc.com/content/11/0601/10/5256932_120902188.shtml 职务名称:技术总监直接上级: 总经理直接下级:技术部经理、质量管理部经理本职工作:负责公司产品开发及质量管理工作工作责任:一、业务职责1、制订并组织实施技术系统工作目标和工作计划。2、组织制订并实施技术系统规章制度和实施细则。3、组织不合格品的审理工作。...

2014-07-26 22:35:18 4921

原创 数据挖掘-机器学习:Kmean聚类思想

一、概述         数据聚类是对于静态数据分析的一门技术,在许多领域内都被广泛地应用,包括机器学习、数据挖掘、模式识别、图像分析、信息检索以及生物信息等。聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集,这样让在同一个子集中的成员对象都有相似的一些属性,常见的包括在坐标系中更加短的空间距离等。         K-means是一种基于距离的迭代式算法[1]。它将n...

2014-07-26 22:18:06 333

原创 数据挖掘-基于dom树的网页属性抽取方法应用

提纲     一、简介     二、应用举例     三、思想     四、实现     五、html-Dom树特征 一、简介       基于Dom树的抽取技术根据html网页所具有的树形层次结构特征来实现html网页中的数据抽取。其系统通常先把html网页结构按照其中的html标签解析成基于Dom树的层次结构,其次通过某种方法把所要抽取的数据定位在Dom树的...

2014-07-26 12:46:43 1178

原创 数据挖掘-基于模板的属性抽取

      信息抽取是一个互联网自然语言处理的一个首要环节,信息抽取的准确度会直接影响到后续的处理。信息抽取的目标是去除噪音,获取网页有价值的信息如网页的标题、时间、正文、链接等信息。      根据工作中的实际应用,下面简单介绍一下基于网页模板的属性抽取方法:       一、模板特征       网页属于半结构化的文本,同一网站中的网页结构往往是固定的,网页中的内容可能随时改变...

2014-07-25 22:04:41 1641 1

原创 文本相似度计算-google的simHash汉明距离

一、概述       针对文本相似性计算,很多开发朋友首先想到的应该是使用向量空间模型VSM(Vector Space Model)。使用VSM计算相似度,先对文本进行分词,然后建立文本向量,把相似度的计算转换成某种特征向量距离的计算,比如余弦角、欧式距离、Jaccard相似系数等。这种方法存在很大一个问题:需要对文本两两进行相似度比较,无法扩展到海量文本的处理。想想像Google这种全网...

2014-07-22 17:27:27 1323

原创 文本相似度计算-编辑距离

一、概念编辑距离:编辑距离,又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。如:将sailn一字转成failing:sailn--->failn:   (s->f)插入,删除sailn--->failin:  (+i)  插入sailn---...

2014-07-20 22:52:06 572

原创 两个常用的测试工具LoadRunner和Jmeter

      最近负责的一个项目,已经上线了,尽管目前用户反馈还算是比较稳定,但是我多少还是有点担心,业务时间,从中了解到两个测试工具:LoadRunner 和 Jmeter,希望能对项目的顺利运行能提供帮助。一,LoadRunner       1.概述       LoadRunner,是一种预测系统行为和性能的负载测试工具。通过以模拟上千万用户实施并发负载及实时性能 监测的方式...

2014-07-20 21:09:29 1814

原创 mongoDB基本命令使用总结

         MongoDB是一个NoSQL数据库系统:一个数据库可以包含多个集合(Collection),每个集合对应于关系数据库中的表;而每个集合中可以存储一组由列标识的记录,列是可以自由定义的,非常灵活,由一组列标识的实体的集合对应于关系数据库表中的行。下面通过熟悉MongoDB的基本管理命令,来了解MongoDB提供的DBMS的基本功能和行为。         引用:http:...

2014-07-18 13:25:23 317

原创 linux下创建无密码登陆

如果项目不是涉密的,如果你管理着N台服务器,就创建无密码登陆吧,步骤如下:1.第一步执行 ssh-keygen –t dsa2.第二步cd /root/.ssh3.第三步cp id_dsa.pub authorized_keys4.第四步创建config文件,添加checkhostip noStricthostkeychecking ...

2014-07-18 10:46:50 149

原创 KMP算法思想及实现

KMP算法是通过分析模式字符串,预先计算每个位置发生不匹配的时候,所需GOTO的下一个比较位置,整理出来一个next数组,然后在上面的算法中使用。 参考一个牛人的文章:http://www.ruanyifeng.com/blog/2013/05/Knuth%E2%80%93Morris%E2%80%93Pratt_algorithm.html 举例说明:有一个字符串"BBC A...

2014-07-17 11:42:09 623

原创 shell中的${},##和%%的意义与使用

假设我们定义了一个变量为:file=/dir1/dir2/dir3/my.file.txt可以用${ }分别替换得到不同的值:${file#*/}:删掉第一个/ 及其左边的字符串:dir1/dir2/dir3/my.file.txt${file##*/}:删掉最后一个/ 及其左边的字符串:my.file.txt${file#*.}:删掉第一个. 及其左边的字符串:fil...

2014-07-16 14:03:44 329

原创 Shell文件操作-实战篇

         下面是关于shell文件操作常用的使用 1.创建文件夹#!/bin/shmkdir -m 777 "%%1"2.创建文件#!/bin/shtouch "%%1"3.删除文件#!/bin/shrm -if "%%1"4.删除文件夹#!/bin/shrm -rf "%%1"5.删除一个目录下所有的文件夹#...

2014-07-16 14:00:34 559 1

原创 Shell的标准输出、标准错误 >/dev/null 2>&1

        在经常写shell脚本时,经常看到:>/dev/null 2>&1        如,        netstat -nlp | grep 9780 | awk '{print $7}' | awk -F "/" '{print $1}' 1>/dev/null 2>/dev/null                      解...

2014-07-16 13:14:05 348

原创 shell中如何判断一个变量是否为空

        为了更高效的工作,还是感觉把每天工作的内容都记录下来,更好。虽然简单,但是以后再遇到的时候,直接拿过来用,来提高效率。        今天帮一个同事写一个检测的脚本,有人问我怎么判断变量为空,记录如下:         1.奇怪的写法。不加双引号" "导致的          #!/bin/sh#filename: example.shpara=i...

2014-07-16 12:33:32 207

原创 tomcat并发优化配置

        在web应用开发中,提升系统性能和并发,除了负载均衡之外,还有就是通过调整参数来优化,以tomcat为例,其他web工具大同小异。          1.让Tomcat6 中支持Java语言的特性 NIO( New I/O)          NIO俗称“非阻塞通讯”,单从名字上看,就给人一种“快”的感觉。         使用NIO在服务器端会有更好的性能,加...

2014-07-14 18:59:45 461

原创 hive 基本使用

      hive是基于hadoop的一个数据仓库工具,可以将结构化的数据文件转化为一个数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。优点是学习成本较低,可以通过类Sql语句实现简单的MapReduce统计,不必开发专门的MapReduce应用程序,非常适合数据统计分析。    学习和总结如下:hive 基本语法创建表 hi...

2014-07-10 21:04:30 157

原创 c++ 实现-基本排序算法

一直以来就很想整理一下基本的算法实现,工作太忙一直没有来得及整理。基本排序算法:   首先:代码实现   一、直接插入排序   二、冒泡排序   三、直接选择排序   四、希尔排序   五、快速排序   六、归并排序   七、堆排序   八、总结    首先:代码实现         1.algorith.h文件           #...

2014-07-06 22:22:23 114

原创 解除 Linux 系统的最大进程数和最大文件打开数限制

ulimit用于shell启动进程所占用的资源1、类别:shell内建命令2、语法格式:ulimit [-acdfHlmnpsStvw] [size]3、参数介绍:-H 设置硬件资源限制.-S 设置软件资源限制.-a 显示当前所有的资源限制.-c size:设置core文件的最大值.单位:blocks-d size:设置数据段的最大值.单位:kbytes...

2014-07-01 20:48:49 566

原创 oracle ORA-01000: maximum open cursors exceeded问题的解决方法

项目在运行过程中,后台报错:                     ORA-01000: maximum open cursors exceededORA-00604: error occurred at recursive SQL level 1ORA-01000: maximum open cursors exceededORA-00604: error occurred...

2014-07-01 16:08:31 664

原创 服务器TIME_WAIT和CLOSE_WAIT区别及解决方案

  系统上线之后,通过如下语句查看服务器时,发现有不少TIME_WAIT和CLOSE_WAIT。 netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}' 打印显示如下:TIME_WAIT 297ESTABLISHED 53CLOSE_WAIT 5      TIME_WAI...

2014-06-29 15:08:17 505

原创 Java NIO原理分析及代码实例

    Java NIO非堵塞应用通常适用用在I/O读写等方面,我们知道,系统运行的性能瓶颈通常在I/O读写,包括对端口和文件的操作上,之前,在打开一个I/O通道后,read()将一直等待在端口一边读取字节内容,如果没有内容进来,read()也是傻傻的等,这会影响我们程序继续做其他事情,那么改进做法就是开设线程,让线程去等待,但是这样做也是相当耗费资源的。Hadoop中的RPC机制中,就采用了ja...

2014-06-28 12:43:53 172

原创 Java垃圾回收机制与引用类型

Java语言的一个重要特性是引入了自动的内存管理机制,使得开发人员不用自己来管理应用中的内存。C/C++开发人员需要通过malloc/free和new/delete等函数来显式的分配和释放内存。这对开发人员提出了比较高的要求,容易造成内存访问错误和内存泄露等问题。一个常见的问题是会产生“悬挂引用(danglingreferences)”,即一个对象引用所指向的内存区块已经被错误的回收并重新分配...

2014-06-24 23:38:37 103

原创 JAVA I/O性能

在应用程序中,通常会涉及到两种类型的计算:CPU计算和I/O计算。对于大多数应用来说,花费在等待I/O上的时间是占较大比重的。通常需要等待速度较 慢的磁盘或是网络连接完成I/O请求,才能继续后面的CPU计算任务。因此提高I/O操作的效率对应用的性能有较大的帮助。本文将介绍Java语言中与I /O操作相关的内容,包括基本的Java I/O和Java NIO,着重于基本概念和最佳实践。流J...

2014-06-24 22:41:56 93

原创 hdfs-ha热备原理

下面的总结来自于:http://dongxicheng.org/hadoop-hdfs/hdfs-ha-federation-deploy/             Hadoop 2.0中的HDFS增加了两个重大特性,HA和Federaion。HA即为High Availability,用于解决NameNode单点故障问题,该特性通过热备的方式为主NameNode提供一个备用者,一旦主N...

2014-06-21 22:43:37 373

原创 面试智力题

这部分的内容取自  http://blog.sina.com.cn/s/blog_604d011e0100ws85.html 1、考虑一个双人游戏。游戏在一个圆桌上进行。每个游戏者都有足够多的硬币。他们需要在桌子上轮流放置硬币,每次必需且只能放置一枚硬币,要求硬币完全置 于桌面内(不能有一部分悬在桌子外面),并且不能与原来放过的硬币重叠。谁没有地方放置新的硬币,谁就输了。游戏的先行者还...

2014-06-21 22:24:14 197

原创 Java IO操作

其实本打算先写一下java 新IO呢,但是为了区分概念,还是先整理下Java IO操作,以例子为主。1.创建新文件 public static void createFile(){ File f=new File("c:\\test.txt"); try{ f.createNewFile(); }catch (Ex...

2014-06-21 18:10:50 108

原创 hadoop-hdfs整体结构剖析

这篇文章,大约在2011年在原来的博客中写的。今天突然看到再写到这篇文章中,就当日记啦。 一:Hadoop整体模块交互      分布式文件系统,思想是,把数据放到一个服务器集群上面,分为:主控服务器Master/NameNode),数据服务器(ChunkServer/DataNode),和客户服务器Client.HDFS和GFS都是按照这个架构模式搭建的。      最核心内...

2014-06-15 16:20:39 187

原创 oracle 常用的查看用户操作

1.查看所有用户:select * from dba_user;select * from all_users;select * from user_users;2.查看用户系统权限:select * from dba_sys_privs;select * from all_sys_privs;select * from user_sys_privs;3....

2014-05-18 13:23:57 456

原创 linux---修改交换空间swap

最近在上线一个我们做的业务系统时,需要安装oracle,发现操作系统的swap设置太小,后来,就把swap虚拟交换空间大小设置成了系统实际内存的2倍。(正常情况下,swap应是实际内存大小的2倍)。步骤如下。 一、决定修改swap大小,首先在空间合适处创建用于分区的swap文件:如/swap1 #dd if=/dev/zero of=/swap1 bs=1M count=2048...

2014-05-17 16:51:52 597

原创 Linux LVM 磁盘管理-----添加新LVM卷

       LVM是 Logical Volume Manager(逻辑卷管理)的简写,它由Heinz Mauelshagen在Linux 2.4内核上实现,目前最新版本为:稳定版1.0.5,开发版 1.1.0-rc2,以及LVM2开发版。      与传统的磁盘与分区相比,LVM为计算机提供了更高层次的磁盘存储。它使系统管理员可以更方便的为应用与用户分配存储空间。在LVM管理下的存储卷...

2014-05-17 16:43:05 254

原创 常见算法+基础常用问题

   这篇文章,在我之前的博客地址中,很早之前写过的(源于从外国的文章中看到的,所以算是转载吧)。今天拿出来,已做备份只用。主要讲解的是:字符串,链表,树,图,排序,递归 vs. 迭代,动态规划,位操作,概率问题,排列组合   使用的开发语言:java(有兴趣的朋友可以用c/c++尝试一下)。   1.字符串和数组应用    首先需要注意的是和C++不同,Java字符串不是char...

2014-03-04 17:37:09 190

原创 oracle--查看表空间大小以及修改表空间大小

问题描述:  1.修改表空间大小  2.查看表空间大小及相关的sql。 今天用户反馈:系统无法访问,通过查看后台信息:报如下错误,截图如下: 从日志信息很明显的看出,表空间满了。于是就从网上搜索设置表空间的方法(因为以前没有怎么使用过oracle管理项目,借此机会,在解决问题的同时,也学习点这方面的知识)。   一.修改表空间大小解决以上问题的办法:通过增大...

2014-02-24 16:55:43 488

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除