自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 判断文章内容重复率的算法实现

需求背景: http://3g.k.sohu.com/t/n384943815,如这篇搜狐新闻,内容存在明显重复,那为了保障线上文章质量,我们需要对文章段落进行判重。于是我们需要一个判重的逻辑和标准算法逻辑: 获取文章段落,根据换行符\r、\n、<br/>、</br>进行分割,再循环段落,逐一与下一个段落进行比较,计算段落间的重复率(计算两字符间...

2019-09-04 11:54:41 4794 1

原创 某服务器CPU使用率达到99%,排查是哪个程序哪个线程导致的高CPU

思路:1、先找到耗CPU高的进程;2、找到耗CPU高的线程;3、找到耗CPU高的线程对应的业务代码;操作:1.1、执行“top -c”命令,显示进程运行信息列表,键入大写P,按CPU使用率降序排列:1.2、获取到进程PID为10765的进程,使用CPU资源最高19.9%;至此,已找到耗CPU最高的进程,进程PID为10765,后续命令中需要使用到。2.1、...

2019-08-13 17:50:44 2261

原创 某java应用大量消耗内存,导致频繁FullGC怎么处理

思路:1、什么对象消耗内存最大;2、是否创建了太多的线程;3、新生的、老年代现在内存使用情况,确认是不是整体内存分配太小了;4、实时查看新生的、老年代内存使用情况,GC情况5、代码层检查,是否有大对象创建?需要调用close()或dispose()来回收的资源是否回收了?操作:1、执行“jmap -histo:live 10765 | more”命令,以表格的方式...

2019-08-13 17:46:05 1952 1

原创 记录一次日志打印错误,日期错乱的排坑过程

现象:本地日志配置采用log4j,配置文件如下:正常日志打印应该是:今天info日志打在server.log里,到第二天,假如是2019-07-30,昨天的日志应该重命名为server.log.2019-07-29,今天日志照常打印在server.log里然而,诡异的是,2019-07-30当天的线上日志打印在了2019-07-29,而2019-07-29日的日志归档到了serve...

2019-07-31 16:08:20 1797 2

转载 JAVA反射机制实例教程

本文以实例形式详细讲述了Java的反射机制,是Java程序设计中重要的技巧。分享给大家供大家参考。具体分析如下:首先,Reflection是Java 程序开发语言的特征之一,它允许运行中的 Java 程序对自身进行检查,或者说"自审",并能直接操作程序的内部属性。例如,使用它能获得 Java 类中各成员的名称并显示出来。 Java 的这一能力在实际应用中也许用得不是很多,但是在其它的程序设计语

2015-11-28 15:58:49 220

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除