自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

everlasting_188-java从业者

朝花夕拾,关注数据库,Java、大数据和互联网金融

  • 博客(310)
  • 收藏
  • 关注

原创 centos上 java使用Tesseract进行ocr识别

tesseract-ocr在centos的简单使用

2017-09-05 16:56:25 1440

原创 数据仓库相关开源技术

数据分析平台相关开源技术一览表

2017-08-22 22:45:06 1000

原创 统计学习方法读书笔记-概论

李航统计学习概论学习笔记

2017-08-02 15:19:27 462

转载 在自然语言处理中(NLP),如何对特征进行有效的降维?

特征降纬方法,包括:词袋模型、维度选择方法、主题模型和神经网络的一些基本处理思路

2017-08-01 14:38:58 3704

原创 分布式系统的故障治理

分布式系统的故障治理和消息跟踪自己的个人理解。

2017-07-26 10:23:18 1155

原创 诚品书店创始人语录

活在当今社会,假使没有一点文学和艺术的涵养,日子是很难从容过下去的。生命终究是我们最重要的关口,而不是生意和钱。

2017-07-21 10:51:03 782

原创 消息队列常见问题

死信队列和回退队列以及大致的处理流程

2017-07-19 15:28:19 3041 1

原创 微服务设计读书笔记

微服务架构设计中的一些主要观点的摘要

2017-07-18 16:25:26 395

原创 Java 中文字符判断

java判断是否是中文字符,并且去除掉相关标点符号。

2017-07-13 17:28:31 2107

原创 评价一个事物的好坏方法学

首先的要理解事物的核心概念,然后是核心概念的关键指标,然后是关键指标的当前发展水平,最后进行评价。

2017-07-09 12:15:11 1178

转载 如何从低水平的重复,到高质量的勤奋

成功需要人们持续不断地尝试那些刚好超出当前能力范围的事情,付出近乎最大限度的努力。如果你从来不迫使自己走出舒适区,便永远无法进步。

2017-07-05 17:24:24 756 1

原创 linux优化工具大全

引用Brendan Gregg.绘制的一张图,相当详细

2017-06-30 17:51:13 944

原创 linux优化相关的系统工具系列-综述

环境: centos 7 一、CentOS 安装 debuginfo-install 安装debuginfo相关的包步骤如下: 1、 修改文件/etc/yum.repos.d/CentOS-Debuginfo.repo中的enabled参数,将其值修改为1 2、 使用命令: yum install nss-softokn-debuginfo –nogpgcheck yum

2017-06-19 17:40:13 475

原创 2017年中感悟

每一个优秀的人,都有一段沉默的时光。那一段时光,是付出了很多努力,忍受了很多的孤独和寂寞,不抱怨不诉苦,只有自己知道。而当日后说起时,连自己都能被感动的日子。                                    ——《给自己的信》

2017-05-26 21:42:00 367

原创 如何基于DNS进行二个机房的数据中心切换

基于DNS的数据中心切换的简单可行的方案

2017-05-11 23:57:47 4880

原创 jvm中的栈

java中的线程栈分析

2017-05-01 22:50:24 899

原创 JVM结构和调优总结

JVM结构,GC,JMM和一些简单的调优事项.

2017-04-28 15:48:29 525

原创 linux上jni调用注意事项

jni开发中调用第三方linux下so的注意事项

2017-04-24 18:37:02 684

原创 最近全栈关注的项目

最近使用到的相关的技术 1、性能测试: 基准性能测试:sysbench 性能测试工具: jmeter 分布式服务跟踪:Dapper 2、单元测试: testng 3、监控: 监控工具:zabbix 监控图表绘制: echart 4、部署工具:asible 5、资源管理:  mesos+Marathon(mesos的framework) 6、框架: spring boot(需要

2017-04-14 09:11:08 500

原创 写论文感悟

文献检索、文献跟踪、论文排版的一些有意义的文章汇总

2017-04-12 16:18:31 1216

原创 一次现网java服务的故障处理

接到报警,发现已经不能从redis读取数据,后台日志发现线程池占满,然后进行处理,现网重启,重启脚本dump出相关的现场日志。   分析: 1、查看free的输出信息,发现正常 2、查看gc的输出和heap的输出,也很正常 3、查看netstat的tcp连接,发现连接一个服务地址A连接特别多,怀疑这个上面有问题 4、查看jstack的输出,发现服务地址A上请求的线程都处于RUNNABL

2017-04-05 17:53:44 515

原创 违约概率和违约损失率

违约概率和违约损失率关系

2017-03-29 22:04:20 16002

原创 国足赢了

小伙子们真是棒啊!!早用里皮大爷的话,说不定出线真有戏,不过出不出线,干掉棒子是好样的。

2017-03-23 21:35:19 336

转载 利用GBDT模型构造新特征

利用GBDT模型构造新特征

2017-03-14 19:33:54 829 1

原创 大规模文件删除的策略老

关于过期文件删除处理:a)写文件的时候记录相关的日志,日志文件格式为:文件ID(这个时间上是分布式文件的ID);时间戳b)使用日志文件删除策略如下:1、读取一条记录,根据当前的ID读取fastDts中的文件,判断时间戳,如果满足有效期,删除;要不的话不变2、如果日志不集中,每个服务器上都按照这个策略来处理也没有问题c)可以采用日志集中框架:Facebook Scribe ; f

2017-03-13 18:47:45 569

原创 jetty中禁止使用chunked传输数据

Slow transfers in Jetty with chunked transfer encoding at certain buffer sizeIt seems that to get good performance with Jetty, you must either:When calling setContentLength (no chunked transfer e

2017-03-13 18:47:39 704

原创 C++11的特性

转:http://www.cnblogs.com/pzhfei/archive/2013/03/02/CPP_new_feature.html#section_6.4   C++11标准发布已有一段时间了, 维基百科上有对C++11新标准的变化和C++11新特性介绍的文章. 我是一名C++程序员,非常想了解一下C++11. 英文版的维基百科看起来非常费劲,而中文版维基百科不是知道是台湾还是

2017-03-13 18:47:32 486

原创 LB和LA

观点1:1. ha lb 软件的优点与缺点?两个本来就不是一路的,应该不好比较优缺点。从目的上来说:ha的目的是不中断服务,lb的目的是为了提高接入能力,虽然经常放一起用,但确实是两个不同的领域。从手段上来说:HA是有备胎;LB大型货车的一轴四胎。从功能上来说:HA在一条路不通的时候提供另一条路可走;LB是春运时的多个窗口。从包含关系上说:HA不一定提供LB;但LB或多或少有点HA。2.还有什

2017-03-13 18:47:26 562

原创 Spring中如何设置boolean属性

几个要点:配置文件 ftp.started=false类://是否启动ftp任务private boolean ftpStarted;public String isFtpStarted() { return ""+ftpStarted;}public void setFtpStarted(String ftpStarted) { if (ftpStarted.equals

2017-03-13 18:47:19 4761

原创 httpclient访问restful

转:http://howtodoinjava.com/2013/05/21/jax-rs-restful-client-using-apache-httpclient/ JAX-RS RESTful client using apache httpclient public static void demoPostRESTAPI() throws Exception{

2017-03-13 18:47:13 332

原创 linux下mysql相关目录

见:http://hehaibo.iteye.com/blog/465534

2017-03-13 18:47:02 287

原创 软件测试每日集成

冒烟测试:只针对bug进行测试,存在的问题是覆盖率低一点。 构建工具一般要解决的问题:1>和版本管理工具比较好集成2>支持各种编译工具3>构建过程发生错误容易查看4>构建错误可以发送到相关开发人  每日构建工具:R2build  http://sourceforge.net/projects/r2build/ Java相关的   常用的工具有

2017-03-13 18:46:56 431

原创 数据库版本管理

数据库版本管理包括这么几个方面:1、好的数据库版本管理工具的支持2、不依赖于具体RDMS数据库的自己的数据字典3、可以查看到当前数据库scheme的版本,版本好应该是经过加密的,不能手动更改的  其实最简单的数据库版本管理工具可以这么做:1>脚本结构       a)基础版本a                  基本版本a上上修订记录       b)基础版

2017-03-13 18:46:49 890

原创 POI中增加image

引用:http://poi.apache.org/spreadsheet/quick-guide.html#Images Images are part of the drawing support. To add an image just call createPicture() on the drawing patriarch. At the time of writing the

2017-03-13 18:46:44 1037

原创 面型对象软件架构文档SAD的基本形式

面型对象软件架构文档SAD的基本形式。 其实以下二个关键的还要包括:1、用例视图和一些关键用例的序列图2、关键类和其他类的序列图 大小: 28.9 KB 查看图片附件

2017-03-13 18:46:36 1967

原创 MP4文件分析

[size=large]研究ISO_IEC 14496-12_2005(E),学习MP4文件格式,Media Data Box:A container box which can hold the actual media data for a presentation (‘mdat’).其实所有的元数据都为了索引MDAT中的视频和规定视频中的解码参数。time-to-sample,时间到采样,s

2017-03-13 18:46:30 351

原创 沟通效率问题

最近在聊天工具上沟通,大家都火气很大。忽然觉得聊天工具沟通其实效率挺低的,如果有一个逻辑不太清晰的,一个问题基本上要倒腾个把个小时。无关乎外企,研发基本上不参与到现网的支持中,消耗太大了。提高效率二种方式:要不华为,现场开发,要不就是研发和支撑单独的二条线。

2017-03-13 18:46:23 377

原创 tf-idf原理

TF-IDF=TF(词在文章中出现次数/总词数) * IDF(lg(总文件数/出现词的文章总数)),描述了词在文章中是否重要。

2017-03-13 18:46:17 350

原创 Vision中定制图形

http://office.microsoft.com/zh-cn/visio-help/HP010378145.aspx#_Toc243908558http://www.cnblogs.com/wuhuacong/archive/2012/02/24/2365604.html这二篇文章不错

2017-03-13 18:46:09 294

原创 关联度和支持度

支持度和置信度总是伴随着关联规则存在的,它们是对关联规则的必要的补充。对某条关联规则而言,如 A -> B (support=30%, confidence= 60%)其中的support=30%是说,在所有的事务中同时出现A和B的概率。而,confidence=60%是说,所有事务中,在出现A的情况下出现B的概率,即条件概率。总体来说就是支持度A和B占总体样本的概率,置信度出现A情况下

2017-03-13 18:46:03 639

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除