自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

everlasting_188-java从业者

朝花夕拾,关注数据库,Java、大数据和互联网金融

  • 博客(310)
  • 收藏
  • 关注

原创 Jboss中RMI穿越防火墙

Jboss中RMI穿越防火墙,RMI有三个端口,一个name服务,一个JNp端口,一个RMIObjectPort,在jboss-service.xml中设置的端口设置对就可以了,切记要全部映射出去      name="jboss:service=Naming"      xmbean-dd="resource:xmdesc/NamingService-xmbean.xml">     

2017-03-13 18:45:56 485

原创 协议工程与编译原理

理论计算机中,形式语言与自动机,离散数学,编译原理,占用了很重要的部分。现实中,很少有一个人会写编译器,实际上应用最多的是复杂的协议中回用。词法和语法分析,协议转换变化使用状态机来进行管理。个人认为编译原理就是计算机中打通任督二脉的理论,算法,操作系统,高级语言,整个结合在一起讲,比较难,但是很有用虽然编译原理很成熟,单是对于一个计算机专业的来说,这个是必修的。apple的llvm带来了第

2017-03-13 18:45:49 338

原创 从互联网技术开计算机热点

互联网是大规模应用,主要是海量数据处理带来的一些编程,基础还是传统的理论,不过很多方面有突破单个节点的技术:1>更快的读,各种缓存产品,从http的缓存到应用缓存2>更快的写,利用各种手段利用硬盘,主要是所需写多节点的技术1>分布式相关技术,一致性hash,paoxs2>云计算相关的,各大厂家的论文信息检索方面1>搜寻引擎相关的,包括分词,索引等等,每一个点上都是一个课题2

2017-03-13 18:45:41 1073

原创 关注下java的socket框架

最近比较懒,心情比较烦,正在看c++的socket方面的,计划对比下:java socket框架和C++的socket框架,主要涉及到的有:mina,jetty,libevent,TT中的网络实现部分。

2017-03-13 18:45:33 562

原创 搬家了

要搬到自己的新房子里了,想想,毕业后,在工作后又回到校园(虽然不是上学,也并非母校),毕竟住了4年。 4年,耳濡目染了很多东西,视野上也比较宽阔了。搬家了,不知道,凤凰卫视和阳光卫视是否可看到,许多书店,以后去逛就比较远了。伤感ing

2017-03-13 18:45:26 303

原创 TNS-12547: TNS:lost contact

TNS-12547: TNS:lost contactTNS-12560: TNSrotocol adapter error  TNS-00517: Lost contact   Linux Error: 32: Broken pipe请问这是什么错误?该如何解决? lisenter.log文件太大了,Oracle无法对它进行操作了.listener就启动不了 listener

2017-03-13 18:45:16 370

原创 Flex和Silverlight

个人感觉是Flex好一些,有一个帖子:http://weblogs.asp.net/jezell/archive/2007/05/03/silverlight-vs-flash-the-developer-story.aspx上面讲的不错,有竞争Flex才能发展。也很奇怪,Flex为什么不支持Direct 3D或者Open GL。竞争才能带来发展,希望Flex走好

2017-03-13 18:45:03 548

转载 spark基本概念

转一篇文章,有hadoop基础看起来很快能懂.

2017-03-10 22:35:10 564

原创 官方Spark Programming Guide学习心得(V2.1.0)

spark官方guide学习总结,文档写的真简洁。

2017-03-10 22:19:37 607

翻译 GBDT回归的python官方例子详解

GBDT回归的python官方例子详解

2017-03-08 13:48:24 17672 2

翻译 sklearn主要包简介

sklearn主要包简介

2017-03-08 13:16:40 2648

转载 机器学习中的算法(1)-决策树模型组合之随机森林与GBDT

转发的一篇文章,评分方面组合模型的文章

2017-03-07 18:04:10 547

原创 好好学英语

最近几年不很少看英语,最近整点东西,忽然觉得看英文文章的能力下降,必须重新温习加强下,有关英文的一些好的资料也会在本贴中持续更新,加油。

2017-03-06 13:14:06 815

转载 论文的研究方法

写论文和分析问题常用的方法

2017-03-01 19:17:40 910

原创 关于期权

关于公司给期权的一些理解,可能不到位,但是尽量避免有坑。

2017-02-28 10:10:16 1951

原创 重温jvm中的happen-before

jvm中happen-before的8条规则总结性解析

2017-02-23 23:15:48 981

原创 Spring boot部署发布到linux

spring快速发布

2017-02-21 17:34:22 20002

原创 清算中的二清是什么东东

相对于一清来说,二清存在有点像p2p各种模式,既然存在就有一定的合理性,总结下。

2017-02-21 13:34:03 9599

原创 银行票据之间的区别

转:http://blog.sina.com.cn/s/blog_55dd23f90102v4uu.html   银行汇票 支票 银行本票 商业汇票 商业承兑汇票 银行承兑汇票 业

2017-02-21 09:12:46 2218

原创 第三方支付相关知识结构

作者:梁川 链接:https://www.zhihu.com/question/54247561/answer/138579226 技术内容: 1、事务处理:包括关系数据库的ACID、分布式事务(2阶段、3阶段、TCC、补偿性事务、可靠事件、Sagas长事务等)。先结合Spring AOP之类框架,把数据库事务处理机制深入研究一下。 2、服务化及服务化治理:交易导向系统一般

2017-02-18 09:45:50 2666

原创 redis服务日常维护命令

包括:redis服务启动命令,Redis-cli命令最新总结,Redis的“死键”问题,常用架构

2017-02-17 13:45:11 4791

原创 linux性能命令详解

iostat、vmstat、top、/proc/PID详解

2017-02-17 13:05:27 1470

原创 pig vs hive

1、概念 一、什么是Hive? Hive可以看做是SQL到Mapreduce的一个映射器,就是不用开发Mapreduce,只要懂SQL就可以了,HiveQL是标准SQL92的一个子集,和标准的SQL并不完全一样,HiveQL本身有百分之二十的一个扩展,大概百分之八十的语法和标准的SQL是一致的,所以对于数据分析人员来讲,就可以很方便的切入到Hadoop的平台上去做数据分析。 二、什么是Pig

2017-02-16 15:31:02 565

原创 Hbase表设计

典型的数据库一对一,一对多,多对多映射以及二级索引如何组织

2017-02-16 09:49:13 544

原创 个人新年感悟

做事情和面对挑战心态的一点感想。

2017-02-15 09:04:28 506

原创 互联网金融相关资源汇总

清算、第三方支付的基本流程

2017-02-09 13:53:52 863

原创 微服务、SOA、消息通信相关资源汇总

如题

2017-02-08 14:24:18 1249

原创 分布式服务时间同步

如果一个分布式系统中,一个服务要调用多个服务,那么,那个地方消耗的时间大,必须要服务时钟同步才可,时间同步非常重要。

2017-02-08 10:58:02 3011

原创 dubbo学习总结

使用dubbo的总结

2017-02-06 18:02:24 522

原创 idea如何查看jar包的源代码(非反编译)

idea查看jar包的源代码,相比eclipse其实比较一般。 1、eclipse中的操作步骤 eclipse只需要将对应的jar关联源代码,直接可以使用package的方式进行浏览,如下图: 2、idea中的操作步骤 1、使用maven下载对应的源码,比如dubbo 2、查看对应的类,比如查看RedisRegistry的类,需要使用idea的查找类:ctrl+shit+r方式查找对应的类进

2017-02-05 10:45:54 41182 8

原创 doker上运行tensorflow

运行jupyter;设置TensorBoard;启动脚本

2017-01-18 14:52:41 1492 2

原创 docker入门学习

1、基本概念 镜像:用程序员的角度来说,就是一个类 容器:镜像的实例,等同于类的实例 仓库:保存镜像的地方,分共有和私有的区别   问题1:实例数据如何保存 问:如果容器是镜像的实例,那么实例运行的数据保存在什么地方 答:通过传递文件路径,实例的数据保存在宿主主机的文件系统目录中(通过docker的数据管理来与宿主主机文件系统通信),传递过程可以参考文章使用Docker搭建GitLa

2017-01-18 11:21:07 705

原创 长文本如何兼顾效率情况下过滤垃圾信息

方法1:基于字符串精确匹配,一般使用Aho Corasick自动机结合DoubleArrayTrie来获得相关词,然后基于词的基础上,理解词与词的关系,理解语义(可以使基于规则的或者是统计的),从而进行判断 优点:精确匹配,容易处理变形 缺点:匹配词多,语义完全依赖于语义规则 方法2:分词后,做文本的IF-IDF,基于权重比较高的词进行语义判断 优点:最终判断的词少,语义判断性能好,但是语

2017-01-17 14:57:26 678

原创 集成性能测试性能收集之收集类实现

简单的一个性能收集类, 原理:在每个采集点上记录一条日志,完成后,如果总体时间超出要求,输出各个阶段的日志信息。

2017-01-12 16:06:29 331

原创 NLP相关概念

1、体系结构   2、知识图谱与NLP关系 所谓知识图谱听起来很高大上号称给计算机装上了大脑…其实无非就是从各种结构化/半结构化/非结构化数据中抽取实体/实体属性/实体之间的关系,构成一张图,这张图能够反映真实世界的相关信息,因为真实的世界在人类的认知当中就是由实体、属性和实体间的关系构成的获取这些东西的最大挑战无非就是实体识别、消歧(重名,别名)、实体关系挖掘等,这些归根到底都属于nl

2017-01-05 00:32:33 686

转载 互联网金融,如何用知识图谱识别欺诈行为

转:http://mp.weixin.qq.com/s?__biz=MjM5MTQzNzU2NA==&mid=401686695&idx=1&sn=aa7ca7f5c448075771ebd3533857b422&scene=5&srcid=0109iyPi4BzttwVPwq8hC1qF#rd   2016-01-09 李文哲 大数据文摘 作者授权转载 作者:李文哲

2017-01-05 00:17:37 5527 3

转载 中文分词器分词效果的评测方法

转:http://www.codelast.com/ 现在有很多开源的中文分词器库,如果你的项目要选择其一来实现中文分词功能,必然要先评测它们的分词效果。如何评测?下面详细叙述。 【1】黄金标准/Golden standard 所谓的黄金标准是指:评价一个分词器分词结果的好坏,必然要有一份“公认正确”的分词结果数据来作为参照。 通常,我们使用一份人工标注的数据作为黄金标准。但是,

2017-01-05 00:03:46 2101

原创 python自然语言处理学习笔记-信息提取结构

处理流程: 1、分词(sentence segmentation),输出tokenization 2、词性标注(part of speech tagging),输出post-tagged sentences。NP-分块信息最有用的来源之一是词性标记。这是在我们的信息提取系统中进行词性标注的动机之一。 3、基于词性标注的实体识别(entity recognition),输出chunked se

2017-01-04 23:53:09 1334

转载 语义分析的一些方法(三)

转腾讯广电通博文:语义分析的一些方法(三)

2017-01-04 23:25:39 1261

转载 语义分析的一些方法(二)

转腾讯广电通博文:语义分析的一些方法

2017-01-04 23:15:59 1939

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除