- 博客(30)
- 收藏
- 关注
原创 eBay User feedback clustering in R
Author: Zhao, KevinAbstractLearning eBay user’s feedback is fairly important to improve our site service. However, Catching useful information from tons of user feedbacks is really not an eas
2015-02-05 16:15:14 1204 1
原创 BDD practice with Beaf - next generation acceptable testing
Author:Xie,ForestBackgroundLast year, our Gumtree Australia team started to use behavior-driven development in our agile development process. Initially, we searched for an open-source BDD fram
2015-02-05 16:14:19 973
原创 CMS - Configuration management service based on MongoDb
Author: Su, Ralph AbstractConfiguration management database (CMDB) is commonly used to store the management items inside an organization/company. CMDB typically designed as a centralized d
2015-02-05 16:13:35 1473 1
原创 Account Sharing Classification Model
Author:Zhang FelixIntroductionIn the age of internet, online shopping has created a revolution for consumers, growing rapidly year by year and offering a Golden Age of shopping. User account s
2015-02-05 16:12:44 776
原创 How to Segment EBAY Mobile Buyers?
Author:Li ZhongGartner Predicts Mobile Web Beats PC by 2013.By 2013, mobile phones will overtake PCs as the most common Web access device worldwide. According to Gartner's PC installed bas
2015-02-05 16:11:47 1073
原创 Position Bias Correction for Search Behavior Analysis
Author:Wei Min, Jason Wang1. IntroductionClicks contain information about user satisfaction with search results and provide a measurement of item relevance/quality. However, the observed click
2015-02-05 16:10:35 2832
原创 Kepler性能分析之M2E调优
Author:Cai Eric 简介 在使用Eclipse Kepler v4.3.2(WTP v3.5.2, M2E v1.4.1)开发基于Maven的Java Web项目时,将工程导入到workspace速度非常之慢,而且保存修改的文件也会引发长时间的编译,严重影响了开发人员的工作效率。 通过分析日志,调试,辅以性能分析工具VisualVM,
2015-02-05 16:09:30 1491 2
原创 基于Apache Mesos 构建高可靠,高可用的Jenkins CI
Author: Mao, James Mesos 计算框架是一个开源的集群管理平台,他提供了高效的,高可靠的,跨应用/框架的资源隔离和共享,在其之上可以运行Hadoop,Spark,JBoss,Ruby On Rails等应用框架,支持多种资源的计划分配。其中主要的一个目的就是有效的利用和共享计算资源,避免资源的浪费。Mesos 起源于Twitter和AirBnB,Twitter和A
2015-02-05 16:08:29 4894
原创 Utilize Action Mechanism in Web Test Automation to Save the Effort for Frequent Code Change
Author: Zhou Hongfei, Han Jun.1. Background: challenge we met during test automation, based on the design pattern of page object.Currently design pattern of page object is commonly used in We
2015-02-05 16:07:24 812
原创 调试Oracle 之一 基础篇
Author: Lv, Haibo.前言 “多年之后,面对枪决行刑队,奥雷良诺•布恩迪亚上校将会想起,他父亲带他去见识冰块的那个遥远的下午”。《百年孤独》的这个开头堪称经典。倒序的方法,加上时间状语“多年之后”,苍桑感一下子就出来了。何况又是面对行刑队,悲剧感也很强烈。要知道文学作品最能打动人心的,就是悲剧。比如,我至今还记得最短、最悲伤的爱情小说:“我爱你!!!
2015-02-05 16:06:40 1024
原创 分布式文件系统概述
Author: Ma, Guolai.文件系统是操作系统用来组织磁盘文件的方法和数据结构。传统的文件系统指各种UNIX平台的文件系统,包括UFS、FFS、EXT2、XFS等,这些文件系统都是单机文件系统,也称本地文件系统。随着网络的兴起,为了解决资源共享问题,出现了分布式文件系统。分布式文件系统是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连。本文由
2015-02-05 16:06:00 2970
原创 Maven Build Tracking
Author: Mao, Maode.从这个项目的名字我们不难发现,Maven Build Tracking (以下简称MBT) 这个项目是用来跟踪/监控Maven 的构建(Build)。但我们不仅仅记录项目的成功/失败, 同时需要衡量构建时长, 构建的环境, 甚至收集应用级别的信息。利用这些信息我们就可以全局的审查我们构建系统的性能以及可靠性。 在我们详细讨论MBT之前
2015-02-05 16:04:34 854
原创 你好,HBase
Author: Fang, Chen, Ma,Guolai现代的互联网应用引发了对极大规模数据进行快速处理的需求,大数据带来的信息风暴正在变革我们的生活、工作甚至思维方式。如果你对“大数据”尚感陌生的话,那么建议可以先读一读维克托的《大数据时代》。当然,作为一名地地道道的“程序猿”,不断革新的技术才是最令人身心颤动的。在大数据时代下,Hadoop获得的成功我想已无需赘述。但俗话说
2015-02-05 16:03:40 758
原创 Maven中的扁平化POM
Author: Jia, Weigang.Maven中的POM大致有两个目的:开发人员用POM编译和发布构件被其他项目用于依赖管理对于第一个目的,POM中的关于编译和发布的元素都是有意义的。对于第二个目的,POM中的关于编译和发布的元素就没有意义了。比如,一个项目A依赖于构件B,项目A仅仅需要知道构件B的GroupId、ArtifactId、Version以及构件B的依赖
2015-02-05 16:02:35 1088
原创 Maven依赖版本冲突报告
Author: Wang, Yunfeng.简介依赖版本冲突是一个一直以来困扰Build系统的问题,众所周知,依赖版本冲突会带来很多运行时的问题,如果能够在开发和编译阶段就识别出这些问题,将会大大提高开发人员的工作效率,并且提高产品的稳定性。本文将着重分析一下Maven依赖版本冲突的问题,然后介绍一下目前的常见的检测和报告工具。然后提出一个依赖版本冲突报告的增强。
2015-02-05 16:00:48 2086
原创 Improve API Gateway Throttling
Author: Zhan, James.What is throttling?Throttling is a flow control feature that limits access to resource to a certain number of times. Once the upper limit or threshold is reached, access t
2015-02-05 16:00:04 1051
原创 如何定制一个基于REST Service的ODBC驱动程序
Author: Ma, Hongbin概要REST Service能够帮助开发者以简单统一的接口向终端用户提供服务。然而数据分析的应用场景中,一些成熟的数据分析工具(例如Tableau, Excel等)要求用户提供ODBC数据源,在这种情况下,REST Service并不能满足用户所有对数据的使用需求。本文从实现的角度详细介绍了如何在现有REST Service的基础上,
2015-02-05 15:59:10 854
原创 Comet框架Pushlets的集成
Author:Zhang, Yang在从事web项目开发时, 有时会遇到业务需求,要求通知用户某一事件的发生而无需页面不停的刷新,如: 即时通信: 用户登录、消息推送 即时报价: 数据库的数据变化 即时监控: 硬件状态变化然而由于html协议天生的请求模式,只能是客户端向服务器端请求数据,服务器端没法主动向客户端推送数据。为此, 开
2015-02-05 15:57:58 842
原创 JSON Compression
Author: Ma, GuolaiStoryJSON data comprises a large majority of content sent around the internet, especially for social networking sites and HTML5 games. One day, someone wants to search somet
2015-02-05 15:56:53 1551
原创 DBA的新领域:调试Oracle(进阶篇)
Author: Lv, Haibo摘要:调试Oracle的意义 ---- 无限风光在险峰我把用DTrace和mdb,分析、研究Oracle称为“调试Oracle”,这是一个新的领域。它比传统DBA要求更高,除掌握Oracle内部原理外,它也要求更多的计算机底层知识,因为个别时候,我们需要到反汇编代码中,一探研究。那么究竟调试Oracle技术可以为DBA带来什么改变呢?本文想给各位
2015-02-05 15:55:46 1424
原创 A Tutorial to Dev a Jenkins Plugin for a Distributed Jenkins
Author: Yu, QingguoBackgroundJenkins is an open source continuous integration tool written in Java, known as CI server. Plugins extend Jenkins use, which provides all kind of functionalit
2015-02-05 15:55:00 845
原创 Seamless migration from Nova-network to Neutron in eBay production
Problem StatementIn eBay production deployment, two AZs (Availability Zones) in data center are running OpenStack Folsom with Nova Network. To align with efforts to upgrade and operationalize cons
2015-02-05 15:51:55 730
原创 使用JProfiler进行性能调优
Author:Zhang He ,Shao Sheldon 简介:如今web project越发庞大,一个项目中包含上百个jar包是经常碰到的情况。这也就导致项目启动越发缓慢。针对此情况,可以考虑使用JProfiler对程序启动过程进行监听,找到影响性能的hot spots,对其进行分析,优化,藉此达到减少启动时间的目的。本文旨在通过一个案例,介绍一种使用JProf
2015-02-05 15:49:44 5527 1
原创 Machine Learning Method In eBay Bot Detection
Machine Learning Method In eBay Bot DetectionZhao Kevin, Pengju Yan Data Services and SolutionsSeptember 4, 2014Bot/Internet bot is a software application that runs automated tasks ove
2015-02-05 15:48:47 1167 1
原创 在开发测试中使用HBaseMiniCluster
Author: Shi, Shaofeng 为了方便开发人员,HBase以及其它Hadoop组件提供了Mini Cluster的运行方式:在一个JVM里模拟运行Hadoop集群,包括HDFS,Zookeeper,HBase 以及MapReduce;如果你需要运行一些简单的代码或测试案例,或者想在IDE中通过断点来调试,那么这时候用Mini Cluster就再合适不过了;HBase
2015-02-05 15:46:16 2533 1
原创 Disruptor Ring Buffer as a Blocking Queue
Author:Wang, Xinglang AbstractFor any concurrent multi-threaded system, distributed computing or otherwise,the inter-thread messaging component is an very important component. In Java, the JDK p
2015-02-05 15:45:00 1547
原创 改进你的网页
Author: Jiang, Jilin 在网页开发过程中,我们时常会遇到当数据量很大,或者页面同时渲染过多内容导致页面等待时间太久或者动画效果不流畅甚至假死的问题。那么我们如何避免因此造成的页面影响呢?接下来,我就将通过一些例子来提出页面的改进意见: 一 最后触发动画 jQuery中拥有animate方法,可以十分便捷的做出动画效果。但是有时候
2015-02-05 15:43:19 659
原创 支付系统监控实践
Author: Hu, Elvin摘要 监控(Monitor)对服务(Service)的重要性不言而喻。一个配置了有效以及可靠的监控的系统,就像拥有不间断雷达和卫星跟踪保护的民航飞机一样, 让人放心,在关键时刻亦能最大程度的发出警报并减少灾难带来的后果。 智能判断样本是否超越警戒线不是一件容易的事情。漏报和过多的误报都不可取。而样本通常由用户行为
2015-02-05 15:39:54 3421
原创 基于OAUTH的电子商务支付集成研究与实现
Author: Xie, James背景 支付实际上可以分为线上支付和线下支付。线上支付也就是通常所说的网银支付,线下支付通常指的是POS机刷卡支付。 第三方支付公司产生之前,对于线下支付而言,商户,包括酒店,商场,保险公司等,如果想要做银行卡支付业务,那么首先需要到银行开具资产证明等一系列担保措施,充分认定资质以后或许能开立一个POS机刷卡帐户,才能让
2015-02-05 15:35:28 2803
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人