自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(9)
  • 资源 (3)
  • 收藏
  • 关注

原创 Cohort Analysis组群分析(1)

1. 总体数据按30天(月)呈周期性趋势,(1) last day 是操作行为的峰值:存入最高,消费最高;存入比消费高;(2) 前6日左右是一个峰值日:存入峰值;(3) 前20日左右是一个风之日:存入峰值,消费峰值;消费比存入高;

2016-12-07 15:00:48 2148

原创 Hadoop中使用正则匹配的效率问题

正则表达式一直以来都是比较难掌握的,并且正则匹配的效率一直不高,特别是java语言。大数据还没来之前,正则匹配的效率问题还不算程序的大问题。正则匹配比较常用与URL的匹配,正巧网络流量日志是典型大数据文件。当大数据遇上正则匹配,抓狂的事情就发生了,效率极低。笔者做了一个简单的测试,对比了最简单的正则匹配(直接匹配某个字符串,没有任何通配符)和String的indexOf方法的效率

2013-05-30 19:03:48 2363 1

原创 Hadoop使用CombineFileInputFormat处理大量小文件接口实现(Hadoop-1.0.4)

Configuration设置块大小64MConfiguration conf = new Configuration();conf.setLong(MyCombineFileInputFormat.SPLIT_MINSIZE_PERNODE, 64 * 1024 * 1024);conf.setLong(MyCombineFileInputFormat.SPLIT_MINSIZE

2013-05-28 17:23:56 4150

转载 用 WEKA 进行数据挖掘 (From IBM)

第 1 部分: 简介和回归  点击打开链接第 2 部分: 分类和群集  点击打开链接第 3 部分: 最近邻和服务器端库  点击打开链接

2013-02-25 20:16:09 905

原创 经典排序算法代码实现(持续更新... 求补充)

1.快速排序Quick sort原理,通过一趟扫描将要排序的数据分割成独立的两部分,其中一部分的所有数据都比另外一部分的所有数据都要小,然后再按此方法对这两部分数据分别进行快速排序,整个排序过程可以递归进行,以此达到整个数据变成有序序列 /** * 快速排序算法 * * @param array * 待排序数组 * @param low

2012-11-19 21:55:51 607

原创 公共子序列问题

关于公共子序列,由浅入深,可以有多种问题:1.最长子序列的长度(或者同时返回最长公共子序列);2.从序列A变换到序列B,最少需要多少步操作(或者说A与B的距离)。操作包括:1.删除一个字符 2.插入一个字符 3.修改一个字符为另一个字符一、针对第一个问题,网络上有各种文章介绍了解决方法,这里只介绍最优的方法(动态规划法)下面是西山居游戏程序类2013校园招聘的笔试原题:

2012-11-10 11:21:27 644

原创 问题描述:一次买n瓶可乐,k个空瓶可以换一瓶饮料,那么一共能喝多少瓶饮料?

/***问题描述:一次买n瓶可乐,k个空瓶可以换一瓶饮料,那么一共能喝多少瓶饮料?*下面用不同的方法实现了这个问题(Java实现):*1.递归方法*2.非递归方法*3.公式法*/public class CocaCola{ public int Count(int n, int k) { if( n < k ) return 0; if( n == k )

2012-11-09 22:29:05 4805 3

原创 厦门亿联网络2013校园招聘C++软件工程师笔试题(2012-10-17)

1、现在小明一家过一座桥,过桥时候是黑夜,所以必须有灯.现在小明过桥要1秒,小明的弟弟要3秒,小明的爸爸要6秒,小明的妈妈要8秒,小明的爷爷要12秒。每次过桥只能过2人,两人过桥的速度以最慢者为定。还有过桥后要已过桥的其中一人送灯也算秒速,而灯在30秒后就会熄灭,过桥时不能没有灯。问小明一家怎样过桥?2、A、B、C、D四个人,他们分别来自英、法、德、美四个国家,现已知德国人是医生,美国人年龄最

2012-10-17 15:20:57 6275

原创 斯伦贝谢2013校园招聘软件岗位笔试题(2012-10-07)

1.C++语言1.1.全局变量和局部变量在内存中是否有区别?如果有,是什么区别?1.2.static有什么用途?(至少说明两种)1.3.从实现原理上来说重载(overload)和重写(override)的区别?1.4.试述动态内存分配和静态内存分配的主要区别1.5.C++语言中的浮点数组的内存如何静态分配和释放,语法上有何要求?1.6.下面代码能否通过编译?如果可以,其

2012-10-17 14:31:24 2131

Oracle课后答案

课后习题答案可供同学参考

2008-02-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除