自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小小八卦姐的专栏

大数据 分布式 数据库

  • 博客(6)
  • 收藏
  • 关注

原创 Head First Java(2)——数字与静态及异常处理

10 数字与静态static这个关键词可以标记出不需类实例的方法。非静态方法:                                                                                                               静态方法:(米有对象,绝对木有)以类的名称调用静态的方法;Math.min(88

2013-08-28 09:52:05 1019

转载 数据流挖掘——窗口内的计数问题

转自:http://msdn.microsoft.com/zh-cn/library/ff518595(v=sql.105).aspx计数窗口定义处于某个时间段内并且您可以对其执行某些基于集的计算(例如聚合)的事件的子级。计数窗口与快照窗口相似,也没有固定的窗口大小。它们由其包含的事件的数目定义。这可以实现多种方案,其中,基于集的操作必须应用于具有非定期事件频率的流中特定数目的事件。

2013-08-19 15:27:12 937

原创 Head First Java(1)1-9章

1 类与对象main()的两种用途:(1)测试真正的类(2)启动你的JAVA应用程序真正的Java程序只会让对象与对象交互。此处所说的交互是指相互调用方法。question 1:若需要全局变量或方法时该如何?answer 在Java的面向对象概念中并没有全局变量这回事。然而实际上会有需要方法或常量可被任何程序存取。在任何类中的任何程序都可以存取public static的方

2013-08-13 22:03:30 1126

原创 相似项发现-LSH

1 LSH的特定形式先表示为shingle集合,然后经过哈希处理表示为短签名集合。1.1 面向最小哈希签名的LSHLSH的一个一般性做法就是对目标项进行多次哈希处理,使得相似项比不相似项更可能哈希到同一桶中。然后将至少有一次哈希到同一桶中的文档对看成是候选对(candidate pair)我们只需检查这些候选对之间的相似度。那些哈希到同一桶中的非相似围挡对成为伪正例(false pos

2013-08-11 21:57:24 1387

原创 相似项发现-minhash

相似项发现中两个重要算法:Broder提出的shingling算法和Charikar的simhash算法shingle算法的核心思想是为每个文件提取组特征值,以特征值集合来计算相似性,从而降低空间和计算复杂性来提高性能。相似项数据检测算法大致流程如下:(1)将数据段分解成一组shingle(即子序列或数据块),可以采用定长、变长、单词或段落(文本文件)等分块算法;(2)

2013-08-10 21:51:46 2595

转载 理解矩阵——孟岩

注:此三篇理解矩阵转载于孟岩老师的博客http://blog.csdn.net/myan/article/details/647511,写的特别好,转载过来跟大家分享,没事的时候可以自己看看~理解矩阵(一)前不久chensh出于不可告人的目的,要充当老师,教别人线性代数。于是我被揪住就线性代数中一些务虚性的问题与他讨论了几次。很明显,chensh觉得,要让自己在讲线性代数的时候不被

2013-08-10 10:50:57 2105

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除