自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 海量数据相似度计算之simhash短文本查找

在前一篇文章 《海量数据相似度计算之simhash和海明距离》 介绍了simhash的原理,大家应该感觉到了算法的魅力。但是随着业务的增长 simhash的数据也会暴增,如果一天100w,10天就1000w了。我们如果插入一条数据就要去比较1000w次的simhash,计算量还是蛮大,普通PC 比较1000w次海明距离需要 300ms ,和5000w数据比较需要1.8 s。看起来相似度计算不是很慢

2014-01-09 10:45:15 689

原创 C#提高知识-001:反射的应用和原理(一)

在项目中,程序集间的相互引用是经常遇到的。比如,主程序引用各分模块,各分模块引用公用程序集,以及平行的程序集间为了某些功能的实现也需要相互引用。这样的引用一方面是迫不得已的选择,而另一方面也反映出系统设计的水平。下面,简单介绍一下C#中的一种机制——反射。反射可以在避免某些情况下的程序集引用问题,比如主程序引用各功能模块的问题,当然其它模块间也是可以用反射的,只是使用是否方便这些问题需要在使用前根

2014-01-06 15:27:52 317

原创 变量的存储类别

变量的存储类别:主要针对时间属性,引出存储期概念。  存储期:静态存储期 和 动态存储期。  静态存储期:程序运行开始分配固定存储空间;  动态存储期:程序运行期间动态的分配和释放内存。  存储期有四种:自动的(auto),静态的(static),寄存器的(register),外部的(extern)。  自动变量:函数的形参,函数中定义的变量。默认情况即为自动变量。定义时若不赋

2014-01-05 08:31:09 326

原创 Linux网络和进程管理

1) 计算机网络是通过外围的设备和连接,将分布在相同或不同区域的多台计算机  连接在一起所形成的集合。网络中的计算机实现彼此间互相通信,并且可以共  同使用硬件、软件和数据资源,实现资源共享。Linux系统具有很强大的网络  功能,可以支持多重协议和标准,使用其自带的网络配置工具可以进行网络配  置,并且通过其网络命令,准确方便的进行网络管理和监控。  (2) Linux中,通

2014-01-03 09:11:13 230

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除