- 博客(4)
- 收藏
- 关注
原创 海量数据相似度计算之simhash短文本查找
在前一篇文章 《海量数据相似度计算之simhash和海明距离》 介绍了simhash的原理,大家应该感觉到了算法的魅力。但是随着业务的增长 simhash的数据也会暴增,如果一天100w,10天就1000w了。我们如果插入一条数据就要去比较1000w次的simhash,计算量还是蛮大,普通PC 比较1000w次海明距离需要 300ms ,和5000w数据比较需要1.8 s。看起来相似度计算不是很慢
2014-01-09 10:45:15 689
原创 C#提高知识-001:反射的应用和原理(一)
在项目中,程序集间的相互引用是经常遇到的。比如,主程序引用各分模块,各分模块引用公用程序集,以及平行的程序集间为了某些功能的实现也需要相互引用。这样的引用一方面是迫不得已的选择,而另一方面也反映出系统设计的水平。下面,简单介绍一下C#中的一种机制——反射。反射可以在避免某些情况下的程序集引用问题,比如主程序引用各功能模块的问题,当然其它模块间也是可以用反射的,只是使用是否方便这些问题需要在使用前根
2014-01-06 15:27:52 317
原创 变量的存储类别
变量的存储类别:主要针对时间属性,引出存储期概念。 存储期:静态存储期 和 动态存储期。 静态存储期:程序运行开始分配固定存储空间; 动态存储期:程序运行期间动态的分配和释放内存。 存储期有四种:自动的(auto),静态的(static),寄存器的(register),外部的(extern)。 自动变量:函数的形参,函数中定义的变量。默认情况即为自动变量。定义时若不赋
2014-01-05 08:31:09 326
原创 Linux网络和进程管理
1) 计算机网络是通过外围的设备和连接,将分布在相同或不同区域的多台计算机 连接在一起所形成的集合。网络中的计算机实现彼此间互相通信,并且可以共 同使用硬件、软件和数据资源,实现资源共享。Linux系统具有很强大的网络 功能,可以支持多重协议和标准,使用其自带的网络配置工具可以进行网络配 置,并且通过其网络命令,准确方便的进行网络管理和监控。 (2) Linux中,通
2014-01-03 09:11:13 230
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人