- 博客(10)
- 资源 (23)
- 收藏
- 关注
原创 大数据之道 BitMap (按位存取)
一:起因(0)大数据的预处理那一篇博客,仅仅讲解了如何处理数据,以及清洗数据的原则;并没有讲解大数据处理过程中,数据在内存中的存储问题,这正是本文要关注的重点。(1)所谓大数据,就是数据量非常的大,到了TB 甚至 PB数量级,处理大数据可以分为以下方法:(2)运用现在非常火的Hadoop 和 spark 之外(其实是一个非常好的成熟的分布式框架 ---- 用的也是分治的思想);(3
2015-01-26 11:35:18 5500 6
原创 大话 函数指针 和 指针函数
一:起因(1)指针函数是指带指针的函数,即本质是一个函数。函数返回类型是某一类型的指针,即我们常见的函数类型,且返回值是指针。(2)函数指针是指向函数的指针变量,即本质是一个指针变量,是一个指向函数(可能是代码区)的首地址的指针,正如我们都知道,数组名就是指向数组第一个元素的常量指针(详见《数组拾遗》)。同理,对于一个函数而言,函数名也是指向函数第一条指令的常量指针。而编译器要做的就是在程
2015-01-07 09:19:47 2695 12
原创 浅析STL 谓词 + 仿函数 + 函数指针(c)
一:起因(0)提到C++ STL,首先被人想到的是它的三大组件:Containers(容器), Iterators(迭代器), Algorithms(算法)。容器为用户提供了常用的数据结构(如,vector,list,deque,stack,map,multimap,set,multiset,外加string),算法大多是独立于容器的常用的基本算法(一般在algorithm头文件中,其中sor
2015-01-30 20:57:21 6550
原创 STL 之 初识set multiset(map multimap)
一:起因(1):set的含义是集合,它是一个有序的容器,里面的元素都是排序好的,支持插入,删除,查找等操作,就 像一个集合一样。所有的操作的都是严格在logn时间之内完成,效率非常高,具体实现采用了红黑树的平衡二叉树的数据结构。set和multiset的区别是:set插入的元素不能相同,但是multiset可以相同。创建 multiset base; 删除:如果删除元素a,那么在定义的
2015-01-30 13:42:57 1911 5
原创 大数据处理之道 (MATLAB 篇<三>)
一:起因(1)最近一直在处理大数据,从MB ----> GB的变化,是一次质的飞跃,相应的工具也在变 从widows到linux,从单机单核 到 hadoop多节点的计算(2)问题来了,面对海量的数据,如何从中挖掘实用的信息或者发现潜在的现象,可视化工具可能是必不可少的 ;(3)可视化工具可以说百度一大篇,可是作为研究者的我们,程序猿的我们可能更希望能够抽象出一种数学模型,
2015-01-21 11:54:37 4646 4
原创 大数据之道 HMM系列<二>(成长)
一:HMM解码问题(1)编程深处无非就是算法和结构,以及各种架构和版本的管理(如Git管理),因此作为程序员算法这一关是绕不过去的;(2)关于算法,个人比较崇尚的一本书是《算法导论》和ACM实战系类的算法培训;(3)对于自然语言处理领域或者部分机械学习领域的算法,HMM模型是非常经典的算法之一,非常适合初学者学习和研究;(4)HMM模型μ=(A,B,π),的状态是不可见
2015-01-19 10:45:33 1416 4
原创 大数据之道 HMM系列
一:HMM解码问题(1)给定一个观察序列O=O1O2...OT,和模型μ=(A,B,π),如何快速有效地选择在一定意义下“最优”的状态序列Q=q1q2...qT,使该状态最好地解释观察序列。(2)最可能的隐藏状态序列(Finding most probable sequence of hidden states);对于一个特殊的隐马尔科夫模型(HMM)及一个相应的观察序列,我们常常希望能找
2015-01-16 11:36:37 1439
原创 大话 函数指针 和 枚举这对鸳鸯
一:起因(1)函数指针是指向函数的指针变量,即本质是一个指针变量,是一个指向函数(可能是代码区)的首地址的指针,正如我们都知道,数组名就是指向数组第一个元素的常量指针,对于一个函数而言,函数名也是指向函数第一条指令的常量指针。大话 回调函数 和 枚举(2)而回调函数就是C语言里面对函数指针的高级应用,回调函数是一个通过函数指针调用的函数。如果你把函数指针(函数的入口地址)传递给
2015-01-10 21:36:06 1501 3
原创 大话 回调函数 和 枚举
一:起因(1)接着上一篇博客 大话 函数指针 和 指针函数(2)对指针的应用是C语言编程的精髓所在,而回调函数就是C语言里面对函数指针的高级应用(3)回调函数可以实现代码具体实现 和 功能描述的分开,可以实现代码的重用性,特别是代码的可扩展性(4)要想实现函数与类型无关,就可以借助回调函数就可以达到这个目的,当然也可以通过泛型来实现相应的方法。(5)使得函数可以作为
2015-01-09 11:39:40 1768 2
原创 大话快排 和 归排的渊源
一:起因(1)包括冒泡算法、快排算法、插入排序算法等;还有基于外部排序的归并排序(以二路归并排序为例 )但是基本上在一个数量级上;(2)mergesort (归并排序) 可以应用在外部排序,这与基于内存的quicksort(快速排序)略有不同,他们的算法复杂度都可以达到O(nlogn)(3)mergesort 是稳定的排序算法,需要额外的空间开销O(n)
2015-01-06 17:28:24 1548 9
IKAnalyzer2012_u6 和 jcseg-dict-all两款工具
2014-12-24
htmlparser解析Html的jar包和源文件包(两个)
2014-12-24
jxl解析Excel的jar包和源文件包(两个)
2014-12-24
ArcGIS_Editor_for_OSM_2_1_Desktop_Beta3
2014-11-26
数据结构(c++英文版)
2014-11-23
c++list类实现
2014-11-23
c++string类的实现
2014-11-23
数据挖掘导论完整版
2014-11-12
C++程序设计(谭浩强)
2014-08-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人