算法
文章平均质量分 77
chixujohnny
蚂蚁金服-高级算法工程师
展开
-
时间序列频繁模式挖掘:GSP算法、SPADE算法
什么是时间戳概念的频繁模式挖掘?所谓时间戳(time-stamp)就是加入了时间序列的概念,即每次发生的时间都有时间先后的顺序,在前面讲解的Apriori算法中并没有加入此概念,虽然Apriori加入了先验性质以减少每轮遍历的次数,但是由于加入了“时间发生先后”的概念,导致时间复杂度大大增加,无疑需要一种新颖的办法解决该问题。原创 2015-08-07 10:55:55 · 20555 阅读 · 11 评论 -
排序算法(二):归并排序
归并排序(MergeSort)是大神冯诺依曼研发的一款高效且稳定的排序算法,据资料显示,Python自带排序函数用的就是归并排序。其稳定性和效率肯定是毋庸置疑的了,学好归并排序非常有用,是多路归并排序的功底课(多路归并排序在海量数据环境下内存不足是非常有用)。时间复杂度:O(n*logn)空间复杂度:O(n)下面我讲解一下归并排序的排序流程:给定一个列表,里面有许多待排序的原创 2015-12-13 20:26:38 · 814 阅读 · 0 评论 -
排序算法(一):快速排序
突然觉得在本科的时候自己的基本功练习的不是很过关,趁着学Python的热乎劲好好把基础算法过一过,等以后面试的时候也不会死的太惨。。。快速排序(QuickSort):快速排序的可以说是在数据量较大且数据够随机的情况下,平均时间复杂度最好的算法,如果你没办法判断待排序数据的随机度和规模,用QuickSort就对了。最大时间复杂度O(n^2),平均时间复杂度O(n*logn)讲原创 2015-12-12 08:33:10 · 496 阅读 · 0 评论 -
(源码)关于A->B*->D的时间序列频繁模式挖掘的思考 1.26更新
这个算法是导师课题的一个部分,感觉对时间序列频繁模式挖掘的学习还是很有帮助的,在博客里做一下记录。首先要明确一下什么是A->B*->D模式:A->B->D表示在A事件发生后又发生了B事件,又发生了D事件,由于我应用在社交网络,那么这三种事件就可以表示为三个人在某微博下的留言。什么是A->B*->D模式?这里的*表示不管在A与D时间发生的时间点当中有多少个B事件发生,都可原创 2016-01-23 14:08:01 · 1676 阅读 · 0 评论