- 博客(15)
- 资源 (6)
- 问答 (2)
- 收藏
- 关注
原创 关联规则-FP Tree
在开始之前首先要说明下构造FP-Tree树的过程及Fp-Tree树涉及的相关概念;@构造FP-Tree树的过程如下:1.按Apriori算法,扫描数据库一次生成1-频繁项目集,并按频度降序排列,放入L列表中;2.创建根节点,标志为Null,扫描数据库一次,当得到数据库的一个项目(元祖)时,就把其他元素按L表中的次序排列,然后通过递归程序实现FP-Tree树的增长;@关于...
2019-07-28 16:50:57 1441
转载 通俗理解LDA主题模型
通俗理解LDA主题模型0 前言 印象中,最开始听说“LDA”这个名词,是缘于rickjin在2013年3月写的一个LDA科普系列,叫LDA数学八卦,我当时一直想看来着,记得还打印过一次,但不知是因为这篇文档的前序铺垫太长(现在才意识到这些“铺垫”都是深刻理解LDA 的基础,但如果没有人帮助初学者提纲挈领、把握主次
2017-03-28 11:46:43 508
翻译 【译文】 The Author-Topic Model for Authors and Documents ( Michal Rosen-Zvi, Thomas Griffiths, etc. )
Machine Learning, Data Science and Advanced Analytics
2017-03-23 14:36:35 1902
转载 Author-Topic Model与ACT-LDA分析与解析
Generative Models for Document(文章的生成模型)这里的Document(文章)是包括两部分:文章的作者集合,组成文章内容的单词集合。例如:Document 1表示为:Document 2表示为:
2017-03-21 22:46:51 2802 2
转载 隐马尔可夫模型(HMM)详解
隐马尔可夫模型 (Hidden Markov Model,HMM) 最初由 L. E. Baum 和其它一些学者发表在一系列的统计学论文中,随后在语言识别,自然语言处理以及生物信息等领域体现了很大的价值。平时,经常能接触到涉及 HMM 的相关文章,一直没有仔细研究过,都是蜻蜓点水,因此,想花一点时间梳理下,加深理解,在此特别感谢 52nlp 对 HMM 的详细介绍。 考虑下面交通灯的
2016-09-21 20:07:20 948
原创 centos7.0+下安装adobe flash-player
Description: 之前给python升级后,解决的yum等问题,可是... 后来,升级后安装numpy包,import后运行时..... WTF!!! 显示没有numpy这个宝宝.... 乱搞一通。。可以用了,发现自己的代码在python3.0+下运行是有问题的。。。然后 。。。反正也没什么重要代码,一哥们儿说:“大不了重写呗~!反正我有定期删代码的习惯,重写的时候通常比以前代码感觉更简单
2016-08-25 17:43:34 15164 1
原创 centos下,将python升级3.0+以上版本后,yum、update等无法使用问题
或许有些小伙伴将python升级后,懵比了!!!!!我的yum用不了啦!!!!!!!!解决完yum问题后,发现,哦呵呵呵呵呵呵 原来不止是yum阿。。。。Now~ 我现在给大家上图that how i sloved this problem before~~~~!! *****首先,第一个是yum的问题~what???我的yum用不了!!!别担心 -.- 有LaFee~~
2016-08-12 17:25:04 4194 1
翻译 Detecting Near-Duplicates for Web Crawling
ABSTRACT在网页上有很多相似的文档。比如说,两篇文章只有在显示广告这一小部分是互不相同的。但这些不同的地方,对于网页搜索来说,是无关紧要的。因此,如果该网络爬虫技术可以评估最新抓取的网页与之前抓取的网页是否相似,那么它的“质量(类似..就是升级版!性能提升)”就会提升。在开发一个在数百亿网页栈中检测相似文章的系统过程中,我们做了两项研究贡献。第一个,我们证明了Charikar的指纹识
2016-07-30 09:24:10 1273 1
转载 文档去重算法:SimHash和MinHash
simhash与重复信息识别来源:http://grunt1223.iteye.com/blog/964564在工作学习中,我往往感叹数学奇迹般的解决一些貌似不可能完成的任务,并且十分希望将这种喜悦分享给大家,就好比说:“老婆,出来看上帝”…… 随着信息爆炸时代的来临,互联网上充斥着着大量的近重复信息,有效地识别它们是一个很有意义的课题。例如,对于搜
2016-07-22 19:22:59 947
原创 最优分解(贪心)
Description:设n是一个正整数。现要求将n分解为若干个自然数的和,且使这些自然数的乘积最大。对于给定的正整数n,编程计算最优分解方案。Sample Input:10Sample Output:36analysis:若 a + b = c,则 | a – b | 越小,a × b 越大。根据原问题的描述,需
2015-12-23 08:42:33 937
原创 最小重量机器设计
Description:设某一机器由n个部件组成,每一个部件都可以从m个不同的供应商处购得。设w[i][j]是从供应商j处购得的部件i的重量,c[i][j]是相应的价格。试设计一个算法,给出总价格不超过d的最小重量机器设计。Input:3 3 4 //m, n, d 1 2 3 //c[i][j]3 2 12 2 21 2 3 //w[i][j]3 2 12 2
2015-12-22 15:53:06 701
转载 孤儿进程与僵尸进程[总结]
孤儿进程与僵尸进程[总结]1、前言 之前在看《unix环境高级编程》第八章进程时候,提到孤儿进程和僵尸进程,一直对这两个概念比较模糊。今天被人问到什么是孤儿进程和僵尸进程,会带来什么问题,怎么解决,我只停留在概念上面,没有深入,倍感惭愧。晚上回来google了一下,再次参考APUE,认真总结一下,加深理解。2、基本概念 我们知道在unix/linux中,正常情况下,子进程是
2014-07-26 09:47:08 531
原创 八皇后(c语言)
#include #include #include #include #include #include #include int longitudinal[100];int queen[100][100];bool place (int); /*找到皇后合适的列位置*/void Queen (int); /*找到所有皇后合适的位置
2014-07-26 09:26:02 636
原创 双向循环链表(带头结点)
//创建链表-录入信息movie *creat () { movie *head, *node1, *node2; char choice; head = node1 = malloc(N); head->next = head; head->pro = head; printf ("\n PLease input the
2014-07-19 17:19:52 3854
机器学习实战 pdf
2016-07-31
算法设计与分析-上机代码
2016-07-31
关于charAt()的实现过程
2015-07-05
TA创建的收藏夹 TA关注的收藏夹
TA关注的人