基础知识
文章平均质量分 95
xceman1997
这个作者很懒,什么都没留下…
展开
-
【转载】【数据结构&&算法系列】KMP算法介绍及实现(c++ && java)
原文地址:http://blog.csdn.net/ksearch/article/details/27837847转载 2014-05-31 22:38:39 · 993 阅读 · 0 评论 -
Automatic differentiation
看算法看到这个了,转载一下,备忘。From Wikipedia, the free encyclopediaJump to: navigation, searchIn mathematics andcomputer algebra, automatic differentiation (AD), also calledalgorithmic转载 2013-07-03 00:26:54 · 2285 阅读 · 0 评论 -
如何在VC++6.0或者VS如VS2010下使用外部类库(其他头文件)比如用pthread.h这个头文件
原文地址:http://blog.csdn.net/zhangyulin54321/article/details/8166299比如: 如何在VC6.0下用pthread.h这个头文件1.下载PTHREAD的WINDOWS开发包 pthreads-w32-2-4-0-release.exe(任何一个版本均可)http://sourceware.org/pthreads转载 2013-08-27 11:31:16 · 1333 阅读 · 0 评论 -
通过 GCC 学习 OpenMP 框架
原文地址:http://www.chineselinuxuniversity.net/articles/55986.shtml 摘自: IBM developerWorks China 被阅读次数: 1000由 yangyi 于 2012-11-04 19:48:46 提供OpenMP 框架转载 2013-08-22 19:43:13 · 2585 阅读 · 0 评论 -
简单尝试windows多线程程序
这两天因工作需要,写了个算法,计算复杂度较高。期望利用多核机器的优势,并行计算,加快运行速度。简单看了看资料,尝试两个小程序。程序一:函数能并行运行就OK。#include #include using namespace std;DWORD WINAPI Fun(LPVOID lpParamter){ cout<<"Fun display" << endl;原创 2013-08-22 18:36:44 · 1386 阅读 · 0 评论 -
第一次试用vc2010的openmp功能, 多线程并行执行for循环
原文地址:http://hi.baidu.com/widebright/item/83f648c365c79709c710b234第一次试用vc2010的openmp功能, 多线程并行执行for循环vc2010的支持好像很不错了,直接在 工程属性-》c++ -》 language 里面把 openmp设置为开启就可以了转载 2013-08-22 10:44:31 · 1924 阅读 · 0 评论 -
OpenMP学习之--数据环境(代码示例)
原文地址:http://blog.csdn.net/augusdi/article/details/8807541这是里把OpenMP常用的数据环境construct用代码示例的方法写出来了,主要包括private,firstprivate,lastprivate和copyin。注释部分对这几种construct作用和区别描述已经很详细了,这里就补多说,相信演示代码会有更好的效果。转载 2013-08-22 10:43:46 · 881 阅读 · 0 评论 -
关于linux下的openmp编程基础
原文地址:http://blog.chinaunix.net/uid-13327770-id-2902332.html2009-06-10 10:56:26分类: LINUX OpenMP是专门针对共享地址空间的平行计算机提供的并行计算库,在Intel C++和Visual C++ 8.0里通过#pragma支持。用OpenMP,可以不必去转载 2013-08-22 13:31:40 · 6185 阅读 · 0 评论 -
openMP的一点使用经验
原文地址:http://www.cnblogs.com/yangyangcv/archive/2012/03/23/2413335.html最近在看多核编程。简单来说,由于现在电脑CPU一般都有两个核,4核与8核的CPU也逐渐走入了寻常百姓家,传统的单线程编程方式难以发挥多核CPU的强大功能,于是多核编程应运而生。按照我的理解,多核编程可以认为是对多线程编程做了一定转载 2013-08-22 00:08:20 · 832 阅读 · 0 评论 -
【转】【系列讲座】OpenMP 入门
原文地址:http://hi.baidu.com/diwulechao/item/bc6d865c411b813c32e0a9322012-03-13 10:55 【转】【系列讲座】OpenMP 入门(转) OpenMP是一个业界的标准,很早以前就有了,只是近一段时间才逐渐热起来。我们可以在C/C++和Fortran使用OpenMP、很容易的引入多线程。转载 2013-08-22 00:15:44 · 1030 阅读 · 0 评论 -
从头到尾彻底解析哈希表算法
原文地址:http://blog.jobbole.com/49229/原文出处: 研究者July说明:本文分为三部分内容,第一部分为一道百度面试题Top K算法的详解;第二部分为关于Hash表算法的详细阐述;第三部分为打造一个最快的Hash表算法。第一部分:Top K 算法详解问题描述百度面试题:搜索引擎会通过日志文件把用户每次检索使用的所有检索串都转载 2013-10-10 23:53:31 · 817 阅读 · 0 评论 -
理解矩阵(二)
接着理解矩阵。上一篇里说“矩阵是运动的描述”,到现在为止,好像大家都还没什么意见。但是我相信早晚会有数学系出身的网友来拍板转。因为运动这个概念,在数学和物理里是跟微积分联系在一起的。我们学习微积分的时候,总会有人照本宣科地告诉你,初等数学是研究常量的数学,是研究静态的数学,高等数学是变量的数学,是研究运动的数学。大家口口相传,差不多人人都知道这句话。但是真知道这句话说的是什么意思的人,好像也不转载 2013-01-03 11:11:40 · 623 阅读 · 0 评论 -
海量数据相似度计算之simhash和海明距离
海量数据相似度计算之simhash和海明距离Posted on 25 八月, 2013by lanceyan| 6条评论通过 采集系统 我们采集了大量文本数据,但是文本中有很多重复数据影响我们对于结果的分析。分析前我们需要对这些数据去除重复,如何选择和设计文本的去重算法?常见的有余弦夹角算法、欧式距离、Jaccard相似度、最长公共子串、编辑距离等。这些算法对于待比较的转载 2013-10-16 20:02:47 · 984 阅读 · 0 评论 -
【转载】Gallery of Processor Cache Effects —— 7个简单至极的代码示例,覆盖了Cache Line、Cache Size、False Sharing等重要知识点
原文地址:http://igoro.com/archive/gallery-of-processor-cache-effects/转载 2014-04-13 23:15:22 · 1054 阅读 · 0 评论 -
十道海量数据处理面试题与十个方法大总结
原文地址:http://kb.cnblogs.com/page/95701/第一部分、十道海量数据处理面试题 1、海量日志数据,提取出某日访问百度次数最多的那个IP。 此题,在我之前的一篇文章算法里头有所提到,当时给出的方案是:IP的数目还是有限的,最多2^32个,所以可以考虑使用hash将ip直接存入内存,然后进行统计。 再详细介绍下此方案:首先是这一天,并且是转载 2014-03-30 23:42:31 · 873 阅读 · 0 评论 -
【重新上本科】在实际问题中,内存赋值所拖累的效率(java版本)
继续上一篇博文《【重新上本科】在实际问题中,内存赋值所拖累的效率(c++版本)》。由于实际工作中同事的目标语言是java,所以我用相同的程序在java上面又尝试了一下。先说下结论吧:有效率提升,不过提升幅度远小于在c++上面的效果。代码如下:public static void TestCopyingMemCost () throws IOException { int ARRAY原创 2014-03-07 20:12:44 · 1040 阅读 · 0 评论 -
【转载】信息检索IR的评价指标综述
原文地址:http://blog.sina.com.cn/s/blog_72995dcc01013oo9.html信息检索评价是对信息检索系统性能(主要满足用户信息需求的能力)进行评估的活动。通过评估可以评价不同技术的优劣,不同因素对系统的影响,从而促进本领域研究水平的不断提高。信息检索系统的目标是较少消耗情况下尽快、全面返回准确的结果。IR的评价指标,通常分为三个方面转载 2014-03-12 18:12:35 · 1373 阅读 · 0 评论 -
【重新上本科】在实际问题中,内存赋值所拖累的效率(c++版本)
这几天和同事们在讨论技术方案,现有的功能、服务已经实现了,主要是后续代码优化和效率提升。code review过程中发现了一个效率瓶颈。故事大概是这样的,同事需要在一大坨的数据中按照某种标准缩小范围,如:数据池有1T数据,我们根据某种条件过滤,满足条件的有1G数据。在这小范围数据集合中,再进一步做数据处理和选择,如:找最小值或者最大值。同事在缩小数据范围的时候,将所有满足条件的数据都存到了一个bu原创 2014-02-27 20:03:08 · 1820 阅读 · 0 评论 -
【转载】Java语言中使用OpenMP
从前自己做些尝试性的东西,用到OMP,都是在C++语言中,参考从前博文:《简单尝试windows多线程程序》《通过 GCC 学习 OpenMP 框架》《关于linux下的openmp编程基础》今天跟同事讨论,要在java语言环境中使用MPI,我就想到了OMP,上网查了下,在java中如何使用OMP,copy原文如下。原文地址:http://blog.csdn.net/r转载 2014-02-26 13:33:08 · 2249 阅读 · 0 评论 -
【重新上本科】从一道笔试题来看数组和指针的区别(c++)
今天整理笔试题,将来作为我们这些人笔试、面试新同学的参考。题目的来源多种多样,有的有参考答案,有的没有。没有的,我就自己想想,填上去,然后发给大家校对。有道题目我没有做对,是考察c/c++的指针和数组的,组内同学指出后,我又尝试了下、想了想,现在想通了,记录下来。哎,手艺荒废好久,也要时常捡一捡。或者当初就是没弄扎实,那就每天进步一点点。感谢二师兄的指正!题目是这样的:对于sh原创 2014-02-25 00:21:56 · 1346 阅读 · 0 评论 -
【转载】Stanford机器学习---第三讲. 逻辑回归和过拟合问题的解决 logistic Regression & Regularization
原文地址:http://blog.csdn.net/abcjennifer/article/details/7716281本栏目(Machine learning)包括单参数的线性回归、多参数的线性回归、Octave Tutorial、Logistic Regression、Regularization、神经网络、机器学习系统设计、SVM(Support Vector Ma转载 2014-01-08 00:20:10 · 1228 阅读 · 0 评论 -
强连通分量的三种算法和四种实现
原文地址:http://kinslovertec.blogbus.com/logs/44636955.html 常见的(我见过的)强连通分量的三种算法有:1. Kosaraju算法(双DFS)2.Tarjan算法 3.Gabow一.Kosaraju算法算法的核心实现是,首先DFS一遍,得到一个DFS森林,在此过程中得到所有点的拓扑序列(按结束时间转载 2013-11-02 17:20:51 · 1193 阅读 · 0 评论 -
翻译:web制作、开发人员需知的Web缓存知识
翻译:web制作、开发人员需知的Web缓存知识by zhangxinxu from http://www.zhangxinxu.com本文地址:http://www.zhangxinxu.com/wordpress/?p=3338本文原址:http://www.mnot.net/cache_docs/(常年更新)已有译作:面向站长和网站管理员的Web缓存加速指南(2007-09转载 2013-06-15 18:54:16 · 1004 阅读 · 0 评论 -
新手必读:session和cookie的区别
原文地址:http://www.chinahtml.com/1007/128010707619425.html 发表时间:2010-07-26内容来源:站长资讯收集整理session和cookie是网站浏览中较为常见的两个概念,也是比较难以辨析的两个概念,但它们在点击流及基于用户浏览行为的网站分析中却相当关键。基于网上一些文章和资料的参阅,及作者个人的应用体会,对这两个概念做一个简单的阐述转载 2013-05-07 20:33:42 · 741 阅读 · 0 评论 -
【重新上本科】字符串匹配算法汇总
转载,总结了字符串匹配的各种算法,并且有源码链接。原文链接:http://mindlee.net/2011/11/25/string-matching/。 分类:算法学习 | 作者:酷~行天下 | 发表于2011/11/25 5条评论 2,768 views 字符串 T = abcabaabcabac,字符串 P = abaa,判断P是否是T的子串,就是字符串匹配问题了转载 2012-10-23 19:28:59 · 1540 阅读 · 0 评论 -
【Q&A】去除stl vector中特定位置的多个元素
我个人常用stl vector来构建基础数据结构,实现一些算法。有时候会有这样的需求,就是我要删除满足某些条件的vector中的元素,例如:删除所有大于零的元素。这就需要遍历整个数组,找到这些元素,并且删除。有两种策略。直观的一种是在遍历的过程中,判断当前元素是否符合删除条件,如果符合,则调用vector的erase函数进行删除,注意这时候数组内容发生变化,iterator原则上失效,会影响到遍历原创 2012-09-15 15:46:14 · 2467 阅读 · 1 评论 -
【我要去面试】单向链表反转
又到一年一次的招聘季,很多莘莘学子该忙起来了,复习基础知识,搜索面试题。面试题里面比较经典的是单向链表反转,就是一个单向链表,就地反转。这个面试题主要考查:1. 基础知识(单向链表设计);2. 边界条件检查(空链表、是否遍历到链表尾、链表头的处理等);3. 代码风格等。这两天手痒,自己写了一个,调通。这个题稍稍费心思的地方是:到底需要多少个指针来存放当前节点以及后面的节点;以及,按照什原创 2012-08-22 22:12:48 · 1091 阅读 · 0 评论 -
【重新上本科】快速排序【下】
在我的印象中,绝大多数的教科书讲解快速排序的时候,都用严蔚敏书中的方法,采用左右两个迭代指示器,从两个方向进行遍历比较。能不能只从一个方向进行遍历,遍历一遍就能完成交换任务呢?《算法导论》提供了一种方法。《算法导论》是从左到右遍历,设定两个指示器(从这个角度来说本质上与严蔚敏的方法一致),一个指示器指示当前遍历的位置,另一个指示的位置,该位置之前的元素(直到数组起始位置)的值都小于锚值原创 2012-08-20 22:54:01 · 475 阅读 · 0 评论 -
【重新上本科】快速排序【中】
上面的代码很罗嗦,关键在于锚值的处理上面绕了弯路。如何绕了弯路呢?我们还是简单回顾一下上述的过程:首先,我们设定第一个值是锚值,然后从第二个元素起,开始向后遍历,寻找第一个比锚值大的数值的位置;然后,从相反的方向,找到第一个比锚值小的数值的位置;接下来将两个值交换,重复这个过程,直到迭代指示器“相遇”。在这个过程中,锚值的位置,也就是数组的第一个元素并没有改变,它只是静静的等待两个迭代指示器相遇,原创 2012-08-20 22:09:44 · 687 阅读 · 0 评论 -
【重新上本科】快速排序【上】
去年,刚刚老同学庆祝本科毕业十周年。十年了,很多当年老师教的基础知识都忘记了。这几天捡起来再看看,复习一下,顺便写成博客。因为毕业后干的是码农的活儿,所以尽量用代码说话。 快速排序,在《算法导论》中是经典的分治算法,就是将问题分解成若干的子问题,子问题的解组成了整个问题的解。快速排序也是经典的递归算法的应用。 快速排序的函数原型通常定义如下: void QuickSor原创 2012-08-20 21:10:09 · 815 阅读 · 0 评论 -
【重新上本科】堆排序【上】
堆排序很有意思。作为排序算法来讲,它和快速排序都是O(nlogn)的时间复杂度,都是就地排序,都是采用递归。两者差不多,既生瑜,何生亮?不过堆是一种很有用的数据结构,通过堆排序算法,可以学习堆这种数据结构,以后可能用得上。堆排序算法思路很简单:第一步,构建一个堆;第二步,取出堆顶;第三步,如果排序没完成,重复第一步。堆分为最大堆和最小堆,表示堆的顶点元素是整个序原创 2012-08-21 15:11:07 · 554 阅读 · 0 评论 -
【重新上本科】排序【调试环境】
上面列了几个排序算法的代码,这些代码都是经过debug,程序验证过的。我顺便也把验证的环境贴出来吧。很多东西,其实是写给自己看的。 一、随机数生成程序,生成一定数量的随机数,用于排序,结果记录在文件中。bool GenerateNum(const char *sFileOut, int iCount){if (iCount return false;of原创 2012-08-21 16:21:01 · 519 阅读 · 0 评论 -
【重新上本科】堆排序【下】
堆调整函数解决的问题是:当除了堆顶以外的元素都满足堆的条件,如何调整堆顶元素,使整个序列满足堆的条件。堆的条件,是啥?其实堆是棵二叉树,满足父节点的数值比两个儿子节点的数值大。那么如何解决上述问题呢?思路也很简单:将父节点与两个儿子节点比较,找到最大的那个,放到堆顶,将原来堆顶元素放到最大元素的原来位置,然后对这颗子树递归调用堆调整函数。更一般地说,对于堆中第i个节点,如何调整堆中的元原创 2012-08-21 15:51:19 · 696 阅读 · 0 评论 -
海量数据处理常用思路和方法
原文链接:http://blog.chinaunix.net/uid-26565142-id-3127581.html 1.Bloom filter 适用范围:可以用来实现数据字典,进行数据的判重,或者集合求交集 基本原理及要点: 对于原理来说很简单,位数组+k个独立hash函数。将hash函数对应的值的位数组置1,查找时如果发现所有hash函数对应位都是1说明存转载 2012-11-07 10:12:52 · 640 阅读 · 0 评论 -
【基础知识】An Implementation of Double-Array Trie
原文地址:http://linux.thai.net/~thep/datrie/datrie.html ContentsWhat is Trie?What Does It Take to Implement a Trie?Tripple-Array TrieDouble-Array TrieSuffix CompressionKey InsertionKey DeletionD转载 2012-11-16 14:04:27 · 1259 阅读 · 0 评论 -
【基础知识】Darts: Double-ARray Trie System
原文:http://guoxinmiao8.blog.sohu.com/155691111.html 和 http://www.newsmth.net/nForum/#!article/NLP/8812参考链接: http://code.google.com/p/darts-clone/wiki/ClassInterfaceDarts 是用于构建双数组 Double-A转载 2012-12-03 23:33:58 · 3711 阅读 · 1 评论 -
浅析http协议、cookies和session机制、浏览器缓存
原文地址:http://blogread.cn/it/article/6085?f=sa 最近几天在复习http协议中headers,cookies、session、缓存等相关知识,发现些新知识点。这篇文章注重结合PHP去理解这些内容,也就是比较注重实践部分。http headers NO1:对于web应用,用户群在客户端 (各种浏览器)点击任何一个连接向服务器发送h转载 2013-05-07 20:05:00 · 1175 阅读 · 0 评论 -
【基础知识】浅谈HTTP中Get与Post的区别
原文地址 :http://www.cnblogs.com/hyddd/archive/2009/03/31/1426026.html浅谈HTTP中Get与Post的区别2009-03-31 14:51 by hyddd, 86720 阅读, 50评论,收藏, 编辑 Http定义了与服务器交互的不同方法,最基本的方法有4种,分别是GET,POST,PUT,D转载 2013-04-11 12:13:05 · 691 阅读 · 0 评论 -
【基础知识】Url参数格式
原文地址:http://board.locoy.com/api.htmUrl参数格式列表如下:注意:以下示例中省略type,user,pwd这三个参数。a、所有的请求返回结果格式都可以是Xml或Json的,默认的类型在服务器启动参数里设置,也可以通过type=xml或type=json参数强制指定。b、在服务器不允许匿名访问的情况下,所有请求Url中必须包含us转载 2013-04-11 12:20:22 · 29260 阅读 · 0 评论 -
【重新上本科】关于“static”关键字的点滴
在面试的时候,考察语言基础的时候,有时候会遇到问题“static关键字的作用是什么”,以及相关的问题。这篇文章里面尽可能总结的全面一点。对于c语言。static可以修饰c语言的变量,表示静态变量,有个很cool的(或者和普通变量很不一样)的属性,就是他的生命周期与当前的生命周期一样。典型的场景就是:在函数中定义了static变量,在函数外面还能够引用这个变量。经常用来作计数器。这是原创 2013-03-24 22:15:38 · 991 阅读 · 0 评论