算法
文章平均质量分 88
class_brick
以我所经,引以为幸
展开
-
蓄水池算法简介
长度为N的数据流,要从中随机取得k个数据,N很大(可能大于你的内存和磁盘容量)且未知,只能遍历一次,求怎样可以取得完全随机的k个数据。方法为:1、定义一个长度为k的数组存储前k个数据2、数据流流动,当输入的数据流的数据数量为i(k完成这两步之后便可以实现在长度为N的数据流中取出k个随机数的目的了。接下来将会证明对于N个数据,每个数据被取到的概率均为k/N。证原创 2015-06-20 23:32:46 · 1807 阅读 · 2 评论 -
语音特征MFCC提取过程详解
转自:https://blog.csdn.net/jojozhangju/article/details/18678861原来对语音特征参数MFCC的提取过程不是很了解,最近做实验需要自己手动去提取,所以借此机会,深入的学习了一下,所以记录下来,希望能够对日后的学习有一定的帮助。一、MFCC概述 在语音识别(SpeechRecognition)和话者识别(SpeakerRecogn...转载 2018-09-17 15:39:15 · 62181 阅读 · 2 评论 -
VSM向量空间模型
转自: http://blog.csdn.net/erliang20088/article/details/45790003一直在做自然语言处理相关的应用开发工作,一直没能抽时间做相关的系统组件或是算法分析工作,最近有时间,将自然语言处量相关的分词、 搜索、各种计算统计分析模型都看了下,收获不少,因时间关系,就以自己的见解来解释下好像挺复杂的vsm吧,其实超简单。转载 2018-01-23 11:30:20 · 1015 阅读 · 0 评论 -
信息检索中的TF/IDF概念与算法的解释
概念 TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜寻引擎应用转载 2018-01-23 09:41:43 · 7041 阅读 · 0 评论 -
机器学习九大算法---朴素贝叶斯分类器
带你搞懂朴素贝叶斯分类算贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单,也是常见的一种分类方法。这篇文章我尽可能用直白的话语总结一下我们学习会上讲到的朴素贝叶斯分类算法,希望有利于他人理解。1 分类问题综述 对于分类问题,其实谁都不会陌生,日常生活中我们每天都进行着转载 2017-12-19 09:53:35 · 798 阅读 · 0 评论 -
大白话讲解word2vec构建词向量
词向量word2vec也叫word embeddings,中文名“词向量”,作用就是将自然语言中的字词转为计算机可以理解的稠密向量(Dense Vector)。在word2vec出现之前,自然语言处理经常把字词转为离散的单独的符号,也就是One-Hot Encoder。杭州 [0,0,0,0,0,0,0,1,0,……,0,0,0,0,0,0,0]上海 [0,0,0,0,1,0,0,0转载 2017-12-27 10:00:48 · 19731 阅读 · 2 评论 -
机器学习几种常见优化算法介绍
1. 梯度下降法(Gradient Descent)2. 牛顿法和拟牛顿法(Newton's method & Quasi-Newton Methods)3. 共轭梯度法(Conjugate Gradient)4. 启发式优化方法 5. 解决约束优化问题——拉格朗日乘数法我们每个人都会在我们的生活或者工作中遇到各种各样的最优化问题,比如每个企业和个人都要考虑的一个问转载 2018-01-02 09:58:26 · 738 阅读 · 0 评论 -
马尔科夫场基本概念
转自:http://blog.csdn.net/carson2005/article/details/393674811、随机过程:描述某个空间上粒子的随机运动过程的一种方法。它是一连串随机事件动态关系的定量描述。随机过程与其它数学分支,如微分方程、复变函数等有密切联系,是自然科学、工程科学及社会科学等领域研究随机现象的重要工具。 2、马尔科夫随机过程:是随转载 2017-10-17 16:06:30 · 484 阅读 · 0 评论 -
正则表达式转DFA
陈梓瀚 [email protected] http://www.cppblog.com/vczh/1、问题概述随着计算机语言的结构越来越复杂,为了开发优秀的编译器,人们已经渐渐感到将词法分析独立出来做研究的重要性。不过词法分析器的作用却不限于此。回想一下我们的老师刚刚开始向我们讲述程序设计的时候,总是会出一道题目:给出一个填入了四则运算式子的字符串,写程序计算该式子的结果。除此之外,我们有转载 2017-10-13 16:52:23 · 16965 阅读 · 2 评论 -
简单讲解KMP单模式匹配与AC算法多模式匹配(KMP篇)
前言本篇是对于KMP单模式匹配以及AC算法多模式匹配的简单讲解,KMP算法与AC算法是关键字检索中的常见算法,能够快速而高效地查找出目标字符串中的多个关键字的匹配情况,而要检索的关键字通常被称为模式串,因此模式匹配四个字也就好理解了。网上的很多对于KMP的讲解总是结合了很多的数学公式,很多的晦涩难懂的专业词语,让人看了很头大,至少对于蠢笨的我来说,实在是一场煎熬,因此本篇的说明尽量做到通俗易懂原创 2017-01-12 23:11:10 · 3342 阅读 · 1 评论 -
[总结]视音频编解码技术零基础学习方法
一直想把视音频编解码技术做一个简单的总结,可是苦于时间不充裕,一直没能完成。今天有着很大的空闲,终于可以总结一个有关视音频技术的入门教程,可以方便更多的人学习从零开始学习视音频技术。需要注意的是,本文所说的视音频技术,指的是理论层面的视音频技术,并不涉及到编程相关的东西。 0. 生活中的视音频技术平时我们打开电脑中自己存电影的目录的话,一般都会如下图所示,一大堆五花八门的电影。...转载 2018-09-29 10:11:13 · 356 阅读 · 0 评论