自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

u010384318的专栏

机器学习 语音识别 ing

  • 博客(28)
  • 资源 (4)
  • 收藏
  • 关注

原创 scikit learn 安装及注意事项

终于折腾完了,一下午就折腾这个scikit learn。其实,上次就已经知道这个工具了,但苦于上次没能安排。下午,老师出去上课,我就开始这个安装。希望你可以很快的安装。      前几天,安装python第三方库时出现各种不兼容问题。在qq群里有人跟我说用easy_install。从那开始,在python安装我都用这个了。一来比较方便。二来肯定是对的,不会出错。      好了,进入正题。

2013-09-29 16:53:49 15658 2

原创 这几天——数学建模

这几天,一直在忙数学建模,所以博客里面的内容也就停下来,在qq上感谢那些支持我的人。其实做研究生数学建模的意义只是圆自己在研究生三年中参加比赛的,要不要研究生又得碌碌无为。很累这几天,今天下午一觉睡得旁晚。收拾下房间,继续新的生活。     感谢两位队友的配合,让我感觉这次的比赛比本科的比赛更有感觉点。也就两三年的时间,我似乎对有些问题的认识似乎提高了,但是我的缺点是对问题的深入不够。在剩下的

2013-09-24 21:34:56 1222 1

原创 推荐系统知识的文摘和总结3----slope one

明天就是中秋节了。这里就不发月饼了,祝大家吃好喝好玩好。     进入正题,看到一个模型叫slope one。然后查看了一些资料。现在总结下,以备后用。     先来说下基本原理:用户 对事物A打分对事物B打分X34Y24Z4?大家来猜下?处的值是多少?按照http://www.fu

2013-09-18 15:58:25 1621

原创 推荐系统知识文摘和总结2

这篇主要是介绍具体的推荐系统。同样,希望可以加深理解和认识。ok,进入正题。1.基于人口统计学的推荐。它比较容易实现,原理是根据系统用户的基本信息发现用户的相关程度,然后把相似用户喜爱的其他物品推荐给当前用户。看着这个图,应该很好理解吧。下面就说下优点和缺点:优点:1.由于不适用当前用户对物品的喜好历史数据,所以对新用户来说没有“冷启动”的问题;            2.

2013-09-17 23:45:59 1346

原创 推荐系统知识的文摘和总结1

感觉自己这个初学者也许太急功近利了。之前的一些基本概念看得都忘了差不多了,今晚特此总结。希望可以得到更深刻的理解和认识。我是参考IBM的《探索推荐引擎内部的秘密》这里面第一部分---推荐引擎初探来总结。下面是主要内容:    1.分清楚搜索引擎和推荐引擎的区别。     搜索引擎就是你有个固定的关键词,然后你在百度,google里面去搜索,得到你想要的资料。也就是你有个明确的目标,这样找肯

2013-09-17 22:51:38 1132

原创 推荐系统自己实践-----基于用户的推荐

最近,计划把推荐系统的几种方法一一用《集体智慧编程》这本书的代码实现。一来是为了自己更加熟练python语言的用法,然后可以更好的去理解这些推荐系统的概念。今天是第一个,是基于用户的推荐。怎么去理解呢?就是利用用户之间的关系去推荐。还不明白?那就引用《推荐系统实践》上说的。每当新学期,刚进实验室的学弟学妹总会问学长学姐们,应该需要去看哪些书?看哪些论文等等。我们作为学长学姐的肯定要告诉学弟学妹们应

2013-09-16 21:42:27 1801

原创 推荐系统自己去实践------第一个初步推荐系统movie

终于在一系列的折腾,终于调试成功。这段时间自己去看了下python编程,得到的结论是编程语言是相通的,其他的都只是规则,只要足够的练习,一定会懂得怎么去用。这对编程能力弱的我,的确是增加了我的信心。    ok,进入正题。    我在参考http://blog.csdn.net/killua_hzl/article/details/7708201这篇文章的程序基础上实现的。主要是搭建系统的

2013-09-15 00:08:11 2223

转载 漫谈:机器学习中距离和相似性度量方法

漫谈:机器学习中距离和相似性度量方法在机器学习和数据挖掘中,我们经常需要知道个体间差异的大小,进而评价个体的相似性和类别。最常见的是数据分析中的相关分析,数据挖掘中的分类和聚类算法,如 K 最近邻(KNN)和 K 均值(K-Means)等等。根据数据特性的不同,可以采用不同的度量方法。一般而言,定义一个距离函数 d(x,y), 需要满足下面几个准则:1) d(x,x) = 0

2013-09-13 16:23:58 1559 1

转载 经典的机器学习方面源代码库(数据挖掘,计算机视觉,模式识别,信息检索)

今天给大家介绍一下经典的开源机器学习软件:编程语言:搞实验个人认为当然matlab最灵活了(但是正版很贵),但是更为前途的是python(numpy+scipy+matplotlib)和C/C++,这样组合既可搞研究,也可搞商业开发,易用性不比matlab差,功能组合更为强大,个人认为,当然R和java也不错.1.机器学习开源软件网(收录了各种机器学习的各种编程语言学术与商业的开源软件)

2013-09-13 16:08:09 1767

原创 语音知识回顾和总结------短时时域分析

又见面了……!继续回顾上次的内容,上次主要是说语音的预处理,预处理包括预加重,加窗分帧。其实还是不难的,主要考虑语音是个特殊的,具有短时平稳性。       接下来,我们来说下语音的时域性质,时域就是随时间变化的,时域我们可以考虑波形,可以用示波器去观察。时域分析比较简单,直观,物理意义明确。       短时时域分析包括短时能量,短时过零率,短时自相关函数,短时平均幅度差函数等。下面一个

2013-09-13 12:45:19 5833 1

转载 如何阅读科研论文

如何阅读科研论文  英文原文:How to Read a Paper  1. 引言  科研人员必须阅读论文的几个理由:为了会议或者学生审稿、为了在本领域中保持消息灵通、为了解新领域进行文献调研。一个典型的科研人员每年可能要花费几百小时去阅读论文。  学会有效地阅读论文是一项非常重要但是很少会有机会学到的技能。正因为这样,新入学的研究生都是在“

2013-09-12 21:19:39 1195

原创 语音知识回顾和总结----语音信号的预处理

回顾上两次的内容:上次主要说了音频文件的读取(主要是matlab和c语言)。感觉有几个概念有点混淆:语音、音频、音乐。语音英文是speech,音频是audio,音乐是music。据我的理解是音频包括语音和音乐。(不知道这么理解对不?)。此外,读取音频其实可以理解D/A转化吗?有待确定。希望基础知识可以更加牢固点。接下来,我们进入正题。     这次,说语音信号的预处理。其实预处理是很重要的,它

2013-09-11 18:47:19 3959

原创 语音知识回顾和总结-----读取语音之c语言版本

一开始,先煽情下。(呵呵……)明天就是教师节了,在这里祝愿所有的老师们身体健康,工作顺利。或许若干年后,我也可以过这个节日。ok,回归正题,接着昨晚的继续说。        昨晚说到matlab读取语音,感觉一个很简单的读取语音是不是给我说复杂了。希望大家给予批评和指正。接下来,就真正的进入主题了,希望大家可以学到想学的。c语言读取语音就没matlab那么简单了。读取wav文件,主要是

2013-09-09 20:37:46 3626

转载 推荐系统的循序进阶读物(从入门到精通)

推荐系统-从入门到精通为了方便大家从理论到实践,从入门到精通,循序渐进系统地理解和掌握推荐系统相关知识。特做了个读物清单。大家可以按此表阅读,也欢迎提出意见和指出未标明的经典文献以丰富各学科需求(为避免初学者疲于奔命,每个方向只推荐几篇经典文献)。1. 中文综述(了解概念-入门篇)a) 个性化推荐系统的研究进展b) 个性化推荐系统评价方法综述2. 英文综述(了解概念-进阶篇

2013-09-09 17:08:38 1310 1

原创 语音知识回顾和总结----语音的介绍和读取语音文件

写在前面的话:         或许是时候做些总结了,自己这段时间一直在看各种东西。比如:学习c语言,学习数据结构,学习机器学习和数据挖掘的一些算法。回想起来,也许这些侧面反映我这个人的本性,不喜欢自己一个人去深究一些问题。所以我学习要不跟着老师,跟着视频,跟着目标去学习,要是散漫的去学习,总学到些毛皮。所以借总结之名,给自己适当的压力,让自己去更深层次的去了解这些知识。欢迎大家赐教,小弟不甚

2013-09-08 22:25:48 2818

转载 学术分享资料

最强大的工具:http://www.google.com http://www.baidu.com代码相关:google代码搜索:http://www.google.com/codesearchgoogle代码:http://code.google.com 提供项目托管功能sourceforge开源项目社区:http://www.sourceforge.netpud

2013-09-08 21:05:44 1654

原创 致2013级学弟学妹----语音和其他

今天由于去教研室弄研究生数学建模,很开心由于我的到来,大家都来实验室。然而,大家在教研室做的事情让我感觉大家还是比较迷茫。而我又是一个多事的人,所以特写下此文,希望可以可以给大家一些帮助,如有任何问题,欢迎讨论。      ok,进入正题。      首先,我来说说语音的事情吧。实验室的很多事情都和语音有关,所以做图像和视频的或许你只是借鉴这些想法吧。第一,介绍书吧。网址:http://n

2013-09-08 20:25:15 3424 4

转载 流行的开源数据挖掘tool

IDMer说道:本文只对几种流行的开源数据挖掘平台进行了检视,比如Weka和R等。如果您想找寻更多的开源数据挖掘软件,可以到KDnuggets和Open Directory上查看。为了评测这些软件,我们用了UCI Machine Learning Repository上的心脏病诊断数据集。 R R (http://www.r-project.org) 是用于统计分析和图形化的计算机语言及分析工具,

2013-09-07 14:40:42 1081

转载 数据集-用于数据挖掘、信息检索、知识发现等

1、气候监测数据集 http://cdiac.ornl.gov/ftp/ndp026b2、几个实用的测试数据集下载的网站http://www.cs.toronto.edu/~roweis/data.htmlhttp://www.cs.toronto.edu/~roweis/data.htmlhttp://kdd.ics.uci.edu/summary.task.type.h

2013-09-07 14:38:19 1238

转载 Weka数据挖掘

WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过http://www.cs.waikato.ac.nz/ml/weka得到。同时weka也是新西兰的一种鸟名,而WEKA的主要开发者来自新西兰。详见 http://www.china-pub.com/computers/common/info.as

2013-09-07 14:23:35 1764

转载 十大数据挖掘算法

国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 2006年12月评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost, kNN, Naive Bayes, and CART.不仅仅是选中的十大算法,其实参加评选的18种算法,实际

2013-09-07 14:18:40 1207

转载 一位数据挖掘成功人士给数据挖掘在读研究生的建议

关于数据挖掘方面的研究,我原来也走过一些弯路。其实从数据挖掘的起源可以发现,它并不是一门崭新的科学,而是综合了统计分析、机器学习、人工智能、数据库等诸多方面的研究成果而成,同时与专家系统、知识管理等研究方向不同的是,数据挖掘更侧重于应用的层面。因此来说,数据挖掘融合了相当多的内容,试图全面了解所有的细节会花费很长的时间。因此我建议你的第一步是用大概三个月的时间了解数据挖掘的几个常用技术:分

2013-09-07 12:43:23 1806

转载 中文分词技术(中文分词原理)

中文分词技术(中文分词原理)一、 为什么要进行中文分词?词是最小的能够独立活动的有意义的语言成分,英文单词之间是以空格作为自然分界符的,而汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。Lucene中对中文的处理是基于自动切分的单字切分,或者二元切分。除此之外,还有最大切分(包括向前、向后、以及前后相结合)、

2013-09-05 21:08:54 1982

转载 数据结构之---哈希

(*H).elem=NULL;        (*H).count=0;        (*H).sizeindex=0;}// 一个简单的哈希函数(m为表长,全局变量)unsigned Hash(KeyType K){         return K%m;}// 开放定址法处理冲突void collision(int *p,int d) // 线性探测再

2013-09-05 16:20:29 953

转载 谷歌三大核心技术(二)Google MapReduce中文版

拷贝(一般是3个拷贝)。MapReduce的 master在调度Map任务时会考虑输入文件的位置信息,尽量将一个Map任务调度在包含相关输入数据拷贝的机器上执行;如果上述努力失败 了,master将尝试在保存有输入数据拷贝的机器附近的机器上执行Map任务(例如,分配到一个和包含输入数据的机器在一个switch里的 worker机器上执行)。当在一个足够大的cluster集群上运行大型MapRedu

2013-09-03 19:16:28 1632

转载 谷歌技术"三宝"之MapReduce

江湖传说永流传:谷歌技术有"三宝",GFS、MapReduce和大表(BigTable)!谷歌在03到06年间连续发表了三篇很有影响力的文章,分别是03年SOSP的GFS,04年OSDI的MapReduce,和06年OSDI的BigTable。SOSP和OSDI都是操作系统领域的顶级会议,在计算机学会推荐会议里属于A类。SOSP在单数年举办,而OSDI在双数年举办。那么这篇博客就来介绍一下

2013-09-03 19:14:18 1359

转载 国内外推荐系统应用总结

最近对推荐系统非常有兴趣,也在做一些这方面的研究。学习成熟的产品是提升自己产品的一个非常好的方法,所以在这里,我会总结一些国内外推荐系统方面的应用,肯定不会写的全,所以还希望看到这篇文章的童鞋可以帮忙补充。1、商城系统:说起商城系统,甚至说起推荐系统,当然会首推Amazon,Amazon是国内外做推荐系统起步最早的一批公司,而且现在是做的最好的。当你进入首页后,你会看到系统

2013-09-02 16:41:14 4672

转载 推荐系统论文分类推荐

推荐系统论文分类推荐搭建1、http://www.cnblogs.com/vivounicorn/archive/2011/09/20/2182433.html2、http://www.cnblogs.com/vivounicorn/archive/2011/10/08/2201986.html3、https://cwiki.apache

2013-09-02 16:39:21 1607

语音识别kaldi安装

语音识别系统之kaldi安装。里面有具体步骤,欢迎下载。

2013-12-13

julius-4.2.3

语音识别工具箱 非常好用的,可以自行运行 不懂的私信我

2013-10-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除