- 博客(9)
- 资源 (18)
- 收藏
- 关注
原创 【scikit-learn】如何进行模型参数的选择
内容概要这一节我们介绍以下几个内容:我们该怎样选择模型用于监督学习任务?我们该如何选择调整得到最好的模型参数?我们该如何对测试数据进行预测估计?1. 使用整个数据集进行训练和测试这里我们使用手中的整个数据集来训练模型使用同样的数据集来测试模型,然后评估预测的结果和真实结果的差别In [1]:fr
2015-05-29 18:54:19 8768 2
原创 【Spark】配置Spark源码阅读环境
Scala构建工具(SBT)的使用SBT介绍SBT是Simple Build Tool的简称,如果读者使用过Maven,那么可以简单将SBT看做是Scala世界的Maven,虽然二者各有优劣,但完成的工作基本是类似的。 虽然Maven同样可以管理Scala项目的依赖并进行构建,但SBT的某些特性却让人如此着迷,比如: 使用Scala作为DSL来定义build文件(one language
2015-05-28 16:18:46 1918
原创 【Scala】Scala函数式编程初探
函数式编程函数式编程是种编程典范,它将电脑运算视为函数的计算。函数编程语言最重要的基础是 λ 演算(lambda calculus)。而且λ演算的函数可以接受函数当作输入(参数)和输出(返回值)。和指令式编程相比,函数式编程强调函数的计算比指令的执行重要。和过程化编程相比,函数式编程里,函数的计算可随时调用。 命令式编程是面向计算机硬件的抽象,有变量(对应着存储单元),赋值语句(获取,存储指令),
2015-05-26 16:34:16 1559
原创 【python】Windows中编译安装libsamplerate和scikits.samplerate
librosa缘由librosa是一个音频和音乐处理的Python包,我用它来做音频的特征提取。但是在使用时,发现librosa.load将音乐文件转化为时间序列的过程中,速度实在难以忍受,cpu跑的非常高,程序好像假死的状态。 查阅官方文档发现,默认情况下,librosa会使用scipy.signal进行音频信号的重采样,这在实际使用时是很慢的。如果要获得很高的性能,官方建议安装libsampl
2015-05-14 11:33:37 3946 1
原创 【机器学习中的数学】多项式分布及其共轭分布
多项变量(Multinomial Variables)二元变量是用来描述只有两种可能值的量,而当我们遇到一种离散变量,其可以有K种可能的状态。我们可以使用一个K维的向量x表示,其中只有一维xk为1,其余为0。对应于xk=1的参数为μk,表示xk发生时的概率。其分布可以看做是伯努利分布的一般化。 现在我们考虑N个独立的观测D={x1,…,xN},得到其似然函数。如图: 多项式分布(The Mult
2015-05-11 22:22:48 5786
原创 【Git】认识各种开源协议及其关系
开源许可协议License是软件的授权许可,里面详尽表述了你获得代码后拥有的权利,可以对别人的作品进行何种操作,何种操作又是被禁止的。开源协议的种类现今存在的开源协议很多,而经过Open Source Initiative 组织通过批准的开源协议目前有60多种http://www.opensource.org/licenses/alphabetical。我们在常见的开源协议如BSD, GPL, LG
2015-05-11 11:06:51 4090
原创 【机器学习基础】支持向量回归
引言这一小节介绍一下支持向量回归,我们在之前介绍的核逻辑回归使用表示定理(Representer Theorem),将逻辑回归编程Kernel的形式,这一节我们沿着这个思路出发,看看如何将回归问题和Kernel的形式结合起来。Kernel Ridge Regression上次介绍的表示定理告诉我们,如果我们要处理的是有L2的正则项的线性模型,其最优解是数据zn的线性组合。我们可以将这样的线性模型变成
2015-05-03 23:36:15 21831 1
原创 【机器学习实验】使用朴素贝叶斯进行文本的分类
引言朴素贝叶斯由贝叶斯定理延伸而来的简单而强大的概率模型,它根据每个特征的概率确定一个对象属于某一类别的概率。该方法基于一个假设,所有特征需要相互独立,即任一特征的值和其他特征的值没有关联关系。 虽然这种条件独立的假设在许多应用领域未必能很好满足,甚至是不成立的。但这种简化的贝叶斯分类器在许多实际应用中还是得到了较好的分类精度。训练模型的过程可以看作是对相关条件概率的计算,它可以用统计对应某一类别
2015-05-03 23:34:23 10496 2
原创 【Linux Mint】通过vino-server共享Cinnamon桌面
Linux Mint Cinnamon桌面共享Linux Mint 17 Cinnamon桌面附带了预安装用于VNC桌面共享的vino-server,这样使用vncviewer连接linux桌面变得很容易,之前在ubuntu下使用vnc4server进行桌面共享有很多问题,网上同时也有使用xfce轻型桌面进行桌面共享的替代方案。不过这些效果终究不理想,于是找到了vino-server的这种方案。vi
2015-05-02 12:24:02 4448
Reactive Programming with Scala and Akka(Pdf格式)
2016-05-15
Learning scikit-learn Machine Learning in Python
2015-01-28
Building Probabilistic Graphical Models with Python
2015-01-28
Building.Machine.Learning.Systems.with.Python
2015-01-28
Visual Assist X 10.8.2043.0 完美破解版
2014-08-28
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人