机器学习
文章平均质量分 72
Heavbird
这个作者很懒,什么都没留下…
展开
-
斯坦福机器学习Coursera课程:第八次作业--推荐系统
根据已有的1682部电影和943用户及部分用户对电影的评分数据,对新用户作电影推荐或预测未评价的评分。一. 准备工作1. 加载ex8_movies.mat数据Y (1682*943) 用户评份数据,由1-5组成;R 标记矩阵,R(i,j)=1代表用户j评分了电影i,没评的为0;目标是对用户没评分的电影作预测;同时把预测分最高的电影推荐给用户。同时,为更好地理解矩阵Y原创 2018-01-29 17:00:17 · 547 阅读 · 0 评论 -
斯坦福机器学习Coursera课程:第六周作业--支持向量机(SVM)
中间停了一段,课程任务是完成了,但都没在博客上记录和更新。最近抽空重新翻看下,作以记录。本次作业主要两个内容:不同数据集的模型训练和垃圾邮件分类器。首先是把数据图形化展现后,根据不同的C值画出不同不分类边界(C相当于线性/逻辑回归线中的正则化参数),以对应C 较大时,相当于λ较小,可能会导致过拟合,高方差;C 较小时,相当于λ较大,可能会导致低拟合,高偏差;下面是C分别原创 2018-01-22 18:41:08 · 622 阅读 · 0 评论 -
Octave常用操作函数和技巧汇总
% 注释标识基本运算逻辑运算: 1==2 返回0,即false~= 不等于&& || XOR()输出或打印控制:赋值后加分号将不在屏幕上打印任何内容如, 比较a=3; a=3 的区别Disp(sprint(‘2 decimals: %0.2f’,a))) 或命令行中 format long, format short矩阵生成:A=[1,2; 3,4;5,6] V=[1,2,3] V=1原创 2018-01-17 20:23:22 · 6813 阅读 · 0 评论 -
斯坦福机器学习Coursera课程:第三周作业--逻辑回归
问题描述:用逻辑回归根据学生的考试成绩来判断该学生是否可以入学。这里的训练数据(training instance)是学生的两次考试成绩,以及TA是否能够入学的决定(y=0表示成绩不合格,不予录取;y=1表示录取)因此,需要根据trainging set 训练出一个classification model。然后,拿着这个classification model 来评估新学生能否入学。训练数据的成绩原创 2017-11-10 15:45:14 · 1866 阅读 · 3 评论 -
斯坦福机器学习Coursera课程:第二周作业--一元和多元线性回归
一元回归中,直接使用这两个公式,来绘制J(θ)的分布曲面,以及θ的求解路径。命题为:我们为一家连锁餐饮企业新店开张的选址进行利润估算,手中掌握了该连锁集团所辖店铺当地人口数据,及利润金额,需要使用线性回原创 2017-11-03 15:59:39 · 1089 阅读 · 1 评论 -
浅显易懂:长文揭秘图像处理和卷积神经网络架构
作者:DISHASHREE GUPTA近日,Dishashree Gupta 在 Analyticsvidhya 上发表了一篇题为《Architecture of Convolutional Neural Networks (CNNs) demystified》的文章,对用于图像识别和分类的卷积神经网络架构作了深度揭秘;作者在文中还作了通盘演示,期望对 CNN 的工转载 2017-10-25 19:49:14 · 842 阅读 · 0 评论 -
Pearson相关系数, Spearman相关系数,Kendall相关系数的区别
计算积距pearson相关系数,连续性变量才可采用;计算Spearman秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据; 计算Kendall秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据。 计算相关系数:当资料不服从双变量正态分布或总体分布未知,或原始数据用等级表示时,宜用 spearman或kendall相关 Pearson 相关复选项积差相关 计转载 2017-10-25 11:50:32 · 26472 阅读 · 0 评论 -
ubuntu14 python2.7上安装scipy,numpy,matplotlib的方法
sudo apt-get install python-nosesudo apt-get install python-scipysudo apt-get install python-numpysudo apt-get install python-matplotlibpythonimport scipyimport numpyimpo原创 2017-10-20 14:35:34 · 2143 阅读 · 1 评论 -
构建机器学习算法的方法和建议
构建一个机器学习算法的推荐方法为:1.从一个简单的能快速实现的算法开始,实现该算法并用交叉验证集数据测试这个算法2.绘制学习曲线,决定是增加更多数据,或者添加更多特征,还是其他选择3.进行误差分析:人工检查交叉验证集中我们算法中产生预测误差的实例,看看这些实例是否有某种系统化的趋势但是有时候,只使用绝对误差值未必能能作为评判算法效果的唯一依据,还要借助其它参数,尤其当我们的原创 2018-01-25 11:07:18 · 387 阅读 · 0 评论 -
机器学习算法的效果评估和优化方法
当我们运用训练好了的模型来预测未知数据的时候发现有较大的误差,我们下一步可以做什么?1.获得更多的训练实例——通常是有效的,但代价较大,下面的方法也可能有效,可考虑先采用下面的几种方法。2.尝试减少特征的数量3.尝试获得更多的特征4.尝试增加多项式特征5.尝试减少归一化程度λ6.尝试增加归一化程度λ 我们不应该随机选择上面的某种方法来原创 2018-01-24 20:31:54 · 3924 阅读 · 0 评论 -
斯坦福机器学习Coursera课程:第四周作业--人工神经网络
根据课程内容,先简要说下神经网络的基本思想和步骤:其实神经网络就像是logistic regression,只不过我们把logistic regression中的输入向量[x1~x3]变成了中间层的[a(2)1~a(2)3], 即h(x)=g(θ(2)0a(2)0+θ(2)1a(2)1+θ(2)2a(2)2+θ(2)3a(2)3)我们可以把a0,a1,a2,a3看成更为原创 2018-01-24 18:57:01 · 1634 阅读 · 0 评论 -
一文图解机器学习的基本算法
每当提到机器学习,大家总是被其中的各种各样的算法和方法搞晕,觉得无从下手。确实,机器学习的各种套路确实不少,但是如果掌握了正确的路径和方法,其实还是有迹可循的,这里我推荐SAS的Li Hui的这篇博客,讲述了如何选择机器学习的各种方法。 另外,Scikit-learn 也提供了一幅清晰的路线图给大家选择:其实机器学习的基本算法都很简单,下面我们就利用二维数据和交互图形来看看机器学习转载 2018-01-25 16:46:22 · 485 阅读 · 0 评论 -
斯坦福机器学习Coursera课程:第五次作业--正则多项式回归和误差分析
本次作业主要是实现正则化多项式回归,画出训练误差和交叉测试误差随训练用例数量变化的曲线,分析高偏差和高方差的影响因素,最后画出的取值变化对误差的影响曲线。主要函数文件如下 ,需要实现最后4个带*文件的函数。ex5.m - Octave/MATLAB script that steps you through the exerciseex5data1.mat - Datasets原创 2018-01-25 15:28:50 · 890 阅读 · 0 评论 -
第四范式程晓澄:机器学习如何优化推荐系统
本文为你介绍推荐系统的诞生土壤和早起演进、推荐系统当下的基本架构以及如何搭建一个推荐系统。9月20日晚,我们邀请到第四范式资深算法科学家程晓澄,他以“机器学习在推荐系统中的应用”为题,与大家分享了如何用机器学习来优化推荐系统相关技术问题。程晓澄是第四范式资深算法科学家、推荐系统服务算法负责人。目前负责逻辑思维得到 APP、海外移动新闻聚合 APP New转载 2018-01-25 16:50:05 · 1168 阅读 · 0 评论 -
一文读懂机器学习
内容浅显易懂,分类清晰,逻辑性强,极力推荐!!阅读目录1.一个故事说明什么是机器学习2.机器学习的定义4.机器学习的方法5.机器学习的应用–大数据6.机器学习的子类–深度学习7.机器学习的父类–人工智能8.机器学习的思考–计算机的潜意识9.总结10.后记作者:计算机的潜意识在本篇文章中,我将对机器学习做个概要的介绍。本文的目的是能让即便完全不转载 2017-08-17 00:35:40 · 725 阅读 · 0 评论