python_ML
哈哈哈哈士奇VIP
明天也要加油鸭~
展开
-
python-机器学习(课程记录二)
证明题:1.当模型是条件概率分布,损失函数是对数损失函数时,经验风险最小化等价于极大似然估计。 参考这篇2.什么情况下最大后验概率估计(MAP)等价于结构风险最小化?【提示:Ridge Regression的概率解释】参考这篇3 线性支持向量机还可以定义为以下形式: 试求其对偶形式。(李航统计学习方法P134 1.3) 参考这篇...原创 2018-03-16 15:32:26 · 232 阅读 · 0 评论 -
回归中的相关度和R平方值
机器学习中关于回归模型有时候需要衡量自变量和因变量之间的相关度,接下来介绍两个衡量相关度的指标:皮尔逊相关系数它是用来衡量两个变量之间的相关度的; 取值:[-1,1] 该值>0 表示两个变量之间是正相关的,值为0表示两个变量之间无相关性,值<0表示两个变量之间是负相关的;皮尔逊相关系数的计算公式可以表示为: R平方值也称为决定系数,反映因变量的全部变异能通过回...原创 2018-06-24 12:17:41 · 57067 阅读 · 2 评论 -
使用梯度下降算法来求解线性回归模型
废话求解线性回归模型的解析解可以直接使用公式,这节可以使用梯度下降算法来求解这类问题的优化问题: 原理的东西不想说了 ,总之机器学习的一般思路都是: 构建模型(也就是你想建立什么样的预测函数 y=blabla) —-》 接着就是你想对你要建立的模型使用什么样的损失函数求解最优化问题(此处使用的是最小二乘的原理也就是预测值和真实值的差平方和 ,最后除以样本数cost=blabla) ...原创 2018-06-23 20:18:20 · 1602 阅读 · 0 评论 -
机器学习之多变量回归模型(二)
废话上一篇博客已经提到关于多变量回归模型的训练(其实就是调用sklearn中的linear_model中的LinearRegression)然后对新的数据进行预测 接下来我们再补充一下,就是当变量中不仅仅有上述连续性的变量,也有一些离散型的变量,而对这些表示类型而不是真实表示数据大小的变量应该怎么处理,然后用现有的模型进行训练呢?介绍对于上面提到的问题解决办法就是把那些非数值类型的数...原创 2018-06-23 15:26:29 · 2755 阅读 · 0 评论 -
机器学习之多变量回归模型(一)
废话主要是用sklearn库中的linear_model中的LinearRegression模型进行训练,另外对于训练集数据的读取用到了上一篇提到的文件读取的相关操作,这里熟悉一下https://blog.csdn.net/jiaowosiye/article/details/80782729 这段时间的学习主要侧重于掉包,希望能成为一个厉害的调包侠~~~介绍导入训练数据,使用ske...原创 2018-06-23 14:46:54 · 7755 阅读 · 0 评论 -
机器学习实战之KNN算法
书上的代码看不懂,自己写了一个,就是太麻烦,书上才15行,我用了26行代码,,可是我为什么看不懂别人的代码啊!哭唧唧主要是思路,这里我用的数据特别简单,就是自己写了四个点,然后给他们标签,来一个新的数据,通过计算该点与已知数据点(带有标签的那种)的距离,选取K个最近的点,统计这K个点的标签,选取最多类别的那一个作为最后该新输入数据集的标签,其实原理类似于说,你周围的点是什么样子,其实大概率决定...原创 2018-04-29 15:30:59 · 261 阅读 · 0 评论 -
机器学习-实习记录篇
看着论坛,实习群各种实习,记录一下各个公司的要求,查漏补缺,加油~1. 人工智能算法-长威科技岗位描述:1、负责设计、训练和测试机器学习、深度学习算法模型; 2、负责数据收集、整理和分析,并设计模型的检验方案; 3、参与设计大数据架构、分布式机器学习平台和机器人智能系统。要求:1、研发生及以上学历,计算机、应用数学、统计类或电子工程等相关专业; 2、在以下至少一个领域有...原创 2018-04-13 21:41:40 · 2618 阅读 · 1 评论 -
机器学习算法SVM之核函数
最近在看SVM的论文,关于核函数不是很理解 查了一些资料 启发最大的: 知乎大佬 还有这位大神有时间再来补充原创 2018-04-12 21:15:25 · 449 阅读 · 0 评论 -
机器学习竞赛Sofasofa
这两天看了SofaSofa上的新手赛,有一个根据名字预测性别的:参考标杆模型 自己也试着从头到尾写了一遍提交上去结果82% 嗯排名是很迷 53/104 ,(耗时一天)继续努力~ 这里说一下思路,(说一下 这个是给我自己看的 写的太乱,主要是记录下来方便我以后理解) 就是首先需要导入数据 由于是使用了pandas的read_csv()函数 得到的数据类型是DataFrame 所以相关操作需要熟...原创 2018-04-16 21:48:17 · 1966 阅读 · 0 评论 -
机器学习实战之Adaboost之机器学习作业记录(三)
好久没更新作业了,,,主要是李航统计学习方法的第八章,准确率80% 总感觉不对,先记录到这,,,其中关于概念的理解参考了以下博客,觉得对我很有帮助,记录一下: 1 2 3 4 这篇 尤其这篇 还有这篇 这篇 这篇 这篇 这篇 这篇 这篇然后我的代码放在这里啦:# -*- coding: utf-8 -*-"""Created on Sat Apr ...原创 2018-04-15 12:18:43 · 188 阅读 · 0 评论 -
机器学习实战之0-9手写字识别
嗯 觉得自己很棒棒哦 总之进步挺大的 哈哈哈哈 0-9的数字识别 属于多分类问题 需要用到softmax分类的知识 具体讲解请参考下面几个博客: 1 2 3 4首先有两个数据集 训练集和测试集,两个数据集都有txt文件 如0_0.txt表示该txt文件属于第0类 后面的0表示该类别下的一个训练样本 其实每一个txt文件都是一个样本而且里边的32*32维(102...原创 2018-03-31 10:49:50 · 2217 阅读 · 2 评论 -
python_ML之基础知识
python中使用numpy进行矩阵运算的常用操作: 参考这篇文件导入的绝对路径和相对路径: 参考这篇print array时array中间是省略号没有输出全部的解决方法: 参考这篇Python跳过第一行读取文件内容: 参考这篇 注意里边的d0_readline()是自己要写的 比如可以写 linearr=line.split(“,”) #如果需要把csv文件用逗号分割 成每...原创 2018-03-23 16:11:35 · 1614 阅读 · 0 评论 -
python-机器学习(课程记录一)
第一节课阅读文献《A Few Useful Things to Know About Machine Learning》 转自这篇 【原题】A Few Useful Things to Know About Machine Learning【译题】机器学习的那些事【作者】Pedro Domingos【译者】刘知远【说明】译文载于《中国计算机学会通讯》 第 8 卷...原创 2018-03-03 19:08:31 · 393 阅读 · 1 评论 -
机器学习实战书中代码+数据集
来自这里原创 2018-03-24 20:45:22 · 9851 阅读 · 0 评论 -
机器学习之逻辑回归(,sigmoid回归 softmax回归)
看了几篇文章(https://blog.csdn.net/weixin_38516136/article/details/78014477)觉得挺有用的,收藏一下这篇文章和这篇文章原创 2018-03-23 22:04:22 · 508 阅读 · 0 评论 -
吴恩达机器学习课后习题答案
这篇大神接下来我要开始看机器学习了,争取一个月之内把它看完 课后习题也要跟上!!! 一个月之后看复习进度原创 2018-03-22 21:57:15 · 12019 阅读 · 2 评论 -
python机器学习之pandas
这两天看了以下天池的比赛,嗯,又要立一个flag好好学习了 pandas库: 看了几篇文章 觉得有用的转载一下: 这篇和这篇原创 2018-03-12 22:05:31 · 206 阅读 · 0 评论 -
吴恩达机器学习课程第一周
关于线性回归的记录: 使用的损失函数是平方误差损失函数J(θ),也就是最简单的假设函数和真实值差的平方和(对于所有样本求和),然后最小化J(θ),也就是使用梯度下降算法;平方误差代价函数是解决回归问题最常见的手段;对于单变量线性回归问题: 如果是对于单变量线性回归,代价函数(参数为θ)关于假设函数中参数的图形为: 因为只有一个变量所以只有两个参数,总可以找到一组参数使得该代价函数...原创 2018-07-04 18:55:45 · 364 阅读 · 0 评论