![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 75
皮卡猪猪
呀呀呀 吃货的人生 不打代码就没得吃
展开
-
常见机器学习算法适合使用的业务场景汇总(1)
最近进公司实习培训,大概是get了一下数据挖掘工程师的本职工作是什么:理解业务场景,根据业务抽取特征,建模预测。所以重点还是在于业务的理解与算法在什么场景下是适用的,我将最近的工作做了个总结。汇总了常见的机器学习算法适合使用的业务场景。主要参考了以下的文章,写的很好,我写的内容相当于这两个链接的汇总和一些添加吧:https://zhuanlan.zhihu.com/p/46831267...原创 2020-01-11 17:09:12 · 1960 阅读 · 0 评论 -
支持向量机的SOM算法实现
终于把支持向量机的原理以及SOM实现代码自己撸了一遍,感觉实在好复杂,辛亏有大佬们的文档作参考:原理公式推导讲的最好的一篇:https://blog.csdn.net/weixin_41090915/article/details/79177267SOM算法详解:https://www.cnblogs.com/jerrylead/archive/2011/03/18/1988419.htm...原创 2019-08-06 14:02:22 · 990 阅读 · 1 评论 -
KNN算法详解-原理、实现代码(python3)
以前我总是用函数调库来实现机器学习模型,被男朋友diss了无数次.....现在觉得他说的确实有道理,既然学了算法那肯定原理和代码都得会才算是彻底弄懂了算法,所以这篇文章相当于之前那篇介绍如何调库的文章的进阶!------------目录---------------1 KNN原理2 伪代码3 实现(简化版)4 调用sklearn库实现KNN(源代码浅浅滴解析)1 KNN...原创 2019-08-05 14:07:03 · 1834 阅读 · 0 评论 -
西瓜书---读书笔记5-6章--神经网络和支持向量机
平时做项目会用到神经网络还有svm~所以写的比较简略,因为论文里面以前就写过蛮多关于这些的,自己比较熟悉(自认为),所以简单复习一下啦~5 神经网络定义:神经网络是具有适应性的简单单元组成的广泛而互联的网络,它的组织可以模拟生物神经系统对真实世界物体所做出的交互反映。历史:神经元模型:m-p神经元模型,1943被提出。感知机:只有输入输出两层,且只在输出层有激活函数...原创 2019-06-25 16:16:08 · 236 阅读 · 0 评论 -
西瓜书---读书笔记4 决策树
第四章 决策树人类面临决策过程时,就是用树的思维来解决的问题。决策树的目的是产生一个泛化能力强的树。原理:根节点-à子节点(属性,feature)à叶节点(决策结果)每个叶节点的得到都是通过一个决策过程实现的。在三种情况下,根节点或者是子节点会转化成叶节点:没有属性可以划分了,或者是所有样本在属性上取值相同 当前节点下,所有样本属于一个类别了 没有符合当前节点属性的样本...原创 2019-06-21 15:53:45 · 265 阅读 · 0 评论 -
西瓜书---读书笔记1-3章
学机器学习就一定会看西瓜书~1 绪论机器学习是让计算机自动学习数据中的规律,并对未知数据进行预测的学科。主要研究的是“学习算法”,写程序让计算机自动学习。假设空间:良好的拟合数据的线有很多条,这些线中哪个最好呢?这些线组成的空间叫假设空间。NFL定理:“没有免费的午餐”定理,脱离实际问题,所有的学习算法的误差都一样(已经通过数学公式证明,1996年),因为它的前提是所有问题都...原创 2019-06-20 20:49:41 · 226 阅读 · 0 评论 -
机器学习--scikit-learn(5)--学习曲线、验证曲线、交叉验证曲线
scikit-learn中有非常多的曲线,对于调参非常有用处,我经常用到的曲线是学习曲线,验证曲线以及交叉验证曲线。使用这些曲线的代码格式非常固定:返回值 = 曲线名字(模型对象,X, Y, 交叉验证数量,评分标准.....)它们只是返回值不同以及其中设置的参数略有不同。学习曲线:(learning curve)这条曲线的主要作用是观察数据集的大小对于模型性能的影响。使用代...原创 2019-05-29 17:13:10 · 2126 阅读 · 0 评论 -
条件概率、贝叶斯、最大似然
在一次找工作实习的经历中,老板问我会不会朴素贝叶斯原理还有最大似然估计,辛亏根据老板提示早准备了....不然还真说不上来。虽然最后实习因为一个很玄幻原因黄掉了.....但是就因为回答上了朴素贝叶斯和最大似然的原理,老板当时还是通过了我的面试滴 ,还马上要和我签合同。所以感觉这些概率论上的数学原理还是非常重要的,最近有好好的准备一下下,在此做个小小的记录。-------------------吐...原创 2019-05-24 21:30:28 · 796 阅读 · 0 评论 -
利用sklearn实现KNN--乳腺癌诊断代码实战与分析
这篇文章是利用sklearn实现KNN算法,如何调整参数,实战代码。如果要看具体原理和python代码实现简单的KNN转这里:https://blog.csdn.net/qq_40589051/article/details/98482987---------目录----------1. sklearn.neighbors.KNeighborsClassifier参数介绍2. 利用...原创 2018-08-30 15:51:33 · 3322 阅读 · 0 评论 -
逻辑回归模型的实现---原理、公式、调用sklearn库实现详解
机器学习中有非常多的模型,那么模型的原理是什么?参数怎么使用?模型如何选择?这是困扰我比较久的问题,借最近学习sklearn顺便学一学我最近项目里面需要的模型。----------目录--------------1. 如何选择合适的模型?2. 公式与原理3. 调用sklearn库实现逻辑回归代码详解1. 如何选择合适的模型?在sklearn官网上有这样一幅图,标明了数...原创 2018-08-29 10:27:12 · 933 阅读 · 0 评论 -
机器学习--scikit-learn(4)---过拟合与模型保存
此文章要讲的是如何判断模型是否过拟合,如何修正它,以及修正好的模型,如何保存,以便留到下次使用。首先要先搞清楚一个概念,什么是过拟合?1,过拟合,欠拟合概念过拟合,按照我自己的理解就是,学习得太猛了,太细枝末节了,导致自己不会举一反三,平时做题做的都是一类,练习的时候都是满分,等到考试的时候题目条件稍微一变化,就不会做了。欠拟合,就是学的太水了,平时练习题都没最好,考试当然死得惨。...原创 2018-08-28 10:57:23 · 390 阅读 · 0 评论 -
机器学习--scikit-learn(3)--交叉验证
这篇文章记录的是如何对模型进行交叉验证。首先要简单了解一下,什么是交叉验证,对一个模型好与坏的检测指标有哪些?1.什么是交叉验证?交叉验证就是不单单把数据集分成测试集和训练集,而是把数据集分成n组,每一组中都有训练集和测试集,每一组都会得到一个score,这个score可以是准确性(accuracy),也可以是MSE(标准均方误差)等。例子回到第一篇文章中讲到的花的分类,最简单的是...原创 2018-08-27 16:42:04 · 646 阅读 · 0 评论 -
机器学习--scikit-learn库(2)
上一节讲的是scikit-learn库的最简单的用法。现在要更加进阶啦~头一节的第三个问题是如何使用scikit-learn的官网,其实我现在也不太清楚,还是跟着练习的时候到需要查看官方文档的时候自己慢慢摸索吧。这篇笔记要记录的是,库里面的datasets到底有哪些?以及模型的参数如何查看的问题,还有归一化数据的问题。首先我想去看看scikit-learn中到底有多少自带的数据库。...原创 2018-08-27 15:42:54 · 1088 阅读 · 0 评论 -
机器学习--scikit-learn库(1)
用python来实现机器学习是很简单滴~这是我看了莫烦python中的scikit—learn库之后的一些自己的理解。不过我还是有一些问题的:1.scikit-learn库是什么?2.这个库怎么用?3.scikit-learn库的官网的文档到底怎么查啊怎么使用啊?这都将在scikit-learn学习笔记中写下。1.scikit-learn库是什么这里是官网:scik...原创 2018-08-27 11:09:31 · 523 阅读 · 0 评论