![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
wyh_wen
我是一名机器学习工程师,喜欢研究各种算法,更喜欢和大家分享学习。
展开
-
Oracle SQL developer 几点常见的错误
1. Oracle查询时出现‘ORA-00911:无效字符’。该错误说明查询语句中存在中文字符,只需要改正即可。2. Oracle中的分组函数 group by 使用与MySQL有所不同在Oracle中Group by 分组时select后面提取的字段要有队分组列进行聚合的函数(count()、sum()等),否则会出错。 例如:select * from student gr...原创 2018-09-20 15:50:53 · 584 阅读 · 0 评论 -
经典算法(三):决策树
一、决策树概念 在经典算法中,决策树是常用的算法之一。前面提到的线性回归可以解决回归问题,逻辑回归可以解决分类问题,而今天要学习的决策树不但可以回归问题,还可以解决分类问题。顾名思义,决策树分为两种树,回归树和分类树。在分类算法中,决策树是根基。现在常用的随机森林也是基于多个决策树集成的算法。从名称可以看出,决策树是含有分叉的树状算法。决策树思想是寻找最纯净的划分方法,...原创 2019-03-19 16:58:51 · 792 阅读 · 0 评论 -
模型评估指标(分类模型、回归模型)
一、分类指标1.精确率(precision): (预测为正的里面预测对的概率)2.召回率(recall):(真实为正的里面预测对的概率)3.F1值: (对精确率和召回率赋不同权重进行加权调和)4.准确率(accuracy):5.错误率(error rate):6.ROC:绘制ROC曲线,首先对所有样本按预测概率排序,以每条样本的预测概率为阈值...原创 2019-01-26 14:48:52 · 1726 阅读 · 0 评论 -
入门python代码系列:简单线性回归(二)
1.数据预处理数据预处理的详细请参考前一篇博文(数据清洗与预处理),这里简单带过。import numpy as npimport pandas as pdimport matplotlib.pyplot as plt #导入可视化模块data=pd.read_csv('E:/data/studentscores.csv')X=data.iloc[:,:1].valuesy...原创 2018-12-12 15:22:54 · 483 阅读 · 0 评论 -
经典算法(二):逻辑回归
目录 一、逻辑回归数学来源 二、极大似然法 三、逻辑回归算法过程 四、逻辑回归算法Python实战 一、逻辑回归数学来源 说到算法,我们首先想到的是线性回归和逻辑回归这两种基础算法,上一篇博文详细学习线性回归,我们都知道线性回归是回归算法,可以得到实值。而在名称上类似的逻辑回归虽然也有“回归”两个字,但是逻辑回归...原创 2018-11-19 16:46:52 · 368 阅读 · 0 评论 -
经典算法(一):线性回归
前言1. 基本形式2. 损失函数 2.1 损失函数 2.1.1 最小二乘法 2.1.2 极大似然估计 2.2正规方程法 2.2.1 一般形式 2.2.2 矩阵形式 2.3梯度下降法 2.3.1梯度下降法的代数方式描述 ...原创 2018-11-06 23:07:27 · 3431 阅读 · 0 评论 -
线性回归的数学推导
线性回归是最基础的算法,同时也是其他高级算法的根基,下面就和大家一起进攻基础算法之线性回归。线性回归模型是用一条曲线去拟合一个或多个自变量 x 与因变量 y 之间关系的模型,那模型的好坏关键在于真实值与预测值之间的差异 。一般表达式 向量表达式 ...原创 2018-10-26 10:00:04 · 439 阅读 · 0 评论 -
多元线性回归矩阵求导
原创 2018-10-13 15:00:34 · 2473 阅读 · 4 评论 -
一元线性回归最小二乘法
这个推导过程虽然简单,但是偶尔会犯错,一点的失误会造成耗费大量时间。其实,这过程是根据损失函数,对w和b进行求导,解方程组,则可以得到w和b。下面详细讲解该过程。 损失函数 求该式子的最小值,需要对它进行求导 ...原创 2018-10-13 14:17:18 · 2840 阅读 · 0 评论 -
经典算法(四):KNN
一、算法概述 KNN也称为K近邻或最近邻(nearest neighbor),从字面来理解就是根据测试样本相对最近(属性相对最近)的K个训练样本的类别来决定该测试样本的类别(少数服从多数)。KNN是一种惰性学习方法(不需要训练模型),主要处理分类问题。有惰性学习方法,那么也有积极学习方法,前面讲到的决策树是积极学习方法。那怎么判断属性相对最近呢?其实KNN算法在寻找相对最近样本时...原创 2019-03-30 16:46:12 · 786 阅读 · 0 评论