- 博客(6)
- 收藏
- 关注
原创 Kaggle:房价预测
第一次打Kaggle竞赛,在网上搜集了很多例子,也有了自己的理解,不断改进代码不断提交最后还是只得了0.14513的成绩不过相对于第一次提交的0.45的成绩还是有所进步,哈哈哈。 话不多说,直接上代码:import pandas as pdimport numpy as npfrom sklearn.ensemble import RandomForestRegressortrai...
2019-09-30 21:20:38 260
原创 ML:决策树算法
决策树算法 给定一组数据,如果特征值与标签值都是连续值,很容易可以判断出要用回归算法去拟合这组数据。如果标签值是离散值,那就要用分类算法去对数据进行分类任务。那么如果这组数据的特征值是离散值,我们用普逻辑回归算法很难对数据进行分类,那么这时候我们可以选择用决策树算法。一、算法简介: 决策树算法是一种基于规则的方法,他用一组嵌套的规则进行预测。在树的每个决策节点处,根据判断结...
2019-09-28 19:06:40 292
原创 ML:最近邻算法
最近邻算法一、算法概述 最近邻算法或者说KNN算法,是一种基本的分类与回归方法,是数据挖掘技术中最简单的技术之一。Cover和Hart在1968年提出了最初的邻近算法,它的输入是基于实例的学习(instance-based learning),属于懒惰学习(lazy learning)即KNN是一种非显示学习过程,也就是没有训练阶段,对新样本直接与训练集做分类或者回归预测。 所谓最近邻,...
2019-09-03 12:12:01 311
原创 ML:逻辑回归算法
机器学习(二):逻辑回归算法–经典的分类算法 我们常说机器学习对数据处理的时候会有两种情况,一个是连续值的回归,一个是离散值的分类。前面已经说过线性回归,就是对一堆连续数据的拟合使得能够预测数据的走向。那么分类问题的数据就是一堆离散值,这里以线性二分类为例,还是看一组数据: 这是一组根据两次考试成绩判断是否入学的数据,横轴是第一次考试的值,纵轴是第二次考试的成绩,分别设为特征值x1,...
2019-07-03 15:49:08 182
原创 基于梯度下降算法的参数更新公式的推导
基于梯度下降算法的参数更新公式的推导 在前面一篇文章中写到了线性回归算法以及梯度下降算法对参数的更新: θi=θi′−α∂Loss∂θ\theta_i=\theta_i^{'}-\alpha\frac{\partial Loss}{\partial \theta}θi=θi′−α∂θ∂Loss 每一个算法都要会有相应的数学公式推到,那么这个参数更新公式...
2019-07-02 15:43:59 1661
原创 ML:线性回归算法
机器学习(一):从建立模型到梯度下降算法优化 机器学习顾名思义就是让机器去进行学习,而学习则需要有大量的数据,机器学习大体上的思路是对一堆数据建立一个初始化参数的模型,用初始化参数求得的值与真实值做对比再对参数进行更新。一、建立回归模型 假设我们有一组数据: 横轴是我们的特征值x,纵轴是我们需要得到的标签值y,我们假设特征值x乘上一个 θ再加上一个偏置b就可以得到: ...
2019-06-26 18:18:31 401
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人