quentinl-CSDN博客

原创机器学习三之线性回归（Python实战）

本文在贪心学院机器学习课程代码的基础上加工而成。本次实战的目的是利用上市公司的历史股票数据来预测其之后的5天的股票数据。线性回归的基本原理详见《机器学习总结三之线性回归》导入需要用的工具库import numpy as np # 数学计算import pandas as pd # 数据处理, 读取 CSV 文件 (e.g. pd.read_csv)import matplotlib.p...

2019-08-18 22:42:00 473

原创机器学习总结二之K近邻（Python实战）

本文在贪心学院机器学习课程上的代码基础上加工而成K近邻（K nearest neighbor ）是机器学习中原理比较简单的分类器，其原理详见《机器学习总结二之K近邻》利用Python中的sklearn库中的数据以及该库中的工具完成一个三分类任务首先导入需要的工具from sklearn import datasets#sklearn 自带的数据集from sklearn.model_se...

2019-07-28 22:55:02 149

原创机器学习总结二之K近邻

机器学习二之K近邻K近邻原理K近邻工作机制：给定测试样本，基于某种距离度量找出训练集中与其最靠近的k个训练样本，然后基于这k个邻居的信息来进行预测。通常在分类任务中可使用投票法，即选择这k个样本中出现最多的类别标记作为预测结果；在回归任务中可使用平均法，即将k个样本的实际输出标记的平均值作为预测结果；还可基于距离远近进行加权平均或者加权投票，距离越近的样本权重越大。K近邻学习关键流程把一...

2019-07-27 16:35:30 183

原创机器学习总结八之K均值聚类分析

聚类定义：无监督学习的典型代表，按照内在相似性将数据划分为多个类别，使得类内相似性大，类间相似性小。

2019-07-20 18:52:59 1154

原创机器学习总结五之朴素贝叶斯

机器学习总结五之朴素贝叶斯朴素贝叶斯模型核心思想：通过已知类别的训练数据集，计算样本的先验概率，然后利用贝叶斯概率公式测算未知类别样本属于某个类别的后验概率，最终以最大后验概率所对应的类别作为样本的预测值。处理概率为0的方法：计算先验概率时进行平滑。...

2019-07-06 20:54:45 193

原创机器学习总结三之线性回归

机器学习总结三之线性回归与逻辑回归线性回归线性回归：利用线性回归方程的最小二乘函数对一个或者多个自变量和因变量之间关心进行建模的方法线性回归数学定义：数据(Yi,Xi1,...,Xip),i=1,...n (Y_{i},X_{i1},...,X_{ip}), i=1,...n (Yi,Xi1,...,Xip),i=1,...n模型$$Y=X{beta}+{ep}...

2019-07-05 22:40:41 190

原创机器学习总结一

机器学习总结一机器学习重要术语监督学习与非监督学习：根据训练数据是否拥有标记信息，学习任务分为监督学习和非监督学习分类与回归：监督学习的代表是分类和回归，想要预测的值为离散的监督学习为分类，想要预测的值为连续的监督学习为回归聚类：非监督学习的代表为聚类，将训练数据分成若干组。机器学习流程：数据获取——数据清洗——特征工程——预处理——选择机器学习模型——模型训练（与模型调参迭代）——模型...

2019-06-29 21:10:45 166 1

weixin_43739185的博客