python3-机器学习
文章平均质量分 52
大星小辰
这个作者很懒,什么都没留下…
展开
-
4-1 k近邻算法基础
import numpy as np import sklearn import matplotlib.pyplot as plt raw_data_x = np.random.rand(20) raw_data_x array([0.73926217, 0.85530604, 0.57330886, 0.10024075, 0.86413266, 0.75800531, 0.9...原创 2019-02-23 09:09:23 · 262 阅读 · 1 评论 -
4-2 scikit-learn中的机器学习算法封装
import numpy as np from sklearn.neighbors import KNeighborsClassifier from collections import Counter from math import sqrt class kNNClassifier: def __init__(self, k): # initialize kNN c...原创 2019-02-23 10:56:02 · 337 阅读 · 0 评论 -
4-5 超参数
import numpy as np from sklearn.neighbors import KNeighborsClassifier from sklearn import datasets digits = datasets.load_digits() X = digits.data y = digits.target from sklearn.model_selection im...原创 2019-02-24 09:25:03 · 123 阅读 · 0 评论 -
4-5-----4-8超参数、数据归一化、scikit-learn中的归一化
超参数:在算法运行前需要决定的参数 模型参数:算法过程中学习的参数 调参指的是调整超参数 寻找好的超参数:领域知识、经验数值、实验搜索 最值归一化 normalization,将所有数据映射到0和1之间,适用于分布有明显边界的情况,受outlier影响较大 标准归一化 standardlization 数据分布没有明显的边界,有可能存在极端数据值,将所有数据归一化到均值为0方差为1的分布中 两种归...原创 2019-02-24 16:51:37 · 223 阅读 · 0 评论 -
4-9更多有关k近邻算法的思考
k近邻算法,可以解决多分类问题,思路简单,效果好,同样的,k近邻算法也可以解决回归问题 缺点:效率低下,高度数据相关,预测结果不具有可解释性,维数灾难 维数灾难:随着维度的增加,两个看似相近的点之间的距离越来越大 ...原创 2019-02-24 18:24:04 · 135 阅读 · 0 评论 -
8-6 验证数据集及交叉验证
将数据集分为训练数据、验证数据和测试数据,训练数据和验证数据参数模型的建立 如果只有训练数据和测试数据,模型可能会过拟合测试数据 训练数据用来训练模型, 验证数据用来调整朝参数使用的数据集, 测试数据作为衡量最终模型性能的数据集 交叉验证 Cross Validation ...原创 2019-02-26 10:21:06 · 427 阅读 · 0 评论 -
Logistic Regression
Logistic Regression Introduction It is widely used in different fields. And it usually handle the two classification problems. Actually , it also can be seen as a regression algorithm. It links the f...原创 2019-04-04 06:10:34 · 134 阅读 · 0 评论 -
Support Vector Machine
SVM原创 2019-04-20 12:35:06 · 462 阅读 · 1 评论