scikit-learn
文章平均质量分 95
Happy丶lazy
这个作者很懒,什么都没留下…
展开
-
机器学习十大经典算法——线性回归
推荐b站视频:https://www.bilibili.com/video/BV1Ht411m7UP?p=5回归分析(Regression toward mediocrity)-趋中回归有人可能会好奇,为什么叫“回归”这个名称,它有什么具体含义?实际上,回归这种现象最早由英国生物统计学家高尔顿在研究父母亲和子女的遗传特性时所发现的一种有趣的现象:身高这种遗传特性表现出“高个子父母,其子代身高也高于平均身高;但不见得比其父母更高,到一定程度后会往平均身高方向发生‘回归’”。 这种效应被称为“趋中回归”。原创 2021-06-21 14:24:16 · 1423 阅读 · 0 评论 -
乳腺癌支持向量机
%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as np# 载入数据from sklearn.datasets import load_breast_cancercancer = load_breast_cancer()X = cancer.datay = cancer.targetprint('da...原创 2019-05-22 14:43:02 · 1324 阅读 · 0 评论 -
读《scikiit-learn机器学习》支持向量机
支持向量机的最大特点能构造出最大间距的决策边界,从而提高分类算法的鲁棒性在支持向量机里,为什么吧类别标识定义为[-1,1]为了让数学表达式尽量简洁,通过符号判断什么是松弛系数,它有什么用类似与逻辑回归算法成本函数引入正则项,目的是为了纠正过拟合问题,让支持向量机对噪声数据更强的适应性。什么是核函数,他们和相似性函数,两者有什么关系核函数:特征转换函数,相似性函数:由于只...原创 2019-05-22 14:39:00 · 222 阅读 · 0 评论 -
决策树_预测泰坦尼可号幸存者
%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npimport pandas as pddef read_dataset(fname): # 指定第一列作为行索引 data = pd.read_csv(fname, index_col=0) # 丢弃无用的数据 data....原创 2019-05-22 14:36:17 · 384 阅读 · 0 评论 -
读《scikiit-learn机器学习》第七章_决策树
什么是信息熵,其计算公式是什么一条信息的信息量和它的不确定性有直接关系,一个问题不确定性越大,要搞清这个问题,需要了解的信息量就越多,其信息熵就越大什么是信息增益?信息熵变换幅度在决策树创建过程中,用什么方法来选择特征,从而经行数据划分选择信息增益最大得特征,并用这个特征作为数据集划分节点来划分数据决策树如何处理连续值得特征需要经行离散化处理,要离散化成几个类除了信...原创 2019-05-22 14:32:10 · 214 阅读 · 0 评论 -
乳腺癌检测_逻辑回归
%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as np# 载入数据from sklearn.datasets import load_breast_cancercancer = load_breast_cancer()X = cancer.datay = cancer.targetprint('dat...原创 2019-05-22 14:29:45 · 695 阅读 · 0 评论 -
读《scikiit-learn机器学习》逻辑回归算法
逻辑回归模型是解决什么问题的模型解决分类问题的算法逻辑回归模型的预测函数是什么?逻辑回归模型的成本函数是什么?逻辑回归模型的梯度下降算法中,其参数迭代公式是什么?正则项有什么作用来解决模型过拟合问题的一个办法,保留所有特征,减少特征的权重的值,确保所有特征对预测值都有少量的贡献L1范式正则化和L2范式正则化有什么区别?L1范式会让模型参数稀疏化,L2范式会作为正...原创 2019-05-22 14:28:01 · 341 阅读 · 0 评论 -
线性回归_测算房价
%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npfrom sklearn.datasets import load_bostonboston = load_boston()X = boston.datay = boston.targetX.shape(506, 13)X[0]arra...原创 2019-05-22 14:17:27 · 304 阅读 · 0 评论 -
读《scikiit-learn机器学习》黄永昌第五章
线性回归算法线性回归模型是用来解决什么问题的使用线性方程对数据集进行拟合的算法,通过属性的线性组合进行预测2.线性回归模型的预测函数是什么样的?其矩阵形式的写法是什么样的?h(x)=a+bxh(x)=[a b]*[1 x]T3.线性回归模型的成本函数是什么样的?J(θ)=1/(...原创 2019-05-22 14:13:41 · 305 阅读 · 0 评论 -
机器学习面试- Scikit-learn
● Focal Loss 介绍一下参考回答:Focal loss主要是为了解决one-stage目标检测中正负样本比例严重失衡的问题。该损失函数降低了大量简单负样本在训练中所占的权重,也可理解为一种困难样本挖掘。损失函数形式:Focal loss是在交叉熵损失函数基础上进行的修改,首先回顾二分类交叉上损失:是经过激活函数的输出,所以在0-1之间。可见普通的交叉熵对于正样本而言,...翻译 2019-05-21 07:54:12 · 1453 阅读 · 0 评论 -
使用k-近邻算法进行分类
%matplotlib inlineimport matplotlib.pyplot as pltimport numpy as npfrom sklearn.datasets.samples_generator import make_blobs# 生成数据centers = [[-2, 2], [2, 2], [0, 4]]X, y = make_blobs(n_samples=...原创 2019-05-20 21:41:01 · 824 阅读 · 0 评论 -
读《scikiit-learn机器学习》黄永昌第二章
第二章python机器学习软件包机器学习任务的一般步骤有那些1:评估模型对象2:模型接口3:模型检验4:模型选择扩展学习资源http://scipy-lectures.org 科学计算工具包的集合蒙特卡罗方法求圆周率n_dots = 1000000x = np.random.random...原创 2019-05-08 21:53:22 · 207 阅读 · 0 评论