![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
薛定谔的智能
这个作者很懒,什么都没留下…
展开
-
MSE和Cross-entropy梯度更新比较
一.平方损失(MSE)Loss函数:梯度:由于x,y是已知的,故可以忽略掉梯度更新: sigmoid函数:可以看出 导数在z取大部分值,都是很小的,这样会使梯度更新慢.y为1或0是,当a=1,w的梯度为0,a=0,w的梯度为0,故就能看出梯度更新慢.二.交叉熵损失(Cross-entropy)梯度更新比较图可看出逻辑回归比MSE慢.Loss函数:简写形式:梯度更新:由于没有导数那一项,导致梯度更新...原创 2021-10-12 01:45:00 · 673 阅读 · 0 评论 -
ROC曲线,AUC值,PR曲线,AP值
https://scikit-learn.org/stable/auto_examples/model_selection/plot_roc_crossval.htmlhttps://scikit-learn.org/stable/auto_examples/model_selection/plot_precision_recall.html一,ROC横轴:负正类率(false po...原创 2019-02-24 12:23:48 · 14936 阅读 · 5 评论 -
熵的基础知识,特征工程,特征归一化,交叉验证,grid search,模型存储与加载
1.自信息:2.信息熵3.p对Q的KL散度4.交叉熵数据集地址:https://download.csdn.net/download/fanzonghao/10940440一,类别型特征和有序性特征,转变成onehotdef one_hot(): # 随机生成有序型特征和类别特征作为例子 X_train = np.array([['ma...原创 2019-01-27 15:40:34 · 735 阅读 · 1 评论 -
协方差理解,PCA以及奇异值分解(SVD)
import numpy as npimport matplotlib.pyplot as pltfrom sklearn.datasets import load_digitsfrom sklearn.decomposition import PCAfrom mpl_toolkits.mplot3d import Axes3Ddigits = load_d...原创 2019-01-20 13:03:32 · 2167 阅读 · 0 评论 -
knn用于水果数据集分类
数据集地址:https://download.csdn.net/download/fanzonghao/10940440 knn算法流程:若k取无穷大,那么测试数据就取决于每一类的占比,归属于占比最大的那一类。首先观察数据集,利用mass,height,width,color_score四列特征进行水果分类。 g=sns.pairplot(data=fruits_df,hu...原创 2019-01-13 11:37:03 · 14536 阅读 · 6 评论 -
scikit-learn流形学习手写数字可视化
本文参考如下链接:https://www.jianshu.com/p/2542e0a5bdf8from time import timeimport cv2import numpy as npimport matplotlib.pyplot as pltfrom matplotlib import offsetboxfrom sklearn import (manifold, ...原创 2019-01-02 10:06:38 · 537 阅读 · 0 评论 -
天池入门赛--蒸汽预测
首先查看数据 #coding:utf-8"""Created on Wen Jan 9 2019@author: fzh"""import warningswarnings.filterwarnings("ignore")import matplotlib.pyplot as pltplt.rcParams.update({'figure.max_open_warning'...原创 2019-01-12 10:50:55 · 1949 阅读 · 0 评论 -
决策树算法及可视化
安装graphviz用于可视化决策树apt-get install graphvizfrom sklearn.tree import DecisionTreeClassifierimport pydotplusfrom sklearn import treeX = np.array([[2, 2], [2, 1], ...原创 2018-12-25 15:27:16 · 7426 阅读 · 0 评论 -
K-means聚类
数据集地址:https://download.csdn.net/download/fanzonghao/10855060import numpy as npimport math as mimport randomimport matplotlib.pyplot as pltimport evaluate as eva# flame.txt# Jain_cluster=2...原创 2018-12-17 10:29:01 · 1541 阅读 · 0 评论 -
利用混淆矩阵查看每一类预测结果+miou计算
混淆矩阵的示意图如下:import numpy as npcm=np.array([[4,0,0,0], [0,1,0,0], [0, 0, 2, 0], [0, 1, 3, 0]])plt.figure()plt.grid(False)plt.imshow(cm, cmap='jet')plt.col...原创 2018-11-29 11:48:44 · 3865 阅读 · 0 评论 -
高斯混合模型做聚类
概述聚类算法大多数采用相似度来判断,而相似度又大多数采用欧式距离长短来衡量,而GMM采用了新的判断依据—–概率,即通过属于某一类的概率大小来判断最终的归属类别 。GMM的基本思想就是:任意形状的概率分布都可以用多个高斯分布函数去近似,也就是GMM就是有多个单高斯密度分布组成的,每一个Gaussian叫”Component”,线性的加成在一起就组成了GMM概率密度。算法函数n_comp...原创 2018-12-21 10:49:49 · 5303 阅读 · 0 评论 -
机器学习的几种方法(knn,逻辑回归,SVM,决策树,随机森林,极限随机树,集成学习,Adaboost,GBDT)
knn的详细链接:https://blog.csdn.net/fanzonghao/article/details/86411102决策树的详细链接:https://blog.csdn.net/fanzonghao/article/details/85246720一,SVM:寻找最优的间隔等式约束的最优解不等式约束的最优解:利用kkT条件SVM案例,...原创 2018-12-26 13:44:38 · 11532 阅读 · 1 评论