![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python机器学习基础与进阶
文章平均质量分 69
主要用于介绍Python做机器学习的方法
扁舟钓雪
一个热衷于Python语言,热爱机器学习,深度学习,机器视觉的开源博主,有问题可在博客下评论哦~同时欢迎私聊及互关.
展开
-
Python机器学习--算法实现--常用算法在Sklearn中的回归算法关键参数详解
常用算法在Sklearn中的关键参数详解回归算法线性回归算法from sklearn.linear_model import LinearRegressionLinearRegression(fit_intercept=True,normalize=False,copy_X=True,n_jobs=1) '''参数含义:1.fit_intercept:布尔值,指定是否需要计算线性回归中的截距,即b值。如果为False,那么不计算b值。2.normalize:布尔值。如果为False,那原创 2021-09-05 15:07:42 · 1204 阅读 · 1 评论 -
Python机器学习--算法实现--常用算法在Sklearn中的聚类算法和分类算法关键参数详解
常用算法在Sklearn中的关键参数详解聚类算法K-Means算法基于Sklearn中的参数from sklearn.cluster import KMeansKMeans(n_clusters=8 , init='k-means++' ,n_init=10 ,max_iter=300 , tol=0.0001 , precompute_distances='auto' , verbose=0 ,ran原创 2021-09-05 14:57:35 · 1346 阅读 · 0 评论 -
Python机器学习--算法导包--Sklearn(scikit-learn)导包与特征处理大合集
Sklearn各类型算法导包与特征处理大合集分类算法导包合集# 算法# 分类算法1.KNNfrom sklearn.neighbors import KNeighborsClassifier2.朴素贝叶斯from sklearn.naive_bayes import BernoulliNB # 特征值是二分类from sklearn.naive_bayes import GaussianNBfrom sklearn.naive_bayes import MultinomialNB3原创 2021-09-05 13:58:26 · 896 阅读 · 0 评论 -
Python机器学习--算法评估指标--各类型算法评估指标
聚类算法常用评估指标:轮廓系数 SSE(误差平方和)- 分类算法常用评估指标:准确率,查准率,查全率,F1-score,PR曲线,ROC曲线和AUC指标,ROC曲线下的面积就是AUC指标.- 回归算法的评估指标:R方范围[-inf,1] (真实值与预测 ),MSE,MAE,RMSE...原创 2021-09-01 19:33:39 · 3196 阅读 · 7 评论 -
Python机器学习--集成学习算法--XGBoost算法
XGBoost算法XGBoost算法类型:XGBoost算法:属于集成学习算法 ,与随机森林类似,也由多颗决策树组成XGBoost算法既可以解决分类问题,也可以解决回归问题。后一棵树是在前一个树的基础上生成的后一棵树只需要拟合前K棵树和真实结果之间的误差误差可以用负梯度表示;因此可叫 梯度提升树XGboost是计算一阶导数和二阶导数,因此又称为 极端梯度提升树集成学习算法集成学习算法是通过训练多个学习器,然后把这些学习器组合起来,以达到更好的预测性能的目的。集成学习算法的分类:Bagg原创 2021-08-31 20:18:12 · 859 阅读 · 0 评论 -
Python机器学习--集成学习算法--随机森林算法
随机森林算法随机森林算法类型:随机森林算法:属于集成学习算法 ,通俗点讲,就是将多颗决策树集合起来,就变成了随机森林。集成学习算法集成学习算法是通过训练多个学习器,然后把这些学习器组合起来,以达到更好的预测性能的目的。集成学习算法的分类:Bagging:弱学习器的生成没有先后顺序,可以进行并行训练,如果是分类任务,则预测结果为多个弱学习器的预测结果取众数,如果是回归任务,则预测结果会取多个学习器的平均值。Boosting:弱学习器的生成有先后顺序,后一个弱学习器是之前学习器的基础上训练的,预测原创 2021-08-31 19:52:11 · 298 阅读 · 1 评论 -
Python机器学习--算法--决策树算法
决策树算法决策树算法类型:决策树是一系列算法,而不是一个算法。决策树包含了 ID3分类算法,C4.5分类算法,Cart分类树算法,Cart回归树算法。决策树既可以做分类算法,也可以做回归算法。因此决策树既可以解决分类问题,也可以解决回归问题。决策树的构成决策树的基本组成部分包括:根节点,分节点,和叶子节点。一般来讲,在决策树中,根节点和分节点使用方块表示,而叶子节点使用椭圆表示。决策树的关键点在于如何取建立出一个树,如何建立出一个在可以达成目标的前提下深度最浅的树。决策树中不同算法的介原创 2021-08-30 21:20:09 · 2378 阅读 · 2 评论 -
Python机器学习--回归算法--逻辑回归算法
逻辑回归算法逻辑回归算法类型:逻辑回归属于有监督学习的分类算法(只能做二分类)逻辑回归算法原理:将线性回归的结果输入sigmoid函数中,得出预测为类1的概率(如果概率为0.2 有20%的可能属于类1,属于类0的概率是80%; 结果是类0如果概率为0.8 有80%的可能属于类1,属于类0的概率是20%; 结果是类1)线性回归算法方程sigmoid函数公式和图像:逻辑回归的结果是基于线性回归计算出来的,线性回归的质量好坏会直接影响逻辑回归的结果,影响线性回归的就是回归系数。对于线原创 2021-08-28 20:58:11 · 644 阅读 · 3 评论 -
Python机器学习--回归算法--线性回归算法
线性回归算法线性回归算法类型:线性回归算法属于有监督学习的回归算法,可以处理标签为连续数据类型的数据。线性回归算法原理:通过寻找特征和标签之间的关系,生成一个线性方程,通过线性方程预测未知标签。算法的结果是一个线性方程。如果特征有一个,对应的结果就是一个一元线性方程。如果特征存在多个,则结果为N元线性方程。线性回归算法的特点1.结果具有可解释性(根据线性方程可以明确的得出结果是如何计算出来的)2.是逻辑回归算法的基础3.特征与标签之间具有线性关系多元线性方程因为一元线性方程为:y=原创 2021-08-28 18:28:34 · 1663 阅读 · 0 评论 -
Python机器学习--分类算法--朴素贝叶斯算法
朴素贝叶斯算法朴素贝叶斯算法类型朴素贝叶斯算法属于有监督学习中的分类算法,基于贝叶斯理论和特征相互独立的假设,因为假设特征相互独立让问题变得简单,因此称为朴素.朴素贝叶斯算法分为:伯努利朴素贝叶斯,高斯朴素贝叶斯,多项式朴素贝叶斯,因此此篇,篇幅较长,需要看某一个算法,可以使用ctrl+F进行搜索即可.朴素贝叶斯算法第一站:概率公式条件概率公式为(即在事件B发生的情况下,事件A发生的概率):当A,B相互独立时 P(AB) = P(A)∗P(B)全概率公式:贝叶斯公式:朴素贝叶斯算法原创 2021-08-22 22:02:47 · 2077 阅读 · 0 评论 -
Python机器学习--聚类算法--Kmeans聚类算法
Kmeans聚类算法Kmeans算法类型:Kmeans算法属于无监督学习的聚类算法.无监督学习是指没有明确的标签,这类问题没有标准的答案.Kmeans算法原理什么是聚类?所谓聚类问题,就是给定一个数据集D,其中每个样本具有n个属性,使用某种算法将D划分成k个子集,要求每个子集内部的元素之间相似度尽可能的高,而不同子集的元素相似度尽可能低。其中每个子集叫做一个簇。聚类目的:类内相似、类间相异Kmeas原理1、从数据集D中随机取k个元素,作为k个簇的各自的中心(质心)。2、分别计算剩下的元素到原创 2021-08-22 19:36:43 · 1452 阅读 · 0 评论 -
Python机器学习--分类算法--KNN算法
KNN算法KNN算法类型:knn(k-Nearest Neighbors),K最近邻算法.属于有监督学习的分类和回归算法.KNN算法原理1.计算测试样本与训练集中所有样本之间的相似度(使用距离表征相似度.)2.按照距离递增排序3.选择与测试样本中距离最近的k个训练样本.4.根据选择出的K个样本的标签,进行投票或平均 (投票为分类问题,求平均为回归问题).KNN算法的特点1.计算复杂度高(最初的knn是暴力搜索的).2.所设置的K值不同,预测结果也不同3.属于惰性学习算法(边测试,边原创 2021-08-22 19:09:00 · 601 阅读 · 2 评论