~一段浮华-CSDN博客

原创第六章——FOR、IF以及while

第六章——FOR、IF以及WHILE1.if语句1.1if#if条件判断学习people =20cats = 30dogs = 15if people <cats:#条件判断人数数量是否小于猫，若小于，则执行if后面的语句（这个要输出） print("Too many cats! The world is doomed") if people>cats:#判断人的数量是否小于猫 print("Not many cats! The world is saved")

2022-03-01 23:03:23 451

原创第4章——函数

第4章——函数1.什么是函数1.1函数的基本概念一个程序由一个个任务组成；函数就是代表一个任务或者一个功能。函数是代码复用的通用机制。1.2函数的定义和调用Python 中，定义函数的语法如下：值得注意的是def 函数名 ([参数列表]) : '''文档字符串''' 函数体/若干语句# this one is like your scripts with argvdef print_two(*args): arg1, arg2 = args #函数相关的代码行前面加上

2022-02-24 23:55:31 431

原创第3章——数学运算、字符串、文本、列表

第3章——数学运算、字符串、文本、列表1.字典字典（Dictionary）是Python 中的另一种数据结构。字典（也叫 dict）是一种和列表类似的数据存储方式。但是不同于列表只能用数字获取数据，字典可以用任何东西来获取。可以把字典当成是一个存储和组织数据的数据库。注：键值对在字典中以这样的方式标记：d = {key1 : value1, key2 : value2 }。注意它们的键/值对用冒号分割，而各个对用逗号分割，所有这些都包括在花括号中。另外，记住字典中的键/值对是没有顺序的。如果你想要一个

2022-02-21 23:57:59 479

原创第2章——数学运算、字符串、文本、列表

第2章——数学运算、字符串、文本、列表1.注释单行注释：井号(#)常被用作单行注释符号，在代码中使用**#**时，它右边的任何数据都会被忽略，当做是注释。多行注释：多行注释是用三对单引号’’’ ‘’'包含的，也可以用三对多引号" " " " " ”包含2.数字运算• + plus，加号• - minus，减号• / slash，斜杠，除法运算• * asterisk，星号，乘号• % percent，百分号，取模• < less-than，小于号，输出布尔值• &

2022-02-19 00:16:34 162

原创 sklearn-第八节（可视化）

1 简介本次主要通过使用Scikit-Plot的模块来介绍机器学习的相关可视化，Scikit-Plot主要包括以下几个部分：estimators：用于绘制各种算法metrics：用于绘制机器学习的onfusion matrix, ROC AUC curves, precision-recall curves等曲线cluster：主要用于绘制聚类decomposition：主要用于绘制PCA降维加载所需要的模块# 加载需要用到的模块import scikitplot as skplti

2022-01-06 00:43:59 3506

原创 sklearn-第七节（集成学习）

一、个体与集成1.1什么是集成学习集成学习（ensemble learning)通过构建并结合多个学习器来完成学习任务，集成学习的一般结构：先产生一组“个体学习器”，再用某种策略将它们结合起来。目的：把多个使用给定学习算法构建的基学习器的预测结果结合起来，从而获得比单个学习器更好的泛化能力/鲁棒性。集成学习方法分类：根据个体学习器的生成方式，分类两大类：（1）序列方法：个体学习器之间存在强依赖关系，必须串行生成的序列化方法，也就是基学习器是依次构建的，依次减少组合学习器的偏差。代表是Boos

2022-01-03 00:28:07 1124

原创 sklearn-第六节（PCA）

1、主成分分析法（PCA）思想及原理1.1什么是主成分分析法PCA(Principal Component Analysis)，即主成分分析方法，是一种使用最广泛的数据降维算法（非监督的机器学习方法）。其最主要的用途在于“降维”，通过析取主成分显出的最大的个别差异，发现更便于人类理解的特征。也可以用来削减回归分析和聚类分析中变量的数目。1.2为什么要做主成分分析在很多场景中需要对多变量数据进行观测，在一定程度上增加了数据采集的工作量。更重要的是：多变量之间可能存在相关性，从而增加了问题分析的复杂性

2021-12-31 00:18:07 268

原创 sklearn-第五节（K-means算法）

1.k-means 聚类算法思想 kmeans算法又名k均值算法,K-means算法中的k表示的是聚类为k个簇，means代表取每一个聚类中数据值的均值作为该簇的中心，或者称为质心，即用每一个的类的质心对该簇进行描述。其算法思想大致为：先从样本集中随机选取 k个样本作为簇中心，并计算所有样本与这 k个“簇中心”的距离，对于每一个样本，将其划分到与其距离最近的“簇中心”所在的簇中，对于新的簇计算各个簇的新的“簇中心”。根据以上描述，我们大致可以猜测到实现kmeans算

2021-12-28 00:32:43 2390

原创 sklearn-第四节（决策树）

决策树1.基本流程决策树(decision tree) 是一类常见的机器学习方法.有关决策树的基本知识，可见机器学习（第四章）4.决策树以二分类任务为例，希望从给定训练数据集中学得一个模型用以对新示例进行分类，将样本分类的任务，可以看作是对于“当前样本是否为正类”这个问题的“决策”或“判定”过程。此决策过程如下图所示：决策过程的最终结论对应了我们所希望的判定结果，例如"是"或"不是"好瓜;决策过程中提出的每个判定问题都是对某个属性的"测试"，例如"色泽=?" "根蒂=?“每个测试的结果或是

2021-12-25 00:18:12 307 1

原创 sklearn-第三节（朴素贝叶斯）

1.贝叶斯决策论贝叶斯决策论(Bayesian decision theory) 是概率框架下实施决策的基本方法.对分类任务来说,在所有相关概率都己知的理想情形，贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记.具体来说，若目标是最小化分类错误率，则我们要找的就是：对于每个样本 x，选择能使后验概率 P（C | x）最大的类别标记。即如下公式：h∗(x)=arg⁡min⁡c∈YP(c∣x),h^{*}(\boldsymbol{x})=\underset{c \in \mathcal

2021-12-22 00:35:05 291

原创 sklern-第二节

一、线性SVM关于支持向量机（SVM）的基本知识可以参见向量机知识介绍https://blog.csdn.net/qq_42258383/article/details/1216891261.1.算法实现import numpy as npimport matplotlib.pyplot as pltfrom sklearn import svmdata = np.array([ [0.1, 0.7], [0.3, 0.6], [0.4, 0.1], [0.5,

2021-12-19 00:31:46 206

原创 sklearn-第一节

一、线性回归1一元线性回归“线性回归” (linear regression) 试图学得一个线性模型以尽可能准确地预测实值输出标记.举一个二维函数的例子y=1.5x+0.2,根据这个函数生成一些离散的数据点，对每个数据点加一点波动，也就是噪声，最后看看我们算法的拟合或者说回归效果。1.1.数据生成import numpy as npimport matplotlib.pyplot as pltdef true_fun(X): return 1.5*X + 0.2np.random.

2021-12-16 00:18:18 1747

原创机器学习（第6章）6.支持向量机

机器学习（第6章）6.支持向量机6.1间隔与支持向量给定训练样本集DD={(x1,y1),(x2,y2),…,(xm,ym)},yi∈{−1,+1}D=\left\{\left(\boldsymbol{x}_{1}, y_{1}\right),\left(\boldsymbol{x}_{2}, y_{2}\right), \ldots,\left(\boldsymbol{x}_{m}, y_{m}\right)\right\}, y_{i} \in\{-1,+1\}D={(x1,y1),(x2

2021-12-02 23:46:58 901

原创机器学习（第五章）5.深度学习

机器学习（第五章）5.深度学习5.1神经元模型1.神经网络：神经网络是由具有适应性的简单单元组成的广泛并行互连的网络，它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。2.神经网络中最基本的成分是神经元模型，沿用至今的是**“M-P 神经元模型“，神经元收到来自n个其他神经元传递过来的输入信号**，这些输入信号通过带权重的连接(connection) 进行传递，神经元接收到的总输入值将与神经元的阀值进行比较，然后通过"激活函数” (activation function 处理以产生神经元的

2021-11-28 23:38:36 884