自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 第六章——FOR、IF以及while

第六章——FOR、IF以及WHILE1.if语句1.1if#if条件判断学习people =20cats = 30dogs = 15if people <cats:#条件判断人数数量是否小于猫,若小于,则执行if后面的语句(这个要输出) print("Too many cats! The world is doomed") if people>cats:#判断人的数量是否小于猫 print("Not many cats! The world is saved")

2022-03-01 23:03:23 387

原创 第4章——函数

第4章——函数1.什么是函数1.1函数的基本概念一个程序由一个个任务组成;函数就是代表一个任务或者一个功能。函数是代码复用的通用机制。1.2函数的定义和调用Python 中,定义函数的语法如下:值得注意的是def 函数名 ([参数列表]) : '''文档字符串''' 函数体/若干语句# this one is like your scripts with argvdef print_two(*args): arg1, arg2 = args #函数相关的代码行前面加上

2022-02-24 23:55:31 371

原创 第3章——数学运算、字符串、文本、列表

第3章——数学运算、字符串、文本、列表1.字典字典(Dictionary)是Python 中的另一种数据结构。字典(也叫 dict)是一种和列表类似的数据存储方式。但是不同于列表只能用数字获取数据,字典可以用任何东西来获取。可以把字典当成是一个存储和组织数据的数据库。注:键值对在字典中以这样的方式标记:d = {key1 : value1, key2 : value2 }。注意它们的键/值对用冒号分割,而各个对用逗号分割,所有这些都包括在花括号中。另外,记住字典中的键/值对是没有顺序的。如果你想要一个

2022-02-21 23:57:59 417

原创 第2章——数学运算、字符串、文本、列表

第2章——数学运算、字符串、文本、列表1.注释单行注释:井号(#)常被用作单行注释符号,在代码中使用**#**时,它右边的任何数据都会被忽略,当做是注释。多行注释:多行注释是用三对单引号’’’ ‘’'包含的,也可以用三对多引号" " " " " ”包含2.数字运算• + plus,加号• - minus,减号• / slash,斜杠,除法运算• * asterisk,星号,乘号• % percent,百分号,取模• < less-than,小于号,输出布尔值• &

2022-02-19 00:16:34 123

原创 sklearn-第八节(可视化)

1 简介本次主要通过使用Scikit-Plot的模块来介绍机器学习的相关可视化,Scikit-Plot主要包括以下几个部分:estimators:用于绘制各种算法metrics:用于绘制机器学习的onfusion matrix, ROC AUC curves, precision-recall curves等曲线cluster:主要用于绘制聚类decomposition:主要用于绘制PCA降维加载所需要的模块# 加载需要用到的模块import scikitplot as skplti

2022-01-06 00:43:59 3187

原创 sklearn-第七节(集成学习)

一、个体与集成1.1什么是集成学习集成学习(ensemble learning)通过构建并结合多个学习器来完成学习任务,集成学习的一般结构:先产生一组“个体学习器”,再用某种策略将它们结合起来。目的:把多个使用给定学习算法构建的基学习器的预测结果结合起来,从而获得比单个学习器更好的泛化能力/鲁棒性。集成学习方法分类:根据个体学习器的生成方式,分类两大类:   (1)序列方法:个体学习器之间存在强依赖关系,必须串行生成的序列化方法,也就是基学习器是依次构建的,依次减少组合学习器的偏差。代表是Boos

2022-01-03 00:28:07 999

原创 sklearn-第六节(PCA)

1、主成分分析法(PCA)思想及原理1.1什么是主成分分析法PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法(非监督的机器学习方法)。其最主要的用途在于“降维”,通过析取主成分显出的最大的个别差异,发现更便于人类理解的特征。也可以用来削减回归分析和聚类分析中变量的数目。1.2为什么要做主成分分析在很多场景中需要对多变量数据进行观测,在一定程度上增加了数据采集的工作量。更重要的是:多变量之间可能存在相关性,从而增加了问题分析的复杂性

2021-12-31 00:18:07 198

原创 sklearn-第五节(K-means算法)

1.k-means 聚类算法思想​ kmeans算法又名k均值算法,K-means算法中的k表示的是聚类为k个簇,means代表取每一个聚类中数据值的均值作为该簇的中心,或者称为质心,即用每一个的类的质心对该簇进行描述。其算法思想大致为:先从样本集中随机选取 k个样本作为簇中心,并计算所有样本与这 k个“簇中心”的距离,对于每一个样本,将其划分到与其距离最近的“簇中心”所在的簇中,对于新的簇计算各个簇的新的“簇中心”。​ 根据以上描述,我们大致可以猜测到实现kmeans算

2021-12-28 00:32:43 2218

原创 sklearn-第四节(决策树)

决策树1.基本流程决策树(decision tree) 是一类常见的机器学习方法.有关决策树的基本知识,可见机器学习(第四章)4.决策树以二分类任务为例,希望从给定训练数据集中学得一个模型用以对新示例进行分类,将样本分类的任务,可以看作是对于“当前样本是否为正类”这个问题的“决策”或“判定”过程。此决策过程如下图所示:决策过程的最终结论对应了我们所希望的判定结果,例如"是"或"不是"好瓜;决策过程中提出的每个判定问题都是对某个属性的"测试",例如"色泽=?" "根蒂=?“每个测试的结果或是

2021-12-25 00:18:12 220 1

原创 sklearn-第三节(朴素贝叶斯)

1.贝叶斯决策论贝叶斯决策论(Bayesian decision theory) 是概率框架下实施决策的基本方法.对分类任务来说,在所有相关概率都己知的理想情形 ,贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记.具体来说,若目标是最小化分类错误率,则我们要找的就是:对于每个样本 x,选择能使后验概率 P(C | x)最大的类别标记。 即如下公式:h∗(x)=arg⁡min⁡c∈YP(c∣x),h^{*}(\boldsymbol{x})=\underset{c \in \mathcal

2021-12-22 00:35:05 202

原创 sklern-第二节

一、线性SVM关于支持向量机(SVM)的基本知识可以参见向量机知识介绍https://blog.csdn.net/qq_42258383/article/details/1216891261.1.算法实现import numpy as npimport matplotlib.pyplot as pltfrom sklearn import svmdata = np.array([ [0.1, 0.7], [0.3, 0.6], [0.4, 0.1], [0.5,

2021-12-19 00:31:46 142

原创 sklearn-第一节

一、线性回归1一元线性回归“线性回归” (linear regression) 试图学得一个线性模型以尽可能准确地预测实值输出标记.举一个二维函数的例子y=1.5x+0.2,根据这个函数生成一些离散的数据点,对每个数据点加一点波动,也就是噪声,最后看看我们算法的拟合或者说回归效果。1.1.数据生成import numpy as npimport matplotlib.pyplot as pltdef true_fun(X): return 1.5*X + 0.2np.random.

2021-12-16 00:18:18 1643

原创 机器学习(第6章)6.支持向量机

机器学习(第6章)6.支持向量机6.1间隔与支持向量给定训练样本集DD={(x1,y1),(x2,y2),…,(xm,ym)},yi∈{−1,+1}D=\left\{\left(\boldsymbol{x}_{1}, y_{1}\right),\left(\boldsymbol{x}_{2}, y_{2}\right), \ldots,\left(\boldsymbol{x}_{m}, y_{m}\right)\right\}, y_{i} \in\{-1,+1\}D={(x1​,y1​),(x2

2021-12-02 23:46:58 834

原创 机器学习(第五章)5.深度学习

机器学习(第五章)5.深度学习5.1神经元模型1.神经网络:神经网络是由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。2.神经网络中最基本的成分是神经元模型,沿用至今 的是**“M-P 神经元模型“,神经元收到来自n个其他神经元传递过来的输入信号**,这些输入信号通过带权重的连接(connection) 进行传递,神经元接收到的总输入值将与神经元的阀值进行比较,然后通过"激活函数” (activation function 处理以产生神经元的

2021-11-28 23:38:36 825

原创 机器学习(第四章)4.决策树

机器学习(第四章)4.决策树1基本流程决策树(decision tree) 是一类常见的机器学习方法.以二分类任务为例,希望从给定训练数据集中学得一个模型用以对新示例进行分类,将样本分类的任务,可以看作是对于“当前样本是否为正类”这个问题的“决策”或“判定”过程。此决策过程如下图所示:决策过程的最终结论对应了我们所希望的判定结果,例如"是"或"不是"好瓜;决策过程中提出的每个判定问题都是对某个属性的"测试",例如"色泽=?" "根蒂=?“每个测试的结果或是导出最终结论,或是导出进一步的判定问

2021-11-25 22:43:03 832

原创 机器学习(第三章)3.4二分类线性判别分析

机器学习(第三章)3.4二分类线性判别分析1.算法原理1.1线性判别分析(Linear Discriminant Analysis ,简称 LDA)的思想:​ 给定训练样例集,设法将样例投影到一条直线上,使得同样例的投影点尽可能接近, 异类样例投影点能远离;在对新样本进行分类时,将其投影到同样的这条直线上,再根据投点的位置来确定新样本的类别.2.损失函数的推导2.1相关符号概念给定数据集D={(xi,yi)}i=1m,yi∈{0,1},令Xi、μi、Σi分别表示第i∈{0,1}类示

2021-11-22 23:38:53 523

原创 机器学习(第三章)3.3对数几率回归

机器学习(第三章)3.3对数几率回归1、对数几率回归的机器学习三要素1.模型:根据具体问题,确定假设空间——此篇为线性模型,输出值范围为[0,1],为近似阶跃的单调可微函数;2.策略:根据评价标准,确定选取最优模型的策略(通常会产生一个“损失函数”)——此篇由最大似然估计法、信息论来确定损失函数最小的等价条件;3.算法:求解损失函数,确定最优模型,一般无法求出准确值,求得近似值即可——可以采用梯度下降、牛顿法近似求解。2.算法原理原理:在线性模型的基础上套一个映射函数来实现分类功能对于二分类任

2021-11-22 23:29:02 1557

原创 机器学习(第三章)3.2线性模型

机器学习(第三章)线性模型三、线性模型3.1基本形式线性模型的一般形式,其中X= (X1; X2;…; Xd),代表d个属性值,ω=(ω1; ω2;…;ωd),代表属性值所占的权重。f(x)=wTx+bf(\boldsymbol{x})=\boldsymbol{w}^{\mathrm{T}} \boldsymbol{x}+bf(x)=wTx+b3.2线性回归线性回归试图学得一个线性模型以尽可能准确地预测实值输出标记.其中,确定w,b的值极为关键,可以用接下来几种方法来确定f(xi)=wxi

2021-11-22 23:18:53 852

原创 机器学习笔记

机器学习笔记一、绪论1.1基本术语分类:若我们欲预测的是离散值,例如"好瓜" “坏瓜”,此类学习任务称为"分类" (classification);回归:若欲预测的是连续值,例如西瓜成熟度 0.95 0.37此类学习任务称为"回归" (regression).聚类:将训练集中的西瓜分成若干组,每组称为个"簇" (cluster); 这些自动形成的簇可能对应一些潜在的概念划分,颜色深浅,本地外地:这些概念事先不知,而且通常不有标记信息。有监督学习:训练数据拥有标记信息,代表:分类,

2021-11-16 17:36:44 803

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除