陈千鹤-CSDN博客

原创 [PARL强化学习]Sarsa和Q—learning的实现

[PARL强化学习]Sarsa和Q—learning的实现Sarsa和Q—learning都是利用表格法再根据MDP四元组<S,A,P,R>：S: state状态，a: action动作，r:reward，奖励p: probability状态转移概率实现强化学习的方法。这两种方法都是根据环境来进行学习，因此我们需要利用P函数和R函数描述环境、而Q表格用于记录每一个状态（state）上进行的每一个动作（action）计算出最大的未来奖励（reward）的期望。训练完成的Q表格将用于指

2021-03-21 12:53:56 419

原创 [PARL强化学习]基于策略梯度求解RL

[PARL强化学习]基于策略梯度求解RL一、随机策略与策略梯度1. Value-based和Policy-based的区别两者的主要区别在于两方面，一是关于action的求取，二是策略的确定性。2. 期望回报3. 优化策略函数与Q网络对比，Policy网络没有直观的优化目标，因此我们需要上述的期望回报作为它的优化目标，才能对网络结构进行优化。具体的策略梯度如下：4.策略梯度的详细推导二、Policy Gradient简介在强化学习中，有两大类方法，一种基于值（Value-ba

2021-03-20 14:09:00 466

原创 [PARL强化学习]连续动作空间上求解RL——DDPG

[PARL强化学习]连续动作空间上求解RL——DDPG一、连续动作生过中有很多动作不可数的情况，即是连续动作为了解决连续动作的问题，我们需要使用Policy网络，输出一个确定性的策略，例如一个具体的浮点数等。常见做法就是在网络的最后增加一个tanh层。二、DDPG简介DDPG全称是Deep Deterministic Policy Gradient，即深度确定性策略梯度。从DDPG这个名字看，它是由D（Deep）+D（Deterministic ）+ PG(Policy Gradient)

2021-03-20 14:08:49 1421

原创 [飞桨机器学习]AdaBoost算法

[飞桨机器学习]AdaBoost算法提升方法（Boosting），是一种可以用来减小监督式学习中偏差的机器学习算法。面对的问题是迈可·肯斯（Michael Kearns）提出的：一组“弱学习者”的集合能否生成一个“强学习者”？弱学习者一般是指一个分类器，它的结果只比随机分类好一点点；强学习者指分类器的结果非常接近真值。一、算法起源Valiant和 Kearns提出了弱学习和强学习的概念 ,识别错误率小于1/2,也即准确率仅比随机猜测略高的学习算法称为弱学习算法;识别准确率很高并能在多项式时间内完成的学

2021-03-20 14:08:38 317

原创 [飞桨机器学习]Bagging算法

[飞桨机器学习]Bagging算法Bagging算法（英语：Bootstrap aggregating，引导聚集算法），又称装袋算法，是机器学习领域的一种团体学习算法。最初由Leo Breiman于1996年提出。Bagging算法可与其他分类、回归算法结合，提高其准确率、稳定性的同时，通过降低结果的方差，避免过拟合的发生。一、简介Bagging [Breiman, 1996a] 是井行式集成学习方法最著名的代表.从名字即可看出，它直接基于自助采样法(bootstrap sampling).给定包含

2021-03-20 14:08:27 1054

原创 [飞桨机器学习]DBSCAN算法

[飞桨机器学习]DBSCAN算法一、简介DBSCAN（Density-Based Spatial Clustering of Applications with Noise），具有噪声的基于密度的聚类方法）是一种基于密度的空间聚类算法。该算法将具有足够密度的区域划分为簇，并在具有噪声的空间数据库中发现任意形状的簇，它将簇定义为密度相连的点的最大集合。二、相关概念Ε邻域：给定对象半径为Ε内的区域称为该对象的Ε邻域；核心对象：如果给定对象Ε邻域内的样本点数大于等于MinPts，则称该对象为核心对象

2021-03-20 14:08:16 299

原创 [飞桨机器学习]Kmeans算法

[飞桨机器学习]Kmeans算法一、简介k均值聚类算法（k-means clustering algorithm）是一种迭代求解的聚类分析算法，其步骤是，预将数据分为K组，则随机选取K个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。每分配一个样本，聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有（或最小数目）对象被重新分配给不同的聚类，没有（

2021-03-20 14:08:03 1040

原创 [飞桨机器学习]KNN算法

[飞桨机器学习]KNN算法这次简要介绍knn算法和具体实现的案例代码，依旧会是很基础并且不会刻意利用python的高级特性。整个内容大概分成三个部分，knn介绍，python实现，和进阶方法。不论你现在熟悉哪种语言，感兴趣的话都可以动手自己尝试一下。一、KNN介绍在我看来，knn就是计算测试数据与每一个训练数据的距离，取出距离最近的K个训练数据的标签，以其中数量最多的作为测试数据的预测标签。官方地说：邻近算法，或者说K最近邻(kNN，k-NearestNeighbor)分类算法是数据挖掘分类技

2021-03-20 14:07:54 518

原创 [飞桨机器学习]SVM算法理论推导+代码实现

[飞桨机器学习]SVM算法理论推导+代码实现SVM之代码实现首先我们回顾一下上一篇理论推导，并总结一下算法流程。一、算法步骤二、数据集数据集依旧采用之前的TITANIC数据集。三、代码实现1.导入包import csvimport numpy as npimport matplotlib.pyplot as pltimport copyfrom time import sleepimport randomimport types2.数据处理def

2021-03-20 14:07:43 617 1

原创 [飞桨机器学习]决策树算法

[飞桨机器学习]决策树算法一、简介1.概述决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法，首先对数据进行处理，利用归纳算法生成可读的规则和决策树，然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。决策树方法最早产生于上世纪60年代，到70年代末。由J Ross Quinlan提出了ID3算法，此算法的目的在于减少树的深度。但是忽略了叶子数目的研究。C4.5算法在ID3算法的基础上进行了改进，对于预测变量的缺值处理、剪枝技术、派生规则等方面作了较大改进，既

2021-03-20 14:07:25 1436 1

原创 [飞桨机器学习]六种常见数据降维

[飞桨机器学习]六种常见数据降维事实上，在高维情形下现的数据样本稀疏、距离计算困难等问是所有机器学习方法共同面的严重障碍，被称为" 维数灾难" (curse of dimensionality) . 缓解维数灾难的一个重要途径是降维(dimension reduction) 亦称" 维数约简 “ ，即通过某种数学变换将原始高维属性空间转变为一个低维"子空间" （subspace) ，在这子空中样本密大幅提高计算变得更为容易。为什么进行降维?这是因为在很多时候，人们观测或收集到的数

2021-03-20 14:05:44 873

原创 [飞桨机器学习]逻辑回归（六种梯度下降方式）

[飞桨机器学习]逻辑回归（六种梯度下降方式）一、简介logistic回归是一种广义线性回归（generalized linear model），因此与多重线性回归分析有很多相同之处。它们的模型形式基本上相同，都具有 w‘x+b，其中w和b是待求参数，其区别在于他们的因变量不同，多重线性回归直接将w‘x+b作为因变量，即y =w‘x+b，而logistic回归则通过函数L将w‘x+b对应一个隐状态p，p =L(w‘x+b),然后根据p 与1-p的大小决定因变量的值。如果L是logistic函数，就是log

2021-03-19 16:34:05 2157

原创 [飞桨机器学习]朴素贝叶斯算法

[飞桨机器学习]朴素贝叶斯算法本篇主要介绍朴素贝叶斯算法及应用案例。以Tatinic数据集为例进行应用，同时介绍数据处理，数据集的划分，算法效果评估等内容。一、简介朴素贝叶斯法是基于贝叶斯定理与特征条件独立假设的分类方法。最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型（Naive Bayesian Model，NBM）。和决策树模型相比，朴素贝叶斯分类器(Naive Bayes Classifier 或 NBC)发源于古典数学理论，有着坚实的数学

2021-03-19 16:33:03 610

原创 [飞桨机器学习]随机森林

[飞桨机器学习]随机森林一、简介随机森林是利用多棵树对样本进行训练并预测的一种分类器。随机选择特征数目，随机选择训练数据，对同一个预测数据取出现次数最多的预测标签为最终预测标签。随机森林实际上是一种特殊的bagging方法，它将决策树用作bagging中的模型。首先，用bootstrap方法生成m个训练集，然后，对于每个训练集，构造一颗决策树，在节点找特征进行分裂的时候，并不是对所有特征找到能使得指标（如信息增益）最大的，而是在特征中随机抽取一部分特征，在抽到的特征中间找到最优解，应用于节点，进

2021-03-19 16:30:54 505

原创 [飞桨机器学习]梯度下降求解SVM

[飞桨机器学习]梯度下降求解SVM一、损失函数定义我们令：这是一个简单的线性回归的形式，此时我们来定义损失函数：可以看到，这是一个通用的损失函数的形式，当损失函数l为二元交叉熵的时候，上面的L(x)表示的就是逻辑回归的损失函数，当损失函数l为mse的时候，上面的L(x)表示的就是线性回归的损失函数，当l为hinge loss的时候，上面的L(x)表示的就是线性svm的损失函数。此时我们令 ,其中为了简单起见我们令那么这个时候我们就可以得到线性svm的损失函数了：，L定义如上，这称

2021-03-19 16:26:20 578

原创 2020MathorCup第一届大数据赛B题Paddle方案

2020MathorCup第一届大数据赛B题Paddle方案比赛简介网址：https://www.saikr.com/contest/dm_detail_subB/41530简而言之就是利用八张图片的训练集完成遥感图像分割任务，测试集为两张图片。三个问题为：问题1：计算10幅图中耕地在各图像中所占比例问题2：从给定的2幅测试图像(Test1.tif、Test2.tif)中提取出耕地，制作耕地标签图，并将标签图分别上传到竞赛平台中（注意田块间的边界是否清晰）；问题3：我国土地辽阔，地貌复杂，你有

2021-03-19 16:20:26 5715

原创 PaddlePaddle证件照换底换大小工具

PaddlePaddle证件照换底换大小工具这个工具是在AI抠图的基础上，再加上换底和换大小功能做成的小软件，拥有简易的GUI界面。接着往下看完，你就能拥有一款自己专属证件照小工具了！一、简介先来看看效果吧图片源自网络首先是原图然后是中间的扣图结果可以看到基本扣的十分干净然后再看看最终的红色二寸照片可以看到效果是非常不错的接下来看看我们的GUI界面，让这样一款小工具更加简便好用首先是进入界面，非常简洁，选取照片后点击你想要格式的按钮即可如果你没有

2021-03-19 16:19:16 383

原创 RNN(LSTM&GRU)文本分类（PaddlePaddle2.0）

RNN(LSTM&GRU)文本分类（PaddlePaddle2.0）一、RNN简介循环神经网络（Recurrent Neural Network, RNN）是一类以序列（sequence）数据为输入，在序列的演进方向进行递归（recursion）且所有节点（循环单元）按链式连接的递归神经网络（recursive neural network）。它与DNN,CNN不同的是: 它不仅考虑前一时刻的输入,而且赋予了网络对前面的内容的一种’记忆’功能.RNN之所以称为循环神经网路，即一个序列当前的输

2021-03-19 16:18:01 3336 3

原创初识PARL实现强化学习

初识PARL实现强化学习一、什么是强化学习强化学习（英语：Reinforcement learning，简称RL）是机器学习中的一个领域，强调如何基于环境而行动，以取得最大化的预期利益。核心思想：智能体agent在环境environment中学习，根据环境的状态state（或观测到的observation），执行动作action，并根据环境的反馈 reward（奖励）来指导更好的动作。注意：从环境中获取的状态，有时候叫state，有时候叫observation，这两个其实一个代表全局状态，一个

2021-03-19 16:14:56 1201

原创基于PaddlePaddle和PaddleHub的口罩检测系统的落地实现

基于PaddlePaddle和PaddleHub的口罩检测系统的落地实现一、项目意义2020春节，新型冠状病毒肆虐华夏大地，中华儿女举国防止疫情扩散蔓延，为防止疫情扩散，做好个人防护是每个公民的义务，特别是公共场合，火车站、飞机场和汽车站，人流量大的密集地区，做好人员口罩监控相当有必要。二、项目目标实现视频实时监测，并且做出简易GUI，打包出EXE文件，达到可以实用的目的除此之外，做出具有照片检测功能的APP和服务器版，为后续优化提升打下基础三、模型简介1.pyramidbox_lite_mo

2021-03-19 16:12:05 1441 1

原创基于Paddle的截图&OCR文字识别的实现

基于Paddle的截图&OCR文字识别的实现一款截图识别文字的OCR工具主要涉及2个环境：截图OCR识别前要OCR的应用场景根据OCR的应用场景而言，我们可以大致分成识别特定场景下的专用OCR以及识别多种场景下的通用OCR。就前者而言，证件识别以及车牌识别就是专用OCR的典型案例。针对特定场景进行设计、优化以达到最好的特定场景下的效果展示。那通用的OCR就是使用在更多、更复杂的场景下，拥有比较好的泛性。在这个过程中由于场景的不确定性，比如：图片背景极其丰富、亮度不均衡、光照不均衡、残

2021-03-19 16:08:07 1706

chenqianhe2的博客