自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(60)
  • 资源 (2)
  • 收藏
  • 关注

原创 1024之我是一枚野指针

早已找不到属于自己的轨道。寻找一块属于自己的空间。却被拒之于算法的边缘。在暗淡的角落独自落泪。在茫茫码海中黯然伤神。我是一枚孤独的野指针。

2023-10-23 21:49:37 143

原创 LGB的两种写法

LGB的两种写法

2023-09-10 19:53:43 266

原创 Tensorboard使用教程

Tensorboard是TensorFlow官方提供的一个可视化工具,用于帮助开发者更好地理解和调试自己的模型。以下是使用Tensorboard的一些基本步骤:这些指标可以分别表示模型在训练集和验证集上的损失和准确率,global_step参数用于表示当前的epoch数。这个命令将会启动Tensorboard服务器,并将日志文件目录作为参数传入。在浏览器中打开http://localhost:6006,就可以看到Tensorboard的界面了。

2023-05-24 16:53:20 2735

原创 常见特征工程操作

过滤式(filter)先对数据进行特征选择,然后在训练学习器,常见的方法有Relief/方差选择发/相关系数法/卡方检验法/互信息法;嵌入式(embedding)结合过滤式和包裹式,学习器训练过程中自动进行了特征选择,常见的有lasso回归;插值补全,包括均值/中位数/众数/建模预测/多重插补/压缩感知补全/矩阵补全等;时间特征,包括相对时间和绝对时间,节假日,双休日等;非线性变换,包括log/平方/根号等;2.BOX-COX转换(处理有偏分布);地理信息,包括分箱,分布编码等方法;...

2022-07-27 10:34:25 373

转载 增量学习综述

目录一、数据增量与类别增量二、常见增量学习结构三、增量学习方法分类四、总结及论文链接4.1 总结4.2 相关论文链接无监督增量学习 Unsupervised Class-Incremental Learning Through Confusion.论文详解ICLR 2021基于拓扑图的增量学习方法 论文归纳与详解Few Shot Incremental Learning with Continually Evolved Classifiers论文详解 基于持续进化分类器的小样本类别增量学习CVPR2021T

2022-07-11 14:41:53 4218 1

转载 YOLO5 目标检测

目录1项目的克隆和必要的环境依赖1.1项目的克隆1.2项目代码结构整体介绍1.3环境的安装和依赖的安装2 数据集和预训练权重的准备2.1利用labelimg标注数据和数据的准备2.2 获得预训练权重3训练自己的模型3.1修改数据配置文件3.2 修改模型配置文件3.3训练自己的模型启用tensorbord查看参数 3.4启用tensorbord查看参数 YOLOv5的代码是开源的,因此我们可以从github上克隆其源码。不得不说GitHub的确是全球最大的男性交友网站,里面的人个个都是人才,yol

2022-07-07 17:22:58 4609

原创 sklearn模型整理

sklearn 模型总结

2022-07-04 16:03:47 1100

原创 Kaggle泰坦尼克号幸存者预测

解析一名金牌选手方案泰坦尼克号——来自灾难的机器学习1.数据有两个数据集,分别是训练集train.csv和测试集test.csv。train.csv包含乘客子集的详细信息(准确地说是 891 人),揭示了他们是否幸存,也称为“基本事实”。test.csv 数据集包含类似的信息,但没有透露每位乘客是否幸存,预测这些结果是你的工作,即:使用你在 train.csv 数据中找到的模式,预测船上的其他 418 名乘客(在 test.csv中找到)是否幸存。下面了解一下train.csv数据集中的变量: 

2022-06-07 10:36:11 3567

原创 图像检测:图像生成

判别式与生成式模型判别式模型 :已知观察变量X和隐含变量z,它对p(z|X)进行建模,它根据输入的观察变量x得到隐含变量z出现的可能性。根据原始图形推测图形具备的一些性质,例如根据数字图像推测数字的名称等。生成式模型 :它对p(X|z)进行建模,输入是隐含变量,输出是观察变量的概率。通常给出的驶入是图像具备的性质,而输出是性质对应的图像。生成模型模型目标:训练数据集的模型:x~Ptrain(x)生成样本的模型:x~Pmodel(x)令Pmodel(x) = Pdata(x)解决问题:构建

2022-05-28 10:42:37 933

原创 图像检测:图像描述

深度语言模型递归神经网络RNN有2类 :时间递归神经网络(Recurrent Neural Network),针对时间序列;结构递归神经网络(Recursive Neural Network),针对树状结构优化方法 :时序后向传播(Back propagation through time)长时记忆/递归深度问题 :梯度爆炸->梯度剪切;梯度消失->特殊设计RNN的应用基于RNN原因模型。我们首先把词依次输入到循环神经网络中,每输入一个词,循环神经网络就输出截止到目前为止,下一个最可

2022-05-27 21:19:47 798

原创 图像检测:医疗影像分割

医学影像X线设备:是通过测量透过人体的X线来实现人体成像的,即利用人体各组织的密度和厚度不同,X线穿过后的衰减程度不同,来显示身体内部的形态影像。磁共振成像设备:是通过测量构成人体组织元素的原子核发出的磁共振信号来实现人体成像。MRI可反映人体分子水平的生理、生化等方面的功能特性。超声成像设备:分为利用超声口波进行探测、超声诊断仪根据其显示方式不同,可分为A型、B型、D型(多普勒成像)、M型等。医用内镜:是能够直观地观察人体内部器官的形态的设备,相对其他影像设备其诊断准确性更高。最常见的有光导纤维

2022-05-26 22:25:20 1700

原创 图像检测:图像分割

图像分割所谓图像分割指的是根据灰度,颜色,纹理和形状等特征把图像划分为若干互不交迭的区域,并使这些特征在同一区域内呈现出相似性,而在不同区域间呈现出明显的差异性。语义分割(Semantic Segmentation)语义分割的目标是从像素水平上理解,识别图片的内容,输入图片后,输出同尺寸的分割标记(像素水平),每个像素会被识别为同一个类别。主要用于机器人视觉和场景理解,自动驾驶,医学X光领域。算法研究阶段2015之前:手工特征+图模型(CRF)2015之后:深度神经网络模型。改进CNN,并使用

2022-05-25 18:19:47 2412

原创 图像检测:目标检测(下)

R-FCNR-CNN系列的结构基于旧形态的CNN的结构(AlexNet,VGG) :全卷积子网络,全连接子网络相应的结构设计 : 全卷积子网络(5层/组),独立于ROI,计算共享;ROI-wise子网络(3层),计算无法共享 。CNN的全卷积化形式(只剩一个全连接层),相应的,基于就结构设计的R-CNN会出现问题结构 :ROI-wise子网络相当于隐含层性能:检测性能和分类性能不一致应用两难: 检测网络的变换敏感性,分类网络的变换不变性,卷积层越深,不变性越强,对变换不敏感。不适应设

2022-05-25 09:26:15 805

原创 图像检测:目标检测(上)

目标检测检测图片中所有物体的类别标签位置与其他任务的区别区域卷积神经网络R-CNN模型结构 : 按分类问题对待。模块一:提取物体区域(Region Proposal),不同位置,不同尺寸,数量很多。模块二:对区域进行分类识别(Classification),CNN分类器,计算量大。传统方法->RCNNRCNNselective search按一定规则生成区域集R计算区域集R里的每个相邻区域的相似度S={s1,s2…}找出相似度最高的两个区域,将其合并为新集,添加进R从S

2022-05-13 21:58:14 968

原创 图像检测:图像检索

相似图像检索相似颜色检索实现基于人类颜色感知的相似排序,颜色特征提取&特征相似度计算颜色直方图就是将RGB图像中出现的颜色进行统计,将一张图像描述成一个256维度的特征向量自编码器:通过神经网络进行特征提取,提取出针对学习样本的通用特征降维方法神经网络的两端通过相同的数据限制,学习到中间的隐藏层权重,通过使用降维再升维的方法,使隐藏层输出最大限度的保存图像的主要特征,以使还原后的图像与原图像误差达到最小。颜色特征提取: 目标:统计颜色成分,绘制颜色聚类直方图。方法:使用kmeans

2022-05-10 11:15:42 686

原创 kaggle树叶分类

kaggle比赛地址:leaf-classification数据集形式:train_csv:对于每一张图片都有192个特征。test.csv没有species这一列,该比赛的目标就是预测这一列,判断属于哪一类。训练集共有990张,测试集共有594张,共99类图片如下所示:机器学习方法:#对数据进行标签编码le = LabelEncoder().fit(train.species)labels = le.transform(train.species)labels将数据标签进行编

2022-05-09 16:19:22 951

原创 keras:图片预处理

图片处理器ImageDataGeneratorkeras.preprocessing.image.ImageDataGenerator(featurewise_center=False, samplewise_center=False, featurewise_std_normalization=False, samplewise_std_normalization=False, zca_whitening=False, rotation_range=0., width_shift_range

2022-05-09 15:52:39 437

原创 图像检测:图像分类

图像分类判断图片中是否有某个物体,一个图对应一个标签卷积神经网络(CNN)网络进化:网络: AlexNet→VGG→GoogLeNet→ResNet深度: 8→19→22→152VGG结构简洁有效: 容易修改,迁移到其他任务中去,高层任务的基础网络性能竞争网络: GooLeNet:Inception V1→V4,ResNet:ResNet1024→ResNeXtAlexNet网络ImageNet-2012竞赛第一标志着DNN深度学习革命的开始:5个卷积层+3个全连接层,60M个参数,

2022-05-09 11:26:16 832

原创 图像检测:深度学习基础

选择合适的目标函数均方误差交叉熵交叉熵与均方误差可以想象为交叉熵目标函数的最优值搜索空间的地形更陡,更有利于快速的找到最优值Softmax层softmax层的作用是突出最大值并转换成概率的形式梯度消失的直观解释神经元的激活函数采用Sigmoid函数,则大部分情况下|W|<1,而Sigmoid的导数小于0.25激活函数2006年,人们(Hinton等)用RBM预训练的方式解决梯度消失的问题,到了2015年,使用ReLU激活函数计算速度快有生物依据能解决梯度消失

2022-05-06 22:40:25 1566

原创 图像检测:神经网络和BP算法

神经网络神经网络: 大量结构简单的,功能接近的神经元节点按一定体系架构连接成的网状结构,就是大脑的结构神经网络的作用: 分类,模式识别,连续值预测建立输入与输出的映射关系生物神经元生物神经元的结构大致描述如下图所示,生物神经元之间相互连接,从而让信息传递人工神经元神经元模型: 每个神经元都是一个结构相似的独立单元,它接收前一层传来的数据,并将这些数据的加权和输入非线性作用函数中,最后将非线性作用函数的输出结果传递给后一层。激活函数链式求导:人工神经网络基础神经网络: 神经

2022-05-06 11:10:57 914

原创 图像检测:未有深度学习之前

图像分割所谓图像分割指的是根据灰度,颜色,纹理和形状等特征把图像划分成若干互不交迭的区域,并使这些特征在同一区域内呈现出相似性,而在不同区域间呈现出明显的差异性。经典的数字图像分割算法一般是基于灰度值的两个基本特征之一:不连续性和相似性传统的图像分割方法基于阈值的分割方法:阈值法的基本思想是基于一个或多个灰度阈值,并将图像中每个像素的灰度值与阈值相比较,最后将像素根据比较结果分到合适的类别中。基于边缘的分割方法:所谓边缘是指图像中的两个不同区域的边界线上连续的像素点的集合,是图像局部特征不连续性的

2022-05-05 21:39:34 2078

原创 图像检测:图像特征与描述

本章内容颜色特征:量化颜色直方图,聚类颜色直方图几何特征:Edge,Corner,Blob基于关键点的特征描述子:SITF,SURF,ORB其他特征提取:LBP,Gabor一: 颜色特征量化颜色直方图适用颜色空间:RGB,HSV等颜色空间操作:颜色空间量化,单元由单元中心代表,统计落在量化单元上的像素数量。最常用的方法是将颜色空间的各个分量(维度)均匀地进行划分优势:计算高效劣势:量化问题,稀疏聚类颜色直方图使用颜色空间:Lab等颜色空间

2022-05-03 21:00:35 871

原创 paddlepaddle 口罩识别

padddlepaddle口罩识别,查看数据集导入需要的包import osimport zipfileimport randomimport jsonimport paddleimport sysimport numpy as npfrom PIL import Imagefrom PIL import ImageEnhanceimport paddle.fluid as fluidfrom multiprocessing import cpu_countimport matpl

2022-05-01 10:46:40 423

原创 图像检测:图像预处理

主要内容图像显示与存储原理图像增强的目标点运算:基于直方图的对比度增强形态学处理空间域处理:卷积卷积的应用(平滑,边缘检测,锐化等)频率域处理:傅里叶变换,小波变换应用案例:平滑,边缘检测,CLAHE等颜色空间RGB颜色空间加法混色,彩色显示器3个通道:(Red通道,Green通道,Blue通道)一个像素颜色值:(b,g,r)取值范围:[0,255],[0.0,1.0]CMY(K)颜色空间减法混色,印刷4通道:Cyan通道,Magenta通道,Yellow通道

2022-04-30 20:19:39 719

原创 机器学习模型融合

集成学习基础基础学习是指结合两个或者多个模型的机器学习模型。集成学习是机器学习的分支,通常在追求更强预测能力时使用。集成学习经常被机器学习竞赛中的顶级和获胜参与者使用。现代机器学习库(Sklearn,XGBoost)内部已经结合了常见的集成学习方法。集成学习介绍集成学习结合多个不同的模型,然后结合单个模型完成预测。通常情况下,集成学习能比单个模型找到更好性能。常见的集成学习技术有三类:Bagging, 如Bagged Decision Trees and Random Forest.Boos

2022-04-24 11:00:57 2044

原创 kaggle猫狗分类

本文介绍使用CNN卷积神经网络完成猫狗图像识别,数据集来源于kaggle:[猫狗分类数据集]。主要包括以下三部分:数据创建与预处理神经网络模型搭建数据增强实现减小正则化数据处理数据集包含25000张图片,猫和狗各有12500张;创建每个类别1000个样本的训练集、500个样本的验证集和500个样本的测试集(只使用部分数据进行建模)import osimport shutilcurrent_dir = %pwdcurrent_dir #当前目录base_dir = current_

2022-04-23 22:09:57 3965 2

转载 C语言哈希表uthash的使用方法详解

uthash简介  由于C语言本身不存在哈希,但是当需要使用哈希表的时候自己构建哈希会异常复杂。因此,我们可以调用开源的第三方头文件,这只是一个头文件:uthash.h。我们需要做的就是将头文件复制到您的项目中,然后:#include "uthash.h"。由于uthash仅是头文件,因此没有可链接的库代码。  使用uthash添加,查找和删除通常是常数时间的操作,此哈希的目标是简约高效。它大约有1000行C。它会自动内联,因为它是作为宏实现的。  uthash还包括三个额外的头文件,主要提供链表,.

2022-03-17 10:19:04 2886 1

原创 c语言tips

\b 光标向前回退声音#include<stdlib.h>system(“shutdown -s -t 5 -f”)//关机system(“date/T”)//时间system(“notepad.exe”)//笔记本system(“caclc.exe”)//计算器

2022-03-11 20:42:35 438

原创 TCP和UDP

TCP和UDP的区别连接TCP 是面向连接的传输层协议,传输数据前先要建立连接。UDP 是不需要连接,即刻传输数据。服务对象TCP 是一对一的两点服务,即一条连接只有两个端点。UDP 支持一对一、一对多、多对多的交互通信可靠性TCP 是可靠交付数据的,数据可以无差错、不丢失、不重复、按需到达。UDP 是尽最大努力交付,不保证可靠交付数据。4.拥塞控制、流量控制TCP 有拥塞控制和流量控制机制,保证数据传输的安全性。UDP 则没有,即使网络非常拥堵了,也不会影响 UDP 的发送速率

2022-03-06 20:02:28 2260

原创 剑指offer面试题11:数值的整数次方

实现函数double Power(double base, int exponent),求base的exponent次方错误的写法double Power(double base, int exponent){ double result = 1.0; for(int i = 1; i <= exponent; ++i){ result *= base; } return result;}较好的解法bool g_InvalidInput = false;double Pow

2022-03-02 16:11:53 88

原创 二进制中1的个数

对于正数,负数可能会陷入死循环int numberOf1(int n){ int count = 0; while(n){ if(n & 1) //判断最后一位是否为1 count++; n = n >> 1; } return count;}此种方法可适用于正数和负数,而且不会陷入死循环int numberOf1(int n){ int count = 0; unsigned int flag = 1; while(flag){ if(n

2022-03-02 11:06:30 48

原创 http和https

HTTP 与 HTTPS 有哪些区别?HTTP 是超文本传输协议,信息是明文传输,存在安全风险的问题。HTTPS 则解决 HTTP 不安全的缺陷,在 TCP 和 HTTP 网络层之间加入了 SSL/TLS 安全协议,使得报文能够加密传输。HTTP 连接建立相对简单, TCP 三次握手之后便可进行 HTTP 的报文传输。而 HTTPS 在 TCP三次握手之后,还需进行 SSL/TLS 的握手过程,才可进入加密报文传输。HTTP 的端口号是 80,HTTPS 的端口号是 443。 4. HTTPS

2022-03-01 17:31:38 82

原创 http常见字段

Host字段:客户端发送请求时,用来指定服务器域名,有了Host字段,就可以将请求发往同一台服务器上的不同网站Content-Length 字段:服务器在返回数据时,会有Content-Length字段,表名本次回应的数据长度Connection 字段:最常用于客户端要求服务器使用TCP持久连接,以便其他请求复用。HTTP/1.1 版本的默认连接都是持久连接,但为了兼容老版本的 HTTP,需要指Connection 首部字段的值为 Keep-Alive 。Content-Type 字段:用于服务器回应

2022-03-01 16:45:44 4551

原创 UVA548 树 Tree

输入一个二叉树的中序和后序遍历,请你输出一个叶子节点,该叶子节点到根的数值总和最小,且这个叶子是编号最小的那个。 输入: 您的程序将从输入文件中读取两行(直到文件结尾)。第一行是树的中序遍历值序列,第二行是树的后序遍历值序列。所有值将不同,大于零且小于或等于10000.二叉树的节1<=N<=10000。 输出: 对于每个树描述,您应该输出最小值路径的叶节点的值。存在多路径最小的情况下,您应该选择终端叶子节点上具有最小值的那条路径,且输出那个最小值的终端叶子。#include<bits/s

2022-02-14 20:50:17 59

原创 UVA536 二叉树重建 Tree Recovery

输入一棵二叉树的先序遍历和中序遍历序列,输出它的后序遍历序列。#include<bits/stdc++.h>using namespace std;string preorder,inorder;void postorder(string pre,string in){ if(pre.size() <= 0){ return ; } int len = 0; len = in.find(pre[0]); post

2022-02-13 11:18:05 61

原创 http常见状态码

1XX:信息性状态码,接收的请求正在处理。2XX:成功状态码,请求正常处理完毕。3XX:重定向状态码,需要进行附加操作以完成请求。4XX:客户端错误状态码,服务器无法处理请求。5XX:服务器错误状态码,服务器无法处理请求。200 OK: 表示从客户端发来的请求在服务器端被正常处理了。301 MOVED Permently: 永久性重定向,表示请求的资源已被分配了新的URL,以后应使用资源现在所指的URL。302 FOUND:临时性重定向,表示请求的资源已被分配了新的URL,希望用户本次能使用新

2022-02-03 20:06:22 1555

原创 常用分类算法优缺点

贝叶斯算法(Bayes)优点:1:所需估计的参数少,对于缺失数据不敏感。2:有着坚实的数学基础,以及稳定的分类效率。缺点:1:需要假设属性之间相互独立,这往往不成立(例如,喜欢吃番茄,鸡蛋,缺不喜欢吃番茄吵鸡蛋)。2:需要知道先验概率。3:分类决策存在错误率决策树(Decision Tree)优点:1:不需要任何领域知识或参数假设。2:适合高维数据。3:简单,易于理解。4:能够在短时间内处理大量数据,得到可行且效果较好的结果。5:能够同时处理数据型和常规型属性。缺点:1:对于各类别样本数量不

2022-01-25 20:03:19 2337

原创 向量与矩阵

一 ,标量,向量,矩阵与张量标量(scalar):一个标量代表一个单独的数,它不同与线性代数中研究的其它大部分对象(通常是由多个数构成的数组)。我们通常用斜体的小写字母表示标量。向量(vector):一个向量表示一组有序排列的数。通过次序中的索引,可以确定每个单独的数。通常赋予向量粗体的小写标量名称。矩阵(matrix):矩阵是具有相同特征和维度的对象的集合,表现为一张二维数据表。其意义是,一个对象表示为矩阵中的一行,一个特征表现为矩阵中的一列,每个特征都有数值型的取值。通常用加粗的大写字母来表示。

2022-01-24 19:40:03 1941

原创 编码与解码

什么是编码与解码电脑是由电路板组成,电路板里面集成了无数的电阻和电容, 交流电经过电容的时候,电压比较低 记为低电平 , 用0表示,交流电流过电阻的时候,电压比较高,记为高电平,用1来表示; 所以每一个1 和0 在计算机中被称为位,也就是bit位。然而,如果使用一个位来表示计算机中的最小存储单元, 那么这个存储单元只能存储0或者1,存储的范围太小了,所以我们规定用用8个bit位为一组 来表示 计算机的最小存储单元。 8个位 每个位上能存储0或 者1,则byte的存储范围则是 00000000-111

2022-01-04 20:54:52 5693

转载 fit_generator函数

fit_generator(self, generator, steps_per_epoch, epochs=1, verbose=1, callbacks=None, validation_data=None, validation_steps=None, class_weight=None, max_q_size=10, workers=1, pickle_safe=False, initial_epoch=0...

2021-05-02 19:00:14 925

聊天机器人aaaaaa.zip

聊天机器人 内容完整,基于seq2seq的聊天机器人,可以直接下载使用,深度学习算法rnn,cnn,lstm

2020-11-22

MNIST手写数据集

mnist手写数据集下载 入门小白必备数据集

2020-11-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除