自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

原创 解决UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x80 in position 0: illegal multibyte sequence问题

2、解决UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 0: illegal multibyte sequence问题。1、解决Python报错UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 658: illegal multibyte。

2022-09-25 21:39:59 548

原创 奇安信——算法实习笔试(2022.5.8)

​单选20道,多选10道,编程2道。

2022-09-01 18:55:33 138

原创 双光融合调研

双光融合是“微光+热像仪”双通道,即可见光通道以及红外光通道二合一。它同时运用红外、微光技术使之在不同的波长进行成像,同步探测目标的二维几何空间与一维光谱信息,然后利用一定的图像处理算法对多波段图像进行分析处理,充分利用各种信道中的有用信息合成图像。多应用在双光融合的测温热像仪,一般会配合平台软件使用。可见光通道可以展现目标实时的动态,作用等同于摄像头;红外光通道可以展示测温结果,以热像图的方式来展示现场温差以及温度数值。这样,避免了单一热像设备或者人员现场拍摄图像模糊不清,需要去问题点现场再次查看的弊端,

2022-08-17 15:44:44 709

原创 视频人体行为检测

视频检测通常处理思路。

2022-07-27 12:38:29 606

原创 雅思听力——剑雅5——Text1

同义替换生词同义替换生词同义替换生词同义替换生词。

2022-07-27 08:15:48 43

原创 dropout层、线性层、layernorm

nn.dropout 每次将 p 元素设置为 0,剩下的元素乘以 1/(1-p)eval()模式不进行dropout使用方法如下:

2022-07-11 11:07:09 136

原创 RNN-LSTM

one to one:图像分类 image classificationone to many:看图说话 image captioningmany to one:情感分析 sentiment classification/音乐分类many to many:机器翻译 senquence to sequencemany to many:语言模型/NER tagging结构:只有输入x和隐藏状态h递归,RNN是一个链式结构,每个时间片使用的是相同的参数。以序列(sequence)为输入,在序列的演进方向递归在时间

2022-07-02 14:31:34 137

原创 字符级文本生成LSTM

LSTM生成字符级文本

2022-06-30 00:52:27 237

原创 自然语言处理——word2vec项目实战——从Word2Vec到FastText

从Word2Vec到FastTextWord2Vec在深度学习中的应⽤⽂本⽣成(Word2Vec + RNN/LSTM)⽂本分类(Word2Vec + CNN)文本生成神经网络:一堆公式组成的非线性回归模型普通神经网络[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-5L4DEtMn-1653990033441)(E:/A%20wangdanxu/%E6%9D%82%E7%89%A9/typore/image-20220531162244167.png)]带记

2022-05-31 17:41:34 91

原创 深度学习——李宏毅第一课2020

李沐深度学习课程预测宝可梦的战斗力RegressionMarket Forecast——预测明天股价如何?self-driving car——预测方向盘角度Recommendation——购买可能性(推荐系统)f(x(宝可梦))=y  ′  CP  after  evolution  ′f(x(宝可梦))=y\;'\;CP\;after\;evolution\;'f(x(宝可梦))=y′CPafterevolution′xcp:进化前战斗力、xs:物种、xhp:生命值、xw:重量、xh

2022-05-30 21:39:00 74

原创 自然语言处理——word2vec项目实战—— 情感分析

bag of words + 随机森林(有标签数据)import osimport reimport numpy as npimport pandas as pdfrom bs4 import BeautifulSoupfrom sklearn.feature_extraction.text import CountVectorizerfrom sklearn.ensemble import RandomForestClassifierfrom sklearn.metrics impor

2022-05-28 20:41:09 178

原创 自然语言处理——word2vec项目实战—— Word2VEec理论基础

Word2VEec理论基础NLP常见任务自动摘要指代消解(小明放学了,妈妈去接【他】)机器翻译(小心地滑->Slide carefully)词性标注(heat(v.) water(n.) in(p.) a(det.) pot(n.))分词(中文日文等) 大水沟/很/难/过主题识别文本分类NLP处理方法传统:基于规则现代:基于统计机器学习HMM,CRF,SVM,LDA,CNN …“规则”隐含在模型参数里图像是原始数据,但是自然语言是人的智慧的结晶,所以利用机器学

2022-05-16 13:33:06 286

原创 自然语言处理——word2vec项目实战—— NLP理论基础

NLP理论基础语料库NLTK : pip install nltkhttp://www.nltk.org//(40条消息) NLTK安装方法_一脑子RMC136的博客-CSDN博客_nltk安装教程文本处理流程句子→预处理→分词(Tokenize)→特征工程(make features)→机器学习(machine learning)分词(Tokenize)把长句子拆成“有意义”的小部件英文from nltk.tokenize import word_tokenizesentences

2022-05-11 19:17:19 266

原创 力扣(Leetcode)——python3

目录动态规划70、爬楼梯递归-超限制迭代509、斐波那契数递归法O(2^n)迭代746、使用最小花费爬楼梯1137、第N个泰波那契序列递归-超限制迭代动态规划Dynamic Programming递归+迭代70、爬楼梯力扣https://leetcode.cn/problems/climbing-stairs/假设你正在爬楼梯。需要n阶你才能到达楼顶。每次你可以爬1或2个台阶。你有多少种不同的方法可以爬到楼顶呢?例:...

2022-05-10 11:51:37 474

原创 机器学习——numpy逻辑回归(手写数字识别)

二分类——识别1、7import numpy as npimport structimport matplotlib.pyplot as pltimport osfrom PIL import Imagefrom sklearn.utils import gen_batchesnp.random.seed(2022)train_image_file = './案例/05 -手写数字识别/train-images-idx3-ubyte'train_label_file = './案例/

2022-05-05 11:09:45 686

原创 机器学习——逻辑回归(分类算法)、聚类算法

模型的保存与加载from sklearn,externals import joblibjoblib.dump(rf,'test.pkl')——保存estimator = joblib.load('test.pkl')——加载#### 保存训练好的模型joblib.dump(lr,'./tmp/test.pkl')#### 预测房价结果model = joblib.load('./tmp/test.pkl')y_predict = std_y.inverse...

2022-04-11 09:09:33 1570

原创 机器学习——回归算法

目录回归问题的判定线性回归线性模型岭回归回归问题的判定目标值连续线性回归寻找一种能预测的趋势线性关系:二维——直线当中 三维——特征、目标值,平面当中线性模型试图学得一个通过属性的线性组合来进行预测的函数:w为权重,b称为偏置项,可以理解为:w_0×1线性回归定义:线性回归通过一个或者多个自变量与因变量之间进行模型的回归分析。其中特点为一个或多个称为回归系数的模型参数的线性组合一元线性回...

2022-04-04 21:01:49 1400

原创 机器学习——决策树+随机森林

决策树随机森林

2022-03-28 16:58:08 2007

原创 水下图像——不平衡衰减相关文献阅读

目录不平衡衰减相关文献1、Underwater Single Image Color Restoration Using Haze-Lines and a New Quantitative Dataset[1]2、Underwater Image Enhancement by Wavelength Compensation and Dehazing[2]3、Wavelength-based Attributed Deep Neural Network for Underwater Ima

2022-03-26 18:33:06 3800

原创 机器学习——分类算法之K近邻+朴素贝叶斯,模型选择与调优

目录K-近邻算法定义如何求距离?数据预处理——标准化sklearn k-近邻算法API案例——预测入住位置分类问题数据处理k近邻算法相关问题k值取多大?有什么影响?优缺点应用场景案例——鸢尾花分类贝叶斯K-近邻算法定义如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。——计算欧式距离,根据离你最近的邻居判断你的类别如何求距离?两个样本的距离可以通过如下.

2022-03-25 17:14:43 420

原创 机器学习——sklearn数据集与估计器

目录数据集划分sklearn数据获取scikit-learn数据集API介绍获取数据集返回的类型sklearn分类数据集鸢尾花(iris)数据集手写数字数据集20年新闻数据集——大数据集sklearn回归数据集波士顿房价数据集糖尿病数据集sklearn数据集划分API转换器与预估器转换器估计器用于分类的估计器用于回归的估计器数据集划分机器学习一般的数据集会划分为两个部分:训练数据:用于训练,构建模型——75%——构建模型

2022-03-23 21:30:23 1899

原创 机器学习——算法分类以及开发流程

目录机器学习开发流程机器学习算法分类机器学习模型是什么算法是核心,数据和计算是基础 找准定位 算法工程师:复杂模型的算法设计 开发工程师:分析很多的数据,分析具体的业务,应用常见的算法,特征工程、调参数、优化我们应该怎么做 1、学会分析问题,使用机器学习算法的目的,想要算法完成何种任务 2、掌握算法基本思想,学会对问题用相应的算法解决 3、学会利用库或者框架解决问题机器学习算法的判别依据数据类型...

2022-03-23 11:26:11 1038

原创 机器学习——特征工程

机器学习概述什么是机器学习?机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测如:alpha狗,广告搜索为什么需要机器学习?解放生产力 数据集的结构数据的特征工程数据的类型机器学习算法基础...

2022-03-22 23:06:22 1057

原创 数据分析——matplotlib

数据分析的流程图matplotlib基本要点matplotlib: 最流行的Python底层绘图库,主要做数据可视化图表,名字取材于MATLAB,模仿MATLAB构建# coding:utf-8from matplotlib import pyplot as pltx = range(2,26,2)y = [15,13,14.5,17,20,25,26,26,27,22,18,15]# 绘图plt.plot(x,y)# 展示图形plt.show()设置图片大...

2022-03-22 00:39:16 293

原创 数据结构与算法——树与树算法

目录第六章树树的概念树的术语树的种类树的存储与表示常见的一些树的应用场景二叉树二叉树的基本概念二叉树的性质(特性)二叉树的节点表示以及树的创建二叉树的遍历广度优先遍历(层次遍历)深度优先遍历第六章树树的概念每个节点有零个或多个子节点; 没有父节点的节点称为根节点; 每一个非根节点有且只有一个父节点; 除了根节点外,每个子节点可以分为多个不相交的子树;树的术语节点的度:一个节点含有的子树的个数称为该节点的度; 树

2022-03-07 11:12:52 44

原创 数据结构与算法——排序与搜索

第五章排序算法的稳定性排序算法:把无序序列排列成有序序列的算法。冒泡排序选择排序插入排序快速排序希尔排序归并排序常见排序算法效率比较二分查找

2022-03-03 22:08:47 114

原创 数据结构与算法——栈与队列

目录第四章栈与队列栈的结构实现队列与双端队列的实现第四章栈与队列栈是经常使用的一种数据结构,是一种用来保存数据的容器,它的特点在于只能允许在容器的一端(称为栈顶端指标,英语:top)进行加入数据(英语:push)和输出数据(英语:pop)的运算。栈的特点:后进先出(LIFO, Last In First Out)队列(queue)是只允许在一端进行插入操作,而在另一端进行删除操作的线性表。队列的特点:先进先出(First In First Out)栈与线.

2022-02-12 01:03:09 205

原创 数据结构与算法——链表

目录第三章链表的提出单链表的ADT模型python中变量标识的本质单链表及节点的定义代码单链表的基本操作单链表与顺序表的对比双向链表添加元素双向链表删除元素第三章链表的提出线性表:顺序表+链表顺序表是按顺序排列的链表是用线串起来的(可以随意添加、删除元素)Li=[200,400,600]三个单链表节点如下: 数据区 链接区 0×11 200 0×34 数据区 链接区 0×34 400

2022-02-10 22:56:47 740

原创 数据结构与算法——顺序表

第二章基本顺序表与元素外围顺序表基本数据类型:整型,浮点型,字符串---基本数据类型怎么组织起来?内存是一个连续的存储空间,以一个字节作为存储单元(一个字节是8位)查找内存中的地址,就可以得到字节中的信息不同基本数据类型需要占据多少个存储单元?---对于32位机器,一个基本整型占四个字节int a =1 #整型00000000 00000000 00000000 00000001# 也可以代表4个char,所以在初始要定义数据类型字符串已经是一个集合,一个char占一个字节

2022-02-04 22:55:25 452

原创 数据结构与算法——时间复杂度

算法是独立存在的一种解决问题的方法和思想1,如果 a+b+c=1000,且a^2+b^2=c^2(a,b,c为自然数),如何求出所有a、b、c可能的组合?枚举法(一个一个去试)a=0,b=0,c=0------不满足a+b+c=1000试a=0,b=0,c=4------不满足a+b+c=1000试a=0,b=1,c=0~1000算法的特征:输入可以有可以没有,输出至少有一个,有穷性:算法在有限的步骤可接受的时间范围内可以自动结束,确定性:实现的每一个步骤都有确定含义,可行性:算

2022-01-31 01:00:41 262

原创 高数基础——步长

1,什么是步长?在确定了搜索方向的情况下,讨论搜索步长,希望对下述函数求最小值直接求解上述函数的最小值的方法叫做精确线搜索(公式解),然而这需要耗费大量的计算,所以我们一般采用非精确线搜索(可能不是最小值,但差不多)inexact line search(1)函数应当有充分的下降(2)步长不宜太小【1】STEPS MIGHT BE TOO LONG --- 步长太大,会出现震荡现象【2】STEPS MIGHT BE TOO SHORT --- 步长太小会走不出去,提前收敛(.

2022-01-27 21:31:57 3016 2

原创 高数基础——线搜索

1,无约束优化问题(unconstrained optimization)无优化约束问题:即找函数在上的最小化的最优解,问题(1)如果且,则为全局最优点---最小值点(2)如果存在的一个邻域,使得且,则称为局部最优点---极小值点Theorem.1:局部极小值点,一阶导为0Theorem.2:,海瑟矩阵半正定(positive semidefinite)Theorem.3:(二阶充分条件)若,is positive definite,则是局部极小值点---判断最优解的法则T.

2022-01-23 00:23:11 1051 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除