自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 资源 (1)
  • 收藏
  • 关注

原创 ABSA系列-Open Aspect Target Sentiment Classification with Natural Language Prompts

这是一篇发表在的论文。该篇文章利用自然语言提示(Prompt),将方面目标情感分类(Aspect Target Sentiment Classification)任务定义为自然语言推断(NLI)和完形填空任务,从而更好地发挥预训练模型的性能,在零样本(Zero-shot)、少样本(Few-shot)和全样本的场景下都表现出了良好的性能,同时体现出良好的鲁棒性。

2022-11-06 10:50:33 431 1

原创 【机器视觉中的数学问题—协方差矩阵】

机器视觉中的数学问题—协方差矩阵文章目录机器视觉中的数学问题---协方差矩阵前言一、统计学的基本概念二、为什么需要协方差三、协方差矩阵前言看视觉领域的论文总能看到协方差矩阵这个东西,虽然网上有很多关于他得公式,但还是不太明白它的意义,这里将介绍它的来龙去脉,说清楚它到底是干啥的,为啥总是出现。一、统计学的基本概念学过概率统计的我们都知道,统计里最基本的概念就是样本的均值,方差,标准差。给定一个包含n个样本的集合,依次给出这些概念的公式描述:均值: Xˉ=∑i=1nXi\bar{X}=\sum

2022-04-15 16:14:56 907

原创 深度学习图像去噪综述

深度学习图像去噪综述1 背景与动机2 深度学习在图像去噪中的应用2.1外加白噪声去噪(additive white noisy-image denoising)2.1.1CNN/NN for AWNI denoising2.1.2 CNN/NN and common feature extraction methods for AWNI denoising2.1.3 Combination of the optimization method and CNN/NN for AWNI denoising原文

2020-09-23 11:07:05 10252

原创 NLP系列——(10)BERT

BERT一、Transformer1.1 Encoder-Decoder框架1.2 Transformer模型架构二、BERT2.1 BERT 原理2.2 BERT模型总体结构2.3 BERT模型输入2.4 BERT模型预训练任务2.4.1 Masked LM2.4.2 Next Sentence Prediction2.5 模型比较三、BERT实现文本分类Bert之所以取得这么惊才绝艳的效果,...

2019-05-30 20:58:17 786 2

原创 NLP系列——(9)Attention

Attention一、基本的Attention原理1.1 什么是Attention?1.2 为什么要加入Attention1.3 Attention的原理二、HAN(Hierarchical Attention Networks)的原理三、Attention实现文本分类一、基本的Attention原理1.1 什么是Attention?Attention模型的基本表述可以这样理解成(个人理解...

2019-05-28 10:59:14 498

转载 NLP系列——(8)循环和递归神经网络

循环和递归神经网络RNN的结构。循环神经网络的提出背景、优缺点。着重学习RNN的反向传播、RNN出现的问题(梯度问题、长期依赖问题)、BPTT算法。双向RNN递归神经网络LSTM、GRU的结构、提出背景、优缺点。针对梯度消失(LSTM等其他门控RNN)、梯度爆炸(梯度截断)的解决方案。Memory Network(自选)Text-RNN的原理。利用Text-RNN模型来进行文本分...

2019-05-26 16:02:04 272

原创 NLP系列——(7)卷积神经网络

卷积神经网络+Text-Text一、卷积神经网络1.1 卷积1.1.1 一维卷积1.1.2 二维卷积1.1.3 卷积网络—动机1.1.4 一维卷积运算和二维卷积运算1.2 池化层二、Text-CNN一、卷积神经网络1.1 卷积卷积(Convolution),其实是一种数学运算,在信号处理或图像处理中,经常使用一维卷积或二维卷积。1.1.1 一维卷积一维卷积经常用在信号处理中,用于计算信号...

2019-05-24 20:57:46 2122

转载 NLP模型——TextCNN

TextCNN参考 Text-CNN 文本分类

2019-05-24 20:56:05 290

原创 NLP系列——(6)神经网络+FastText

神经网络+FastText一、神经网络基础1.1 前馈神经网络1.1.1 神经元模型1.1.2 前馈神经网络1.1.3 网络层数1.1.4 输入层1.1.5 输出层1.1.6 隐藏层1.1.7 隐藏单元1.1.8 激活函数1.1.9 前馈神经网络与反向传播算法(推导过程)1.2 感知机1.2.1 感知机的原理1.2.2 点到线的距离1.2.3 样本到超平面的距离1.2.4 超平面1.2.5 感知机...

2019-05-22 20:52:14 1454

原创 NLP模型——FastText

FastText一、预备知识1.1 Softmax 回归1.2 分层Softmax1.3 n-gram特征二、word2vec三、FastText 原理四、FastText 实战fastText是Facebook于2016年开源的一个词向量计算和文本分类工具,在学术上并没有太大创新。但是它的优点也非常明显,在文本分类任务中,fastText(浅层网络)往往能取得和深度网络相媲美的精度,却在训练时...

2019-05-22 20:47:42 1046

原创 NLP系列——(5)朴素贝叶斯+SVM+LDA

文本表示一、朴素贝叶斯1.1 朴素贝叶斯理论1.高斯模型2.多项式模型3.伯努利模型1.2 朴素贝叶斯实战——文本分类二、SVM模型2.1 SVM原理2.2 SVM实战——文本分类三、LDA主题模型3.1 PLSA、共轭先验分布3.1.1 PLSA(基于概率统计的隐性语义分析)3.1.1 共轭先验分布3.2 LDA3.2.1 LDA介绍3.2.2 LDA生成过程3.2.3 LDA整体流程3.3 使...

2019-05-20 11:38:55 1516

原创 NLP系列——(4)文本表示

文本表示1、文本表示2、 文本表示的方法2.1 one-hot表示2.2 word2vec2.2.1 CBOW2.2.2 Skip-Gram1、文本表示文本表示的意思是把字词处理成向量或矩阵,以便计算机能进行处理。文本表示是自然语言处理的开始环节。文本表示按照细粒度划分,一般可分为字级别、词语级别和句子级别的文本表示。文本表示分为离散表示和分布式表示。离散表示的代表就是词袋模型,one-h...

2019-05-18 10:22:56 6412

原创 NLP系列——(3)特征选择

文章目录一、TF-IDF1.1 背景1.2 TF-IDF概述1.3 TF-TIDF的实现1.3.1 用gensim库来计算tfidf值1.3.2 用sklearn库来计算tfidf值1.3.3 用python手动实现tiidf的计算二、互信息2.1 点互信息PMI2.2 互信息MI2.3 对特征矩阵使用互信息进行特征筛选任务描述:Task3 特征选择TF-IDF原理以及利用其进行特征筛选互信...

2019-05-15 10:45:19 2500

原创 NLP系列——(2)特征提取

文章目录一、中英文文本分析1.1 中文文本特点1.2 英文文本特点二、文本数据的基本特征提取2.1 词汇数量2.2 字符数量2.3 平均词汇长度2.4 停用词数量2.5 特殊字符数量2.6 数字数量2.7 大写字母数量三、文本数据的预处理3.1 小写转换3.2 去除标点符号3.3 去除停用词3.4 常见词去除3.5 稀缺词去除3.6 拼写校正3.7 分词(tokenization)分词算法设计的基...

2019-05-13 21:12:33 6908

原创 NLP系列——(1)数据探索-汇总

将几个任务分开整理的,在此做个汇总NLP系列——(1)数据探索-IMDBNLP系列——(1)数据探索-THUCNewsNLP系列——(1)数据探索-召回率、准确率、ROC曲线、AUC、PR曲线等概念...

2019-05-12 16:23:46 266

原创 NLP系列——(1)数据探索-召回率、准确率、ROC曲线、AUC、PR曲线等概念

数据集探索——机器学习之类别不平衡问题1 各种评估指标评估指标 Evaluation metrics 可以说明模型的性能,辨别模型的结果。我们建立一个模型后,计算指标,从指标获取反馈,再继续改进模型,直到达到理想的准确度。在预测之前检查模型的准确度至关重要,而不应该建立一个模型后,就直接将模型应用到看不见的数据上。接下来介绍几种回归和分类常用的评估方法。1.1、回归回归问题的标记 y...

2019-05-12 16:20:53 1576

原创 NLP系列——(1)数据探索-THUCNews

数据集探索一、数据集数据集:中、英文数据集各一份1、中文数据集:THUCNewsTHUCNews数据子集:https://pan.baidu.com/s/1hugrfRu 密码:qfud2、英文数据集:IMDB数据集IMDB Sentiment Analysis二、数据探索1、THUCNews数据集的探索这里参考 CNN字符级中文文本分类-基于TensorFlow实现 - 一蓑烟...

2019-05-12 10:55:08 709

原创 NLP系列——(1)数据探索-IMDB

数据集探索一、数据集数据集:中、英文数据集各一份1、中文数据集:THUCNewsTHUCNews数据子集:https://pan.baidu.com/s/1hugrfRu 密码:qfud2、英文数据集:IMDB数据集IMDB Sentiment Analysis二、数据探索1、IMDB数据集的探索这里参考TensorFlow官方教程:影评文本分类 | TensorFlow 和...

2019-05-11 18:05:37 994

转载 初学Attention机制

参考博客https://blog.csdn.net/tg229dvt5i93mxaq5a6u/article/details/78422216

2019-03-04 09:52:42 178

原创 RTX2080Ti-深度学习环境配置

最近新购置了一台服务器,被环境折腾了半天,在这里纪念一下安装的心酸历程。环境配置:ubuntu18.04,cuda10.0,cudnn7.3.1,tensorflow-gpu1.12.01.下载显卡驱动、cuda、cudnncuda10、cudnn、nvidia2. 安装显卡驱动2.1禁止系统默认的显卡驱动打开系统黑名单sudo gedit /etc/modprobe.d/black...

2018-12-24 21:44:14 6717 3

转载 机器学习(3)——贝叶斯算法

文章目录一、简介二、定义三、推导一、简介贝叶斯定理是18世纪英国数学家托马斯·贝叶斯(Thomas Bayes)提出得重要概率论理论。以下摘一段 wikipedia 上的简介:所谓的贝叶斯定理源于他生前为解决一个“逆概”问题写的一篇文章,而这篇文章是在他死后才由他的一位朋友发表出来的。在贝叶斯写这篇文章之前,人们已经能够计算“正向概率”,如“假设袋子里面有 N 个白球,M 个黑球,你伸手进...

2018-10-18 16:58:11 242

原创 机器学习(2)——决策树与随机森林

文章目录一. 决策树1.1决策树概述1.2决策树-熵1.3 决策树-基本想法1.4 决策树-剪枝二.随机森林2.1概念2.1.1 Bootstraping一. 决策树1.1决策树概述决策树既能做分类,又能做回归。输入数据后,根据构建的树,逐步向下决策,最后得到结果。决策树算法以树状结构表示数据分类的结果,每个决策点 实现一个具有离散输出的测试函数,记为分支。决策树由以下几部分组成:...

2018-10-04 18:40:39 801

原创 如何将自己写的代码上传到github上

如何将自己写的代码上传到github上忙活了好久,终于是把代码传上去了,在这里记录一下我的历程。步骤1. 注册github账号要想上传,你必须得有自己的github账号哦,网址附上,自己注册去吧 https://github.com/2. 建仓库登录上你的github之后,点击 + 号,选择 New repository接下来得到如下页面,填写仓库名,自己随便写一个名字,下面的描述...

2018-10-02 20:09:29 6300 2

原创 机器学习(1)——回归算法

一、导入1.1有监督问题和无监督问题首先说一下有监督问题和无监督问题,所谓有监督问题呢 就是在模型训练过程中有标签数据,反之,无监督学习是没有标签数据的。1.2回归和分类什么是回归呢?通俗来说,最终的预测结果是一个数,就是回归;预测结果是一个类别,那就是分类。二、线性回归2.1 线性回归的定义接下来。。。。转载转载。。。。线性回归需要一个线性模型,属于监督学习,因此方法和监督学...

2018-10-01 20:57:03 649

原创 TensorFlow弹药库——基础知识

TensorFlow弹药库——基础知识一. 废话篇再发了一篇关于cifar-10数据集的读取之后,本来想着接下来将各类神经网络(包含最简单的三层结构、cnn、lenet、resnet、googlenet等)在该数据实现,进行训练与测试。突然发现,先介绍一下,tensorflow最基础的知识应该会更好,在此就请继续看我墨迹废话吧。 哈哈哈。。。学习很严肃,自娱自乐一下。(睿思说:...

2018-06-09 20:59:08 546 1

原创 TensorFlow弹药库——cifar-10(1)

作为图像分类处理的经典数据集,在刚入门TensorFlow后,难免就想在cifar-10上展现一下自己。在此就想分享一下,自己在该数据集上遇到的问题。首先,简单的介绍一下这个数据集。一. CIFAR-10① CIFAR-10数据集包含60000个32*32的彩色图像,共有10类。有50000个训练图像和10000个测试图像。 数据集分为5个训练块和1个测试块,每个块有10000个图像。测试块包含从...

2018-05-09 20:53:08 358 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除