自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(39)
  • 收藏
  • 关注

原创 【数据结构】树的遍历

深度优先遍历(前序遍历): F, B, A, D, C, E, G, I, H.深度优先遍历(中序遍历): A, B, C, D, E, F, G, H, I.广度优先遍历 - 层次遍历:F, B, G, A, D, I, C, E, H.深度优先搜索(后序遍历):A, C, E, D, B, H, I, G, F.

2024-01-02 16:06:35 558

原创 【LLM】Qwen学习

【代码】【无标题】

2023-12-25 22:11:55 1113

原创 【归一化】RMSNorm

【代码】RMSNorm。

2023-12-21 11:04:46 1220

原创 什么是FairScale

什么是FairScale。

2023-12-21 11:01:31 368

原创 激活函数-SwiGLU

fxx∗σxfxx∗σxσx11e−xσx1e−x1​正数区域内,SiLU 函数的输出与 ReLU 函数的输出相同。在负数区域内,SiLU 函数的输出与 sigmoid 函数的输出相同。SiLU 函数在整个定义域内都是可微的,这使得在反向传播过程中的梯度计算更加稳定。SiLU函数不是单调递增的,而是在x≈−1.28时达到全局最小值−0.28,这可以起到一个隐式正则化的作用,抑制过大的权重。

2023-12-18 14:11:51 4148 2

原创 shutil.copy、shutil.copyfile、shutil.copy2的区别

shutil.copy、shutil.copyfile、shutil.copy2的区别

2022-09-05 14:56:54 6123 1

原创 AWS S3 SDK boto3使用说明(持续更新)

AWS S3 SDK boto3使用说明(持续更新)

2022-08-01 14:45:30 705

原创 卷积核的kernel size为什么要设置为奇数

kernel size设置奇数的原因

2022-06-16 11:31:23 2052

原创 brat的使用说明

1. 登录1)鼠标触碰导航栏,如下图:2)会出现选项栏,点击『login』如下图:3)会弹出登录窗口,填写账号密码,点击『OK』4)登录成功会显示对应的账号2.选项栏的说明3.切换文件夹1)点击『Collection』 ,会弹出当前文件夹下的文件列表2)通过点击『..』会到上一级目录3)文件夹文件列表说明4.标注1)划选,并打上标签2)双击进行修改或删除5.搜索5.1 根据文本检索...

2022-03-25 14:51:01 1696

原创 docker容器里面安装vim

>>> vim 1.txtbash: vim: command not found>>> apt-get install vimReading package lists... DoneBuilding dependency treeReading state information... DoneE: Unable to locate package vim # 不能定位vim软件包>>> apt-get update...

2022-01-10 10:06:44 594

原创 torch与torchvision的版本选择与对应

历史版本最新版本linux pip安装(其他参考官网, 见上)# ROCM 4.2 (Linux only)pip install torch==1.9.0+rocm4.2 torchvision==0.10.0+rocm4.2 torchaudio==0.9.0 -f https://download.pytorch.org/whl/torch_stable.html# ROCM 4.1 (Linux only)pip install torch==1.9.0+rocm4.1 tor

2021-12-21 10:31:59 4520

原创 BERT cased和uncased的区别

cased:支持大小写uncased:仅支持小写(词表中只有小写,数据处理时需要进行lower处理)

2021-12-20 15:03:24 1934

原创 IMDB 电影评论情感分类数据集

官网 下载地址(1)keras数据集来自 IMDB 的 25,000 条电影评论,以情绪(正面/负面)标记。评论已经过预处理,并编码为词索引(整数)的序列表示。为了方便起见,将词按数据集中出现的频率进行索引,例如整数 3 编码数据中第三个最频繁的词。这允许快速筛选操作,例如:「只考虑前 10,000 个最常用的词,但排除前 20 个最常见的词」。(引用keras中文文档)作为惯例,0 不代表特定的单词,而是被用于编码任何未知单词。from keras.datasets import imd

2021-12-20 14:59:00 2893

原创 Label Studio的安装和使用

官方地址:https://labelstud.io/git地址:https://github.com/heartexlabs/label-studio.git1.docker方式1)启动最新的容器版本docker run --rm -p 8080:8080 -v `pwd`/my_project:/label-studio/my_project --name label-studio heartexlabs/label-studio:latest label-studio start m

2021-07-19 20:01:43 3660

原创 torch.pow

torch.pow(input, exponent, *, out=None) → Tensor计算两个张量或者一个张量与一个标量的指数计算结果,返回一个张量。input和exponent都可以是张量或者标量,1)若input和exponent都为张量,则必须维度一致;2)若input和exponent其中一个为标量,一个为张量,标量以广播的形式进行计算例子:>>> a = torch.randn(4)>>> atensor([ 0.

2021-07-06 21:30:57 9872

原创 torch.arange

torch.arange(start=0, end, step=1, *, out=None, dtype=None, layout=torch.strided, device=None, requires_grad=False) → Tensor返回一个一维向量,其大小为,取值区间为[start,end),从start开始,以step为步长增加,直到end结束(不包括end)例子:>>> torch.arange(5)tensor([ 0, 1, 2...

2021-07-06 21:14:52 5291

原创 torch.utils.data.DataLoader

DataLoader(dataset, batch_size=1, shuffle=False, sampler=None, batch_sampler=None, num_workers=0, collate_fn=None, pin_memory=False, drop_last=False, timeout=0, worker_init_fn=None, *, prefetch_factor=2, persi...

2021-07-06 17:35:40 157

原创 xavier_normal_和xavier_normal的区别

新旧名字的差别:新的-xavier_normal_ 旧的-xavier_normalfrom torch.nn.init import xavier_normal_, xavier_normaltorch/nn/init.pyxavier_normal = _make_deprecate(xavier_normal_)_make_deprecate:对于使用 old_name 的情况给出 warnings :建议使用后面加下划线的方法,将old_name 函数重定向到 new.

2021-07-06 10:11:41 2958

原创 torch.nn.init

https://pytorch-cn.readthedocs.io/zh/latest/package_references/torch-nn/#torchnn

2021-07-05 23:19:57 180

翻译 Torch.empty

torch.empty(*size, *, out=None, dtype=None, layout=torch.strided, device=None, requires_grad=False, pin_memory=False, memory_format=torch.contiguous_format) → Tensor返回:一个填满未初始化数据的张量(张量的形状是由变量参数size定义的)参数:size (int...) - 整数序列,其定义了输出张量的形状;可以是一个可..

2021-07-05 23:14:16 2458

原创 【NLP任务】CoNLL-2003独立于语言的命名实体识别(II)

pass

2021-06-20 20:03:55 1362

原创 【NLP公开数据集】 CoNLL-2003数据集

CoNLL-2003命名的实体数据由八个文件组成,涵盖两种语言:英语和德语。每种语言都包含:训练集、开发集、测试集、无标签数据;其中wu'biao

2021-06-18 17:38:36 10822

原创 pipenv

1.安装pip3 install pipenv2.创建虚拟环境1 mkdir project2 cd project3 pipenv install

2021-06-17 16:46:42 120

原创 Batch Normalization、Instance Normalization和Layer Normalization

Normalization引入:虽然不是所有模型都需要以“独立同分布”为基础,但它可以简化常规机器学习模型的训练、提升机器学习模型的预测能力;白化(数据预处理)(1)去除特征之间的相关性 —> 独立;(2)使得所有特征具有相同的均值和方差 —> 同分布。Internal Covariate Shift是指源空间和目标空间的条件概率是一致的,但是其边缘概率不同;对于神经网络...

2021-03-28 22:52:27 411

原创 常用激活函数

激活函数的目的:增加神经网络的非线性(只有线性的情况下网络的表达能力有限)激活函数sigmoidrelutanhELU输出区间(0,1)(0,∞\infty∞)(-1,1)(-1,∞\infty∞)导数区间(0,14\frac{1}{4}41​)0,1[0,1)(0,1]优点平滑;易求导;计算量小;缓解梯度弥散和梯度爆炸问题;避免过拟合原点对称能够缓解梯度弥散,稀疏性使得对输入变化或噪声更鲁棒缺点计算量大;存在梯度消失问题没有完全解决

2021-03-28 16:42:18 106

原创 【NLP公开数据集】NCBI疾病数据集

NCBI疾病数据集是一个在提及和概念层面进行全面标注的数据集。数据包含:793篇摘要2783个句子6892个疾病mention790个唯一疾病概念– 医学主题词【Medical Subject Headings (MeSH®)】– 人类孟德尔遗传学【Online Mendelian Inheritance in Man (OMIM®)】mention表中的91%都由一个疾病概念一一对应,分成训练集、验证集和测试集数据标注:14个标注人员每个文档都有2个标注人员(随机分配)3个标

2021-03-28 13:02:53 2214

原创 【NLP公开数据集】OntoNotes Release 5.0数据集介绍

OntoNotes 5.0是OntoNotes项目的最后一个版本,是BBN Technologies、科罗拉多大学、宾夕法尼亚大学和南加州大学信息科学研究所之间的合作项目。该项目的目标是对一个大型语料库进行注释,该语料库由三种语言(英语、汉语和阿拉伯语)的各种类型的文本(新闻、电话对话、网络日志、usenet新闻组、广播、脱口秀)组成,包含结构信息(语法和谓词论证结构)和浅层语义(与本体和核心参考相关联的词义)。数据具体情况如下: Arabic English Chinese.

2020-11-12 12:06:18 8247 2

原创 常用的TensorFlow高级API

常用的TensorFlow高级APIAPI描述(作用)tf.python_io.TFRecordWriter创建一个TFRecordWriter对象,这个对象就负责写记录到指定的文件中tf.train.Example创建一个TFRecordWriter对象,这个对象就负责写记录到指定的文件中tf.train.FeaturesFeatures对象tf.t...

2020-03-18 17:19:56 167

原创 【NLP公开数据集】FUNSD dataset 数据集介绍

数据集介绍一个可用于FUNSD(噪声很多的扫描文档)上进行表单理解的数据集。这里的表单理解是指对表单中的文本内容进行抽取,并生成结构化数据。数据集包含199个真实的、完全注释的、扫描的表单。文档有很多噪声,而且各种表单的外观差异很大,因此理解表单是一项很有挑战性的任务。该数据集可用于各种任务,包括文本检测、光学字符识别、空间布局分析和实体标记/链接。第一个具有完整注释的公共数据集,可用...

2020-03-11 20:05:21 4689 6

原创 【leetcode】994. 腐烂的橘子

在给定的网格中,每个单元格可以有以下三个值之一:值 0 代表空单元格;值 1 代表新鲜橘子;值 2 代表腐烂的橘子。每分钟,任何与腐烂的橘子(在 4 个正方向上)相邻的新鲜橘子都会腐烂。返回直到单元格中没有新鲜橘子为止所必须经过的最小分钟数。如果不可能,返回 -1。示例 1:输入:[[2,1,1],[1,1,0],[0,1,1]]输出:4示例 2:输入:[[2,1,1],[0...

2020-03-11 19:42:07 136

原创 【leetcode】543. 二叉树的直径

给定一棵二叉树,你需要计算它的直径长度。一棵二叉树的直径长度是任意两个结点路径长度中的最大值。这条路径可能穿过根结点。示例 :给定二叉树 1 / \ 2 3 / \ 4 5 返回 3, 它的长度是路径 [4,2,1,3] 或者 [5,2,1,3]。注意:两结点之间的路径长度是以它们之间边的数目表示。解题思路基本跟官方思路一...

2020-03-10 20:57:07 139

原创 【leetcode】53. 最大子序和

53. 最大子序和(题目源地址)给定一个整数数组 nums ,找到一个具有最大和的连续子数组(子数组最少包含一个元素),返回其最大和。示例:输入: [-2,1,-3,4,-1,2,1,-5,4],输出: 6解释: 连续子数组 [4,-1,2,1] 的和最大,为 6。方法一:...

2020-03-09 23:47:09 118

原创 docker 的常用命令

查看镜像(images) sudo docker images sudo docker images | grep 要搜索的关键字 ex:sudo docker images | grep pytorch用image新建容器 sudo docker load < 要使用的镜像包 ex:sudo docker load < iamge.tar搜索docker容...

2019-09-07 12:19:05 200

原创 TensorFlow学习之placeholder

TensorFlow学习之placeholder源码def placeholder(dtype, shape=None, name=None):“”"Inserts a placeholder for a tensor that will be always fed.为将总是要被喂入的张量插入一个占位符Important: This tensor will produce an erro...

2019-03-19 13:31:58 3615 5

原创 统计学习方法之基础整理(一)

统计学习方法之基础整理(一)正则化L1范式和L2范式L1范式L2范式L1范式与L2范式区别:交叉验证ROC曲线和AUC值ROCAUC生成模型与判别模型生成模型判别模型正则化正则化是模型选择的典型方法,是结构风险最小化策略的实现。作用是选择经验风险与模型复杂度同时较小的模型。正则化项可以取不同的形式,如L1范数、L2范数。L1范式和L2范式L1范式概念:参数向量中各个元素绝对值之和。...

2019-03-18 19:57:54 241

原创 【python】logging模块常用功能

logging 日志模块常用功能用于输出运行日志,可以设置输出日志的等级、日志保存路径、日志文件回滚等配置logging.basicConfig(level = logging.DEBUG,format = '%(asctime)s - %(name)s - %(levelname)s - %(message)s')args:level:设置日志级别,默认为logging.WARN...

2019-03-17 22:06:23 238

翻译 【论文学习】Bidirectional LSTM-CRF Models for Sequence Tagging(论文翻译)

Bidirectional LSTM-CRF Models for Sequence Tagging(论文翻译)AbstractIn this paper, we propose a variety of Long Short-Term Memory (LSTM) based models for sequence tagging. These models include LSTM netw...

2019-03-12 10:19:48 5672

原创 【LeetCode746】使用最小花费爬楼梯python实现

题目描述数组的每个索引做为一个阶梯,第 i个阶梯对应着一个非负数的体力花费值 costi。每当你爬上一个阶梯你都要花费对应的体力花费值,然后你可以选择继续爬一个阶梯或者爬两个阶梯。您需要找到达到楼层顶部的最低花费。在开始时,你可以选择从索引为 0 或 1 的元素作为初始阶梯。示例 1:输入: cost = [10, 15, 20]输出: 15解释: 最低花费是从cost[1]开始,然...

2019-03-11 14:32:02 272

转载 PyCharm中Directory与Python package的区别

对于Python而言,有一点是要认识明确的,python作为一个相对而言轻量级的,易用的脚本语言(当然其功能并不仅限于此,在此只是讨论该特点),随着程序的增长,可能想要把它分成几个文件,以便逻辑更加清晰,更好维护,亦或想要在几个程序中均使用某个函数,而不必将其复制粘贴到所有程序中。为了支持这一点,Python有一种方法将定义函数放在一个文件中,并在脚本中使用它们,这样的文件叫做模块,一个模块中的定...

2018-05-23 09:33:05 990

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除