自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(58)
  • 收藏
  • 关注

原创 CentOS7 安装openssl11

CentOS 7 安装Openssl11的方法

2022-12-19 18:53:52 3968 1

原创 XPath的死角

本文介绍了一个XPath无法准确定位文本节点的问题,并简单说明了LXML的解决方案。

2022-07-16 15:42:28 359

原创 Linux统计文件夹下文件数量

统计当前文件夹下文件数量,包含子文件夹。

2022-05-22 16:07:24 2992

原创 Python学习笔记——argparse中的action=store_true用法

Python的命令行参数解析模块学习。

2022-05-22 15:31:28 3371

原创 pytorch笔记——torch.randperm用法

randperm用法。

2022-05-18 20:27:43 2011

原创 Linux Shell脚本获取进程ID并写入PID文件

在Linux中部署软件时,经常要写启动和停止程序的Shell脚本,一种比较好的方式是在启动软件进程后,将进程ID写入文件,在停止的时候,直接读取并kill PID即可。

2022-05-17 21:53:22 3051

原创 Dropout学习笔记

针对《动手学深度学习v2》视频中李沐老师关于Dropout的问答内容进行了整理。

2022-05-04 21:22:56 4640

原创 折腾MNIST系列——增加LayerNorm减少训练时间

本文在官方MNIST代码基础上,增加LayerNorm层,从实验结果看, LayerNorm的确如原论文所说,加快了模型收敛速度。

2022-04-16 19:38:37 634

原创 理解网络权重初始化(Pytorch)

利用线性代数和概率基础知识理解神经网络权重初始化方法。

2022-04-07 20:29:57 1926

原创 Pytorch学习笔记——fan_in和fan_out

在进行网络参数初始化时,要传入fan_in和fan_out,本文主要讨论它们的含义,以及如何计算。

2022-04-05 22:27:07 4598

原创 Pytorch学习笔记——kaiming_uniform初始化

Pytorch初始化方法之kaiming均匀初始化学习笔记。

2022-04-02 21:44:16 7369 5

原创 Pytorch学习笔记——Linear模型源码学习

线性模型是最基本的模型,但包含了很多知识点,本文通过阅读pytorch的源码学习Linear层的构造和实现。

2022-03-30 22:56:03 954

原创 参数初始化策略——截断的正态分布采样(Pytorch)

本文主要记录pytorch内置的采样截断的正态分布的使用方法。

2022-03-29 22:24:12 3229 2

原创 Torchvision中datasets.MNIST设计方法分析

本文分析了torchvision中MNIST数据集的设计思路,学习如何设计自己的数据集模块。

2022-03-27 15:41:15 3665

原创 WebVTT中的文本轨道(Text Tracks,TT)到底是什么鬼?

WebVTT,全称是The Web Video Text Tracks Format,意思是网络视频文本轨道格式。那么到底什么是文本轨道(Text Tracks)呢?这篇文章希望一探究竟。

2022-03-25 22:07:20 1264

原创 使用pandas对超大csv文件进行快速拆分

本文介绍如何利用pandas对超大CSV文件进行快速拆分。

2022-03-23 19:40:41 6977

原创 如何在CentOS 8上安装FFmpeg

本文记录了在CentOS 8上使用DNF/YUM安装FFmpeg的操作过程。

2022-03-22 21:51:42 2909

原创 ModuleNotFoundError: No module named ‘lzma‘解决方案

ModuleNotFoundError: No module named ‘lzma’的解决方案,在CentOS 7上测试通过的。

2022-03-20 23:59:38 11292

翻译 Pytorch学习笔记——Contiguous vs non-contiguous tensor

pytorch中contigious张量和非contigious张量会对某些操作带来影响,涉及到张量如何在内存中存储的知识,值得了解一下。

2022-03-19 17:21:47 403

原创 腾讯开源超分辨率算法(Real-SR )踩坑记录——vkCreateInstance failed -9错误

腾讯开源的超分辨率Real-SR算法,在安装测试的过程中,遇到了不少问题,找到了一条可以走通的路,不一定是最好的解决方案。

2022-03-18 22:17:20 3119

翻译 Pytorch学习笔记——reshape和view的区别

在使用pytorch或者读别人的代码时,reshape和view是最常用的,都是矩阵变形,二者到底有什么区别呢?

2022-03-17 20:37:17 919

原创 网页正文抽取(三)——boilerpipe算法

Boilerpipe是一个非常优秀的网页正文抽取库,在抽取新闻和博客正文时,准确率非常高,基本开箱即用,著名的信息抽取工具Tika也使用了Boilerpipe作为网页内容自动提取的第三方库。

2022-03-16 20:06:17 1520

翻译 为什么LogSoftmax比Softmax更好?

翻译了pytorch论坛中关于Softmax和LogSoftmax性能差异的讨论帖子,原作者提供了很好的洞见,值得一读。

2022-03-15 10:32:56 3180

原创 使用MNIST测试Swish激活函数的提升效果

利用Pytorch官方的MNIST例子测试swish激活函数相对于ReLU的提升效果。

2022-03-14 19:58:42 2352

原创 使用pytorch动手实现完整的GLU层

动手实现完整的GLU层。

2022-03-13 23:22:06 3977 4

原创 激活函数Swish和Hardswish简介

Swish激活函数和Hardswish激活函数学习笔记。

2022-03-12 13:52:53 17911 3

原创 GLU(Gated Linear Unit,门控线性单元)简介

简单介绍门控线性单元的结构。

2022-03-11 20:07:54 17499 5

原创 逐句解析点积注意力pytorch源码(配图解)

结合pytorch源码和原始论文学习Scaled Dot-Product Attention的原理。

2022-03-10 13:40:03 3562 1

原创 torch.unsqueeze官方文档解读

本文是对torch.unsqueeze官方文档的解读,加入部分代码示例,方便理解。

2022-03-09 22:53:35 666

原创 MultiHeadAttension源码解析——batch_first参数含义

简单介绍多头注意力源码中batch_first参数的含义和相关概念。

2022-03-08 22:07:34 2622

原创 MarkupLM源码解析之Xpath Embedding

本文解析MarkupLM的Xpath嵌入生成原理。

2022-03-07 22:41:11 580

原创 SQuAD数据集简介

SQuAD(Stanford Question Answering Dataset)是一个阅读理解数据集。

2022-03-06 18:33:26 10719 2

原创 MarkupLM源码解析之数据准备(四)

本文解析get_value_xpaths方法。这个方法从DOM树中获取包含真值(标注数据)的Xpath列表。

2022-03-05 21:37:14 1034

原创 MarkupLM源码解析之数据准备(三)

本文解析get_field_xpaths源码,这个方法会把每个网页中抽取的值对应的xpath表达式构造出来。

2022-03-04 20:32:53 243

原创 MarkupLM源码解析之数据准备(二)

这篇文章主要分析负责加载SWDE数据集中的html文件和标注数据的方法。

2022-03-03 19:47:40 252

原创 MarkupLM源码解析之数据准备(一)

MarkupLM网页数据预处理源码解析。

2022-03-02 22:46:11 463

原创 如何用Python自动获取HTML元素的Xpath路径

简单介绍了如何利用python自动获取HTML元素的Xpath路径表达式。

2022-03-01 22:00:27 2421 12

原创 lxml.html.clean.Cleaner之page_structure参数的作用

在使用lxml.html.clean.Cleaner时,通常看到的代码片段都会将cleaner.page_structure设置为False,为什么呢?

2022-02-28 22:07:11 402

翻译 (翻译)Google开源的Abseil简介

Google开源了内部广泛使用的软件,absl的python版本,在很多Google开源的项目中都能看到它的影子。

2022-02-27 23:02:16 721

原创 Python:multiprocessing示例代码在Windows环境无法运行的解决方案

记录在Windows环境下使用multiprocessing模块遇到的问题。

2022-02-26 21:01:08 3296

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除