自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 Transformer源码解读

本文将从模型原理及代码实现上讲解Transformer模型,并着重介绍代码实现。需要注意的是,由于 Transformer 源代码使用 TensorFlow 搭建,此处选择了哈佛大学 harvardnlp 团队基于 Pytorch 框架开发的 Annotated Transformer代码进行讲解,以帮助大家了解 Transformer 的实现细节。本文为 DataWhale 开源教程 thorough-pytorch 的一部分。

2023-02-11 22:20:32 1025 2

原创 Leetcode 刷题记录——数组篇

另一个难点在于较复杂规律的模拟,需要重视边界情况,全面细致,更多的是需要耐心的体力活,例如螺旋矩阵一题,找到规律并不困难,但要耐心的模拟其实是一个问题,尤其是如果笔面试碰到这类题目,在时间有限的情况下能否清晰地解出,是一个挑战。如果发现自己看了题解也无法实现代码,就认真阅读题解的代码,并理解代码的逻辑。② 重复刷题:遇见不会的题,多刷几遍,不断加深理解。基本数组操作:访问(1),查找(n),插入(append 1,insert n),改(1),删(pop 无参数 1,pop 有参数 n,remove n)

2023-09-17 15:40:26 159

原创 BERT 论文阅读

本文主要阅读并总结了论文《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》,分析了 BERT 的基本原理与架构,同时基于之前解读的一些自然语言处理经典论文,简要分析了 BERT 的思想沿承与开创性意义。

2023-02-12 20:34:14 313

原创 Linux 服务器配置selenium 爬虫

在 Linux 服务器运行爬虫有时可以取得奇效,但在 Linux 服务器环境(即无图形化界面)下配置爬虫环境、代理 IP 与常见的 Windows 环境有着较大区别。本文为对在 Linux 服务器上配置 selenium 及 Google Chrome 环境并基于代理 IP 运行爬虫的经历记录,针对一些笔者遇到的坑提供了解决方案,供读者参考。

2023-02-11 21:51:26 3968

原创 《Attention Is All You Need》(Transformer)论文阅读

2017年,Vaswani 等人在 NLP 领域顶级会议上发表了论文《Attention Is All You Need》,提出了 NLP 历史上里程碑的模型——Transformer。Transformer 创造性地抛弃了经典的 CNN、RNN 结构,仅使用 attention 机制和全连接网络搭建,在序列到序列(Seq2Seq)任务上取得了良好效果。自 Transformer 始,attention 机制取代了 RNN 的主流地位。本文阅读并总结了该经典论文,并详细介绍了 Transformer 的原理

2023-01-27 20:34:44 518

原创 ELMo论文阅读

本文详细阅读了ELMO论文,并对该模型的特点、模型架构和思路进行了分析,包括其BiLSTM结构特点、模型优势、模型意义以及其背后的重要思想等。

2023-01-14 14:24:51 200 1

原创 Word2Vec原论文阅读

Word2Vec 是自然语言处理、文本表示学习的典型模型,首次提出了 CBOW、Skip-gram 等目前仍在沿用的词向量学习思想。本文主要阅读并总结了 Word2Vec 原始论文《Efficient Estimation of Word Representations in Vector Space》,对该论文及其提出的 Word2Vec 模型基本原理、复杂度计算、多维语义相似度测试标准进行了一个大致介绍。

2022-11-26 21:38:17 1977 1

原创 TorchText简介

记录了TorchText的安装及简单使用

2022-11-26 16:51:57 1742

原创 Pytorch 可视化——Torchinfo以及TensorBoard(服务器使用)

本文章记录了Pytorch的两种可视化方法,分别为Torchinfo和TensorBoard,并分别在服务器进行了对应安装、配置和使用,针对TensorBoard,记录了服务器安装配置全过程,并记录了包括找不到命令、无法导入Mapping等问题的解决方法。

2022-11-24 18:10:55 2558

原创 Pytorch进阶训练技巧

记录了包括自定义损失函数、动态调整学习率、使用预训练模型、半精度训练等进阶技巧

2022-11-22 19:11:43 311

原创 基于Pytorch的中文情感分析实践

本文为学习 DataWhale 开源教程《深入浅出 Pytorch》第四章所做学习笔记,基于实战教程,实现了使用 LSTM 模型的中文微博情感分析全过程。

2022-11-21 22:30:57 2348

原创 Pytorch 基础组件介绍(Pytorch入门)

介绍了Pytorch的基本组件,包括数据读取、网络构建、损失函数、参数初始化、训练、优化器等各部分内容,参考《深入浅出Pytorch》

2022-11-18 14:34:19 625

原创 Pytorch 基础学习(数据结构、自动求导)

本文为学习 DataWhale 开源教程《深入浅出 Pytorch》第二章、第三章所做学习笔记,仅记录笔者认为价值较高且之前接触较少的知识点

2022-11-15 10:48:40 521

原创 连接Linux远程服务器配置Pytorch环境

远程连接 Linux 服务器,使用清华镜像源配置 Pytorch 环境全过程

2022-11-15 10:16:25 1352

原创 NNDL学习笔记-第四章 前馈神经网络

《神经网络与深度学习(邱锡鹏)》(NNDL)第四章前馈神经网络学习笔记、知识点总结

2022-10-25 11:11:34 414

原创 Python动态爬虫爬取京东商品评论

Python 动态爬虫爬取京东商品评论1. 概述京东商城是Python爬虫初学者试手的经典平台,反爬虫程度较低,但评论采取了动态加载的方式,爬取京东商品评论是学习动态爬虫的一个极佳方法。动态爬虫,即针对动态加载JSON文件网页的爬虫,其原理与静态爬虫没有本质区别,只是不爬取所见的静态目标网页,而是寻找该网页所加载的JSON文件,爬取JSON文件中的内容。2.目标观察观察京东具体商品评论页面:点击商品评价页:发现商品评价翻页的url不改变,可推测出其采用动态加载的方式,同时,会发现直接获取该

2021-07-27 14:33:32 3945 2

原创 Python POST 爬虫爬取掘金用户信息

Python POST 爬虫爬取掘金用户信息1. 概述Python第三方库requests提供了两种访问http网页的函数,基于GET方式的get()函数和基于POST方式的post()函数。get函数是最为常用的爬取方式,可以获取静态HTML页面和大部分动态加载json文件,但有一些网站对部分数据文件进行了加密处理,不能使用get来获取到文件内容,此时就需要使用post函数来进行获取。例如本文中所要爬取的掘金网站的用户信息。POST方式与GET方式最主要的区别在于POST在发送请求时会附上一部分参

2021-07-21 13:10:25 2140

原创 Python初级爬虫——爬取UIBE教务处(requests+bs4)

最基础爬虫——Python requests+bs4爬取UIBE教务处1.使用工具1.Python 3.x2.第三方库 requests,bs43.浏览器2.具体思路UIBE教务处网站开放程度较高,无反爬虫措施,只需要使用最基础的爬虫手段即可。使用requests库获取网页源码,使用bs4中BeautifulSoup库进行网页解析,定位到目标元素即可。首先得到教务处网站url为:http://jwc.uibe.edu.cn/导入两个第三方库:import requestsfrom bs

2021-07-21 09:51:20 946

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除