西南小游侠-CSDN博客

原创 Transformer源码解读

本文将从模型原理及代码实现上讲解Transformer模型，并着重介绍代码实现。需要注意的是，由于 Transformer 源代码使用 TensorFlow 搭建，此处选择了哈佛大学 harvardnlp 团队基于 Pytorch 框架开发的 Annotated Transformer代码进行讲解，以帮助大家了解 Transformer 的实现细节。本文为 DataWhale 开源教程 thorough-pytorch 的一部分。

2023-02-11 22:20:32 1025 2

原创 Leetcode 刷题记录——数组篇

另一个难点在于较复杂规律的模拟，需要重视边界情况，全面细致，更多的是需要耐心的体力活，例如螺旋矩阵一题，找到规律并不困难，但要耐心的模拟其实是一个问题，尤其是如果笔面试碰到这类题目，在时间有限的情况下能否清晰地解出，是一个挑战。如果发现自己看了题解也无法实现代码，就认真阅读题解的代码，并理解代码的逻辑。② 重复刷题：遇见不会的题，多刷几遍，不断加深理解。基本数组操作：访问（1），查找（n），插入（append 1，insert n），改（1），删（pop 无参数 1，pop 有参数 n，remove n）

2023-09-17 15:40:26 159

原创 BERT 论文阅读

本文主要阅读并总结了论文《BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding》，分析了 BERT 的基本原理与架构，同时基于之前解读的一些自然语言处理经典论文，简要分析了 BERT 的思想沿承与开创性意义。

2023-02-12 20:34:14 313

原创 Linux 服务器配置selenium 爬虫

在 Linux 服务器运行爬虫有时可以取得奇效，但在 Linux 服务器环境（即无图形化界面）下配置爬虫环境、代理 IP 与常见的 Windows 环境有着较大区别。本文为对在 Linux 服务器上配置 selenium 及 Google Chrome 环境并基于代理 IP 运行爬虫的经历记录，针对一些笔者遇到的坑提供了解决方案，供读者参考。

2023-02-11 21:51:26 3968

原创《Attention Is All You Need》（Transformer）论文阅读

2017年，Vaswani 等人在 NLP 领域顶级会议上发表了论文《Attention Is All You Need》，提出了 NLP 历史上里程碑的模型——Transformer。Transformer 创造性地抛弃了经典的 CNN、RNN 结构，仅使用 attention 机制和全连接网络搭建，在序列到序列（Seq2Seq）任务上取得了良好效果。自 Transformer 始，attention 机制取代了 RNN 的主流地位。本文阅读并总结了该经典论文，并详细介绍了 Transformer 的原理

2023-01-27 20:34:44 518

原创 ELMo论文阅读

本文详细阅读了ELMO论文，并对该模型的特点、模型架构和思路进行了分析，包括其BiLSTM结构特点、模型优势、模型意义以及其背后的重要思想等。

2023-01-14 14:24:51 200 1

原创 Word2Vec原论文阅读

Word2Vec 是自然语言处理、文本表示学习的典型模型，首次提出了 CBOW、Skip-gram 等目前仍在沿用的词向量学习思想。本文主要阅读并总结了 Word2Vec 原始论文《Efficient Estimation of Word Representations in Vector Space》，对该论文及其提出的 Word2Vec 模型基本原理、复杂度计算、多维语义相似度测试标准进行了一个大致介绍。

2022-11-26 21:38:17 1977 1

原创 TorchText简介

记录了TorchText的安装及简单使用

2022-11-26 16:51:57 1742

原创 Pytorch 可视化——Torchinfo以及TensorBoard（服务器使用）

本文章记录了Pytorch的两种可视化方法，分别为Torchinfo和TensorBoard，并分别在服务器进行了对应安装、配置和使用，针对TensorBoard，记录了服务器安装配置全过程，并记录了包括找不到命令、无法导入Mapping等问题的解决方法。

2022-11-24 18:10:55 2558

原创 Pytorch进阶训练技巧

记录了包括自定义损失函数、动态调整学习率、使用预训练模型、半精度训练等进阶技巧

2022-11-22 19:11:43 311

原创基于Pytorch的中文情感分析实践

本文为学习 DataWhale 开源教程《深入浅出 Pytorch》第四章所做学习笔记，基于实战教程，实现了使用 LSTM 模型的中文微博情感分析全过程。

2022-11-21 22:30:57 2348

原创 Pytorch 基础组件介绍（Pytorch入门）

介绍了Pytorch的基本组件，包括数据读取、网络构建、损失函数、参数初始化、训练、优化器等各部分内容，参考《深入浅出Pytorch》

2022-11-18 14:34:19 625

原创 Pytorch 基础学习（数据结构、自动求导）

本文为学习 DataWhale 开源教程《深入浅出 Pytorch》第二章、第三章所做学习笔记，仅记录笔者认为价值较高且之前接触较少的知识点

2022-11-15 10:48:40 521

原创连接Linux远程服务器配置Pytorch环境

远程连接 Linux 服务器，使用清华镜像源配置 Pytorch 环境全过程

2022-11-15 10:16:25 1352

原创 NNDL学习笔记-第四章前馈神经网络

《神经网络与深度学习（邱锡鹏）》（NNDL）第四章前馈神经网络学习笔记、知识点总结

2022-10-25 11:11:34 414

原创 Python动态爬虫爬取京东商品评论

Python 动态爬虫爬取京东商品评论1. 概述京东商城是Python爬虫初学者试手的经典平台，反爬虫程度较低，但评论采取了动态加载的方式，爬取京东商品评论是学习动态爬虫的一个极佳方法。动态爬虫，即针对动态加载JSON文件网页的爬虫，其原理与静态爬虫没有本质区别，只是不爬取所见的静态目标网页，而是寻找该网页所加载的JSON文件，爬取JSON文件中的内容。2.目标观察观察京东具体商品评论页面：点击商品评价页：发现商品评价翻页的url不改变，可推测出其采用动态加载的方式，同时，会发现直接获取该

2021-07-27 14:33:32 3945 2

原创 Python POST 爬虫爬取掘金用户信息

Python POST 爬虫爬取掘金用户信息1. 概述Python第三方库requests提供了两种访问http网页的函数，基于GET方式的get()函数和基于POST方式的post()函数。get函数是最为常用的爬取方式，可以获取静态HTML页面和大部分动态加载json文件，但有一些网站对部分数据文件进行了加密处理，不能使用get来获取到文件内容，此时就需要使用post函数来进行获取。例如本文中所要爬取的掘金网站的用户信息。POST方式与GET方式最主要的区别在于POST在发送请求时会附上一部分参

2021-07-21 13:10:25 2140

原创 Python初级爬虫——爬取UIBE教务处（requests+bs4）

最基础爬虫——Python requests+bs4爬取UIBE教务处1.使用工具1.Python 3.x2.第三方库 requests,bs43.浏览器2.具体思路UIBE教务处网站开放程度较高，无反爬虫措施，只需要使用最基础的爬虫手段即可。使用requests库获取网页源码，使用bs4中BeautifulSoup库进行网页解析，定位到目标元素即可。首先得到教务处网站url为：http://jwc.uibe.edu.cn/导入两个第三方库：import requestsfrom bs

2021-07-21 09:51:20 946

UIBE_day_day_up的博客