自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

日常学习与专研的记录

不求完美,但求真实与实用,如果有深度最好了。

  • 博客(146)
  • 收藏
  • 关注

原创 linux:切分大文件

本文介绍linux下如何切分大文件

2024-05-23 22:23:08 449

原创 NLP深入学习(十五):LDA 模型

本文介绍nlp有关的lda模型,包含原理、公式以及python代码。

2024-05-23 18:47:50 957

原创 GPT-4o 新旗舰模型,具备哪些多模态能力

本文介绍 GPT-4o, OpenAI 新的旗舰模型,具备哪些多模态能力。

2024-05-20 16:10:25 884

原创 linux:ssh-copy-id用法详解

本文主要介绍linux下的 ssh-copy-id 命令的详细用法

2024-05-20 16:07:40 355

原创 linux:top用法详解

本文详细介绍linux的top命令的用法,以及解释top命令的顶部字段、每列字段的含义。

2024-05-15 15:58:41 613

原创 Python 无法联网环境如何安装python包

内部环境的服务器有些无法连外网,无法下载一些 python 依赖,而且也没有用 Docker/K8s 这种隔离环境的技术。在这种情况下,Python 无法下载一些包,导致一些代码无法运行。本文介绍在这种背景下,如何安装依赖包。

2024-05-15 15:44:21 257

原创 Pytorch CrossEntropyLoss() 原理和用法详解

本文主要介绍 Pytorch 的 CrossEntropyLoss 的原理和用法

2024-05-13 14:59:23 1096

原创 了解并实现一个Transformer Block

本文介绍什么是 Transformer Block,其中包含哪些细节内容。

2024-05-13 14:57:45 462

原创 NLP 词嵌入向量即word embedding原理详解

本文介绍 NLP 词嵌入向量即word embedding原理详解,包含word2vec的CBOW模型等。

2024-05-11 17:29:16 1250

原创 Python 散点图分类别标签+不同颜色区分

本文介绍 Python 绘制散点图分类别标签+不同颜色区分

2024-05-10 11:08:10 362

原创 Python matplotlib 解决 “not found because none of the following families were found: Times New Roman“

本文介绍在Linux,如Ubuntu/Centos Python matplotlib 报错 “not found because none of the following families were found: Times New Roman"”

2024-05-10 09:54:52 277 1

原创 Mac 解决外接移动硬盘(NTFS格式)无法写入的问题

本文介绍 Mac 解决外接移动硬盘(NTFS格式)无法写入、复制、拷贝等问题

2024-05-08 17:02:46 627

原创 FastText 算法原理及使用方法

本文根据论文介绍 FastText 的原理以及使用方法。

2024-05-08 16:47:59 850

原创 linux:rsync命令详解

本文详细介绍linux的rsync命令用法。

2024-04-30 15:46:37 574 2

原创 常用的文本分类算法概览

本文介绍常用的文本分类算法概览,包含多种文本分类算法

2024-04-30 15:38:08 693

原创 国内外大模型免费访问入口汇总

本文主要介绍国内外的大模型免费访问入口,包含 gpt-3、gpt-4、Claude-3、Gemini、通义千问、文心一言、Kimi、海螺、讯飞星火、百川大模型、智谱AI大模型、盘古NLP大模型等。

2024-04-26 16:21:03 1339

原创 论文《ZeRO-Offload: Democratizing Billion-Scale Model Training》快览

本文主要介绍论文《ZeRO-Offload: Democratizing Billion-Scale Model Training》的主要内容。

2024-04-26 16:17:18 822

原创 linux:后台运行程序的几种方法

本文介绍后台运行程序的几种方法,包括&、nohup、disown、screen等

2024-04-24 16:03:44 1040

原创 LLM 为什么需要 tokenizer?

本文详细介绍为什么 llm 需要 tokenizer?

2024-04-24 15:59:47 1084

原创 正则表达式?: ?= ?! 的用法详解

本文介绍正则表达式中使用的 `?:`、`?=` 和 `?!`用法。 三种不同的正则表达式语法,它们分别代表非捕获组、正向前瞻断言和负向前瞻断言。

2024-04-19 16:47:26 648

原创 Python 多线程和多进程用法

本文详细介绍Python的多进程以及多线程的用法,并且结合tqdm进度条展示

2024-04-19 14:05:53 876

原创 详解GPT-4论文《GPT-4 Technical Report》

详解GPT-4论文《GPT-4 Technical Report》。

2024-04-16 17:09:27 1225 3

原创 中图分类法的正则表达式参考

本文介绍中图分类法的一种可供参考的正则表达式,可以匹配大部分的中图分类号!

2024-04-16 14:29:01 495

原创 Python Selenium 的基本使用方法

介绍 Python Selenium 的爬虫基本使用方法,包含安装 ChromeDriver、启动 driver、查找html 元素等。

2024-04-12 18:16:40 711

原创 详解GPT-1到GPT-3的论文亮点以及实验结论

详解GPT-1到GPT-3的论文亮点以及实验结论!

2024-04-12 18:14:33 1106

原创 linux:watch用法详解

本文主要介绍linux的watch用法!

2024-04-10 18:08:22 309 1

原创 ISBN 正则表达式及代码示例

本文主要介绍 ISBN 的正则表达式的说明,包含ISBN-10以及ISBN-13,以及相关的代码示例。

2024-04-10 09:38:14 466

原创 NLP深入学习(十四):TextRank算法

本文介绍常见的NLP分词算法,TextRank 算法

2024-04-07 16:17:17 1011

原创 linux:du和df区别

本文介绍linux的du和df的用法区别。du和df都是 Linux 系统中用于查看磁盘空间使用情况的命令,但它们的功能和用法有所不同。

2024-04-07 15:22:22 1407 1

原创 Pytorch torch.utils.data.DataLoader 用法详细介绍

本文详细介绍 Pytorch torch.utils.data.DataLoader 用法。

2024-04-03 17:57:06 1230

原创 PyTorch 常见用法介绍

介绍 Pytorch 张量基本操作,包含,创建张量、重塑张量、索引和切片、数据类型转换、深度学习相关的操作、损失函数、层和模型、优化器、自动求导以及保存和加载模型操作

2024-04-03 17:16:05 779

原创 linux: du用法详解

本文主要介绍linux的du命令,用于显示目录或文件的磁盘使用情况。

2024-03-28 16:20:11 509

原创 NLP深入学习:结合源码详解 BERT 模型(三)

本文详细介绍 BERT模型 的预训练代码,包含modeling.BertModel、embedding_lookup、embedding_postprocessor、 transformer_model、get_masked_lm_output、get_next_sentence_output等方法

2024-03-28 15:59:45 1001

原创 安装部署 Spark Standalone 集群详细流程

本文主要介绍在 Linux 下安装 Spark Standalone 集群的详细流程。

2024-03-27 15:13:16 932

原创 spark-submit 主要参数详细说明及Standalone集群最佳实践

部署提交应用到 spark 集群,可能会用到 `spark-submit` 工具,鉴于网上的博客质量残差不齐,且有很多完全是无效且错误的配置,没有搞明白诸如`--total-executor-cores` 、`--executor-cores`、`--num-executors`的关系和区别。因此有必要结合官网文档 [submitting-applications](https://spark.apache.org/docs/latest/submitting-applications.html) 详细记录

2024-03-26 18:23:48 807

原创 spark standalone启动报错 Error: Could not find or load main class org.apache.spark.deploy.worker.Worker

解决报错:Error: Could not find or load main class org.apache.spark.deploy.worker.Workernode10: failed to launch: nice -n 0 /xxx/bin/spark-class org.apache.spark.deploy.worke

2024-03-26 17:38:33 329

原创 Python 如何优雅编写多进程读取文件代码

Python 如何优雅的多进程读取文件。

2024-03-22 23:59:09 213

原创 Tensorflow 2.0 常见函数用法(一)

介绍 Tensorflow 2.0的一些常见函数用法,包含 tf.cast,tf.keras.layers.Dense,tf.variable_scope, tf.squeeze, tf.math.multiply

2024-03-22 23:52:05 622

原创 Python 报错 unicodedecodeerror: ‘utf-8‘ codec can‘t decode byte 0x8c

Python 解决读取文件报错 “unicodedecodeerror: ‘utf-8‘ codec can‘t decode byte 0x8c”

2024-03-21 22:43:03 885

原创 Python 解决大文件的写入但查看却生效不及时的问题

解决 Python 大文件的写入,但查看却生效不及时的问题。

2024-03-21 22:33:48 556

BERT的多语言模型,Layer=12,Hidden=768,Heads=12

BERT的全称为Bidirectional Encoder Representation from Transformers,是一个预训练的语言表征模型。本资源是BERT开源的基础模型Layer=12,Hidden=768,Heads=12。

2024-03-15

论文,Learning representations by back-propagating errors.pdf

论文《Learning representations by back-propagating errors》由David E. Rumelhart, Geoffrey E. Hinton, 和 Ronald J. Williams共同撰写,并在1986年发表于《Nature》杂志上。这篇论文是深度学习领域中的里程碑之作,它详细介绍了反向传播算法(Backpropagation)的原理和应用。 该论文主要贡献包括: 1. **反向传播算法描述**: 论文阐述了一个新的、有效的训练多层前馈神经网络的方法。反向传播算法通过利用链式法则,能够计算出网络中每层权重对于整个网络输出误差的梯度,从而使得网络可以根据这些梯度进行优化更新。 2. **学习过程详解**: 作者描述了如何在网络完成一次前向传播(从输入到输出的信号传递)之后,通过将误差信息从输出层逐层反向传播至输入层,来调整各隐藏层以及输入层与隐藏层之间的连接权重,以最小化预测输出与目标输出之间的差异。 3. **实际应用价值**: 论文展示了反向传播算法在解决非线性函数逼近和模式分类问题上的潜力,这一方法极大地

2024-02-20

爬取此时股票涨幅top40的全量数据,你要的都有!

爬取当前为止涨幅最大的40只股票,按照涨幅倒序排列,其中包含: 股票代码、股票名称、相关链接、最新价、涨跌幅、涨跌额、成交量(手)、成交额、振幅、最高、最低、今开、昨收、量比、换手率、市盈率(动态)、市净率。 主要的步骤: 1. 选择工具和库: 根据数据源的特点,选择合适的爬虫工具和编程语言。Python 是一个常用的选择,其中的采用 selenium 用于模拟浏览器 HTTP 请求获取网页内容,BeautifulSoup 用于解析 HTML内容; 2. 编写爬虫代码: a. 抓取网页数据: b. 发送GET请求到包含股票涨幅信息的页面。 c. 解析返回的HTML页面,找到涨幅排行榜列表的位置,并提取出每只股票的名称、代码、当前价格、涨跌幅等信息。

2024-01-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除