- 博客(409)
- 资源 (3)
- 问答 (1)
- 收藏
- 关注
原创 Python - FastAPI 实现 get、post 请求
使用 FastAPI 搭建 Server Demo 与 get、post 操作示例。
2023-09-19 14:11:31
54
原创 LLM - 数据处理之 Process Dataset For LLM With PT、SFT、RM
基于 PT、SFT、RM 的 Dataset 预处理。
2023-09-13 08:00:00
49
原创 LLM - Model、Data、Training、Generate Agruments 超参解析
使用 transformers.HfArgumentParser 对大模型脚本进行超参解析。
2023-09-08 11:51:41
112
原创 LLM - LLaMA-2 获取文本向量并计算 Cos 相似度
基于 Cos 和 BERT-whitening 特征白化的大模型输出文本 Embeding 相似度评估。
2023-09-01 11:05:42
1186
原创 LLM - CUDA out of memory. 到底怎么事
torch.cuda.OutOfMemoryError: CUDA out of memory. 报错日志分析与解决。
2023-08-10 08:00:00
168
原创 LLM - Transformer && LLaMA2 结构分析与 LoRA 详解
Transformer、LLaMA-2 以及 LoRA的一些基础知识。
2023-08-08 10:21:42
2066
11
原创 LLM - LLama 模型读取报错 TypeError: not a string
读取 LLama2 模型时报错TypeError: not a string。
2023-08-01 17:28:56
1186
原创 LLM - DataCollatorForLanguageModeling 样本生成 by transformers
Transformer DataCollatorForLanguageModeling 样本生成与 Trainer 自定义 data_collator。
2023-07-13 18:25:40
391
原创 LLM - Baichuan7B Tokenizer 生成训练数据
AIGC - Lora baichuan7B 之原始训练数据 tokenizer
2023-07-11 17:14:53
502
原创 LLM - Baichuan / ChatGLM Lora 异常:NotImplementedError: Cannot copy out of meta tensor; no data!
ChatGLM-6B、Baichuan-7B Lora 报错 NotImplementedError: Cannot copy out of meta tensor; no data!
2023-06-28 11:30:39
2621
5
原创 深度学习 - 52.推荐场景的多样性与 MMR [Maximal Marginal Relevance] 简介与 Python 实现
MMR 最大边界相关算法与多样性简介与实现。
2023-05-31 14:23:33
621
原创 深度学习 - 51.推荐场景下的 Attention And Multi-Head Attention 简单实现 By Keras
推荐场景下 Attention 与 Multi-Attention Layer 简单实现 By Keras。
2023-05-25 08:00:00
650
原创 深度学习 - 50.推荐场景下的 Attention And Multi-Head Attention
Attention、Multi-Attention 注意力与多头注意力简单理解。
2023-05-23 08:00:00
288
原创 深度学习 - 49.SIM 搜索兴趣网络 GSU 与 Soft Search 简单实现 By Keras
SIM 搜索兴趣网络 GSU 通用搜索模块与 Soft Search 软搜索 Kears 实现。
2023-05-18 08:00:00
347
原创 深度学习 - 48.SIM Search-based Interest Model 搜索兴趣网络
Alibaba 序列模型 SIM Search-based Interest Model 搜索兴趣网络论文注解。
2023-05-16 08:00:00
316
Scala areOnJava8() 代码形式
2022-07-18
TA创建的收藏夹 TA关注的收藏夹
TA关注的人