自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

BITDDD小栈

推荐算法工程师,日常使用 Spark、Flink、Python 以及其他大数据相关

  • 博客(409)
  • 资源 (3)
  • 问答 (1)
  • 收藏
  • 关注

原创 Python 机器学习/深度学习/算法专栏/LLM - 导读目录

机器学习、深度学习、LLM、数据结构算法专栏目录与整理,方便查找与阅读。

2023-03-02 12:04:00 699 6

原创 LLM - 大模型速递 InternLM-20B 快速入门

InternLM-20B 大模型初体验。

2023-09-22 11:48:31 47

原创 LLM - 大模型技术报告与训练细节 By Baichuan2

Baichuan2 模型技术报告整理与心得体会。

2023-09-21 08:00:00 136

原创 Python - FastAPI 实现 get、post 请求

使用 FastAPI 搭建 Server Demo 与 get、post 操作示例。

2023-09-19 14:11:31 54

原创 LLM - SFT workflow 微调工作流程

LLM SFT 有监督微调 workflow 工作流详解。

2023-09-14 08:00:00 57

原创 LLM - 数据处理之 Process Dataset For LLM With PT、SFT、RM

基于 PT、SFT、RM 的 Dataset 预处理。

2023-09-13 08:00:00 49

原创 LLM - 批量加载 dataset 并合并

LLM dataset 批量加载 dataset 并合并。

2023-09-12 11:39:36 76

原创 LLM - Model、Data、Training、Generate Agruments 超参解析

使用 transformers.HfArgumentParser 对大模型脚本进行超参解析。

2023-09-08 11:51:41 112

原创 LLM - 大模型速递 Baichuan2 快速入门

百川最新模型 Baichuan2 体验与测试。

2023-09-07 11:09:00 493 4

原创 LLM - LLaMA-2 获取文本向量并计算 Cos 相似度

基于 Cos 和 BERT-whitening 特征白化的大模型输出文本 Embeding 相似度评估。

2023-09-01 11:05:42 1186

原创 LLM - Baichuan-13B 多卡加载与推理测试

大模型量化加载与多卡推理配置与实践。

2023-08-29 08:00:00 292 2

原创 LLM - Model Load_in_8bit For LLaMA

LLaMA 8bit 量化加载尝试。

2023-08-28 08:00:00 237

原创 LLM - 大模型评估指标之 ROUGE

LLM 评价指标之 ROUGE SCORE。

2023-08-18 08:00:00 200

原创 LLM - 大模型评估指标之 BLEU

LLM 指标评估之 BLEU 双语评估替身。

2023-08-17 15:56:58 144

原创 LLM - argparse 解析脚本参数

python 使用 argparse 类解析参数。

2023-08-11 11:09:20 134

原创 LLM - CUDA out of memory. 到底怎么事

torch.cuda.OutOfMemoryError: CUDA out of memory. 报错日志分析与解决。

2023-08-10 08:00:00 168

原创 LLM - Transformer && LLaMA2 结构分析与 LoRA 详解

Transformer、LLaMA-2 以及 LoRA的一些基础知识。

2023-08-08 10:21:42 2066 11

原创 LLM - LoRA 模型合并与保存

LoRA 模型 merge_and_unload 合并与保存。

2023-08-03 08:00:00 1035 5

原创 LLM - LLama 模型读取报错 TypeError: not a string

读取 LLama2 模型时报错TypeError: not a string。

2023-08-01 17:28:56 1186

原创 LLM - model batch generate 生成文本

LLM model generate batch 批量生成与参数详解。

2023-07-31 08:00:00 369

原创 LLM / Python - json 使用详解

Json 常用方法示例。

2023-07-27 10:36:49 179

原创 LLM - Chinese-Llama-2-7b 初体验

Chinese-Llama-2-7b 初体验。

2023-07-25 19:49:56 3368

原创 LLM - ChatGLM-6B Lora 微调与推理

ChatGLM-6B Lora 微调与推理流程详解。

2023-07-20 16:59:58 654

原创 linux - bc 命令安装

linux 安装 bc 命令。

2023-07-14 15:42:27 516

原创 LLM - 读取 Lora 模型进行文本生成

加载预训练模型和Lora微调模型实现文本生成。

2023-07-14 15:24:33 910

原创 LLM - DataCollatorForLanguageModeling 样本生成 by transformers

Transformer DataCollatorForLanguageModeling 样本生成与 Trainer 自定义 data_collator。

2023-07-13 18:25:40 391

原创 LLM - Baichuan7B Lora 训练详解

Baichuan7B lora 微调训练流程详解。

2023-07-12 15:27:58 1523

原创 LLM - Baichuan7B Tokenizer 生成训练数据

AIGC - Lora baichuan7B 之原始训练数据 tokenizer

2023-07-11 17:14:53 502

原创 LLM - Baichuan / ChatGLM Lora 异常:NotImplementedError: Cannot copy out of meta tensor; no data!

ChatGLM-6B、Baichuan-7B Lora 报错 NotImplementedError: Cannot copy out of meta tensor; no data!

2023-06-28 11:30:39 2621 5

原创 Mac - 鼠标拖尾特效 By CursorEffect2

MAC 光标特效软件 CursorEffect2 使用。

2023-06-02 14:58:28 622

原创 深度学习 - 53.Bert 简介与 Keras-Bert 常用示例

Bert 简介与 Keras-Bert 常用 Demo 展示。

2023-06-01 17:24:16 609 1

原创 深度学习 - 52.推荐场景的多样性与 MMR [Maximal Marginal Relevance] 简介与 Python 实现

MMR 最大边界相关算法与多样性简介与实现。

2023-05-31 14:23:33 621

原创 深度学习 - 51.推荐场景下的 Attention And Multi-Head Attention 简单实现 By Keras

推荐场景下 Attention 与 Multi-Attention Layer 简单实现 By Keras。

2023-05-25 08:00:00 650

原创 深度学习 - 50.推荐场景下的 Attention And Multi-Head Attention

Attention、Multi-Attention 注意力与多头注意力简单理解。

2023-05-23 08:00:00 288

原创 深度学习 - 49.SIM 搜索兴趣网络 GSU 与 Soft Search 简单实现 By Keras

SIM 搜索兴趣网络 GSU 通用搜索模块与 Soft Search 软搜索 Kears 实现。

2023-05-18 08:00:00 347

原创 Spark - 创建 _SUCCESS 文件与获取最新可用文件

Spark 为文件、文件夹生成 _SUCCESS 标识并获取最新可用文件。

2023-05-16 14:42:20 525 1

原创 深度学习 - 48.SIM Search-based Interest Model 搜索兴趣网络

Alibaba 序列模型 SIM Search-based Interest Model 搜索兴趣网络论文注解。

2023-05-16 08:00:00 316

原创 深度学习 - 47.DIN 深度兴趣网络保姆级实现 By Keras

DIN 深度兴趣网络与 Dice 激活函数 Keras 实现。

2023-05-11 08:00:00 577

原创 深度学习 - 46.DIN 深度兴趣网络

Alibaba Attention 序列模型 DIN 之 Deep Interest Nerwork。

2023-05-09 08:00:00 895

原创 Spark - 获取一定时间内的 Hdfs 全部文件并读取

Spark 读取一定范围内的 Hdfs 文件。

2023-04-30 18:12:07 1773 1

GraphEMbedding_LINE.pdf

Line 论文

2021-09-13

Learning Deep Structured Semantic Models for Web Search using Clickthrough Data

DSSM论文

2021-06-24

DeepFm分解机论文

DeepFm原版英文论文 deepfm 使用 fm组合低阶特征 再使用DNN组合高阶特征 弥补了Fm在高阶组合特征的缺陷

2020-06-17

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除