TFATS
码龄5年
关注
提问 私信
  • 博客:423,873
    423,873
    总访问量
  • 154
    原创
  • 2,027,719
    排名
  • 184
    粉丝
  • 学习成就
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2020-01-05
博客简介:

TFATS的博客

查看详细资料
  • 原力等级
    成就
    当前等级
    5
    当前总分
    1,782
    当月
    14
个人成就
  • 获得613次点赞
  • 内容获得112次评论
  • 获得2,419次收藏
  • 代码片获得5,615次分享
创作历程
  • 3篇
    2024年
  • 11篇
    2023年
  • 5篇
    2022年
  • 25篇
    2021年
  • 117篇
    2020年
成就勋章
TA的专栏
  • GPT大模型
    9篇
  • nlp
    60篇
  • 深度学习
    16篇
  • 算法
    41篇
  • 驱动升级
    2篇
  • python环境
    7篇
  • Docker
    2篇
  • airlfow
    1篇
  • nvidia
    3篇
  • python语法
    5篇
  • python常用工具库
    53篇
  • 排坑
    4篇
  • keras
    38篇
  • tensorflow
    35篇
  • GIT
    1篇
  • 搭建服务器
    1篇
  • tfidf
    1篇
  • jwt
    1篇
  • django
    4篇
  • sk-learn
    18篇
  • 数据结构与算法
    1篇
  • mysql
    1篇
  • 多任务
    5篇
  • 网络通信
    3篇
  • 装饰器
    1篇
  • huffman tree
    1篇
  • pandas
    13篇
  • numpy
    9篇
  • RabbitMq
    1篇
  • mysql-疑难杂症
    3篇
  • kafka
  • zookeeper
    2篇
  • github
    1篇
兴趣领域 设置
  • 数据结构与算法
    排序算法推荐算法
  • 大数据
    mysql
  • 人工智能
    opencv计算机视觉机器学习深度学习神经网络自然语言处理tensorflowpytorch图像处理nlp数据分析scikit-learn聚类分类回归
  • 服务器
    linux
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

175人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

LLM主流框架:Causal Decoder、Prefix Decoder和Encoder-Decoder

前缀语言模型可以根据给定的前缀生成后续的文本,而因果语言模型只能根据之前的文本生成后续的文本。在模型架构代表LLM注意力机制是否属于Decoder-Only纯单向YESFlan-T5输入双向NO输入双向,输出单向YES。
原创
发布博客 2024.01.12 ·
5482 阅读 ·
35 点赞 ·
3 评论 ·
57 收藏

什么是RoPE-旋转位置编码?

我们知道句子中不同词语之前的位置信息十分重要,但是self-attention框架无法直接利用位置信息,因此研究者提出了许多方法将位置信息编码到学习过程中。一是绝对位置编码方法,将位置信息直接加入到输入中;二是相对位置编码方法,研究者通过微调attention的结构,使它具有识别token位置信息的能力。本文作者详细梳理了位置编码的流派,提出了一种旋转位置编码方式RoPE,并从数学角度证明RoPE带来的诸多优点。
原创
发布博客 2024.01.12 ·
3099 阅读 ·
32 点赞 ·
1 评论 ·
28 收藏

LORA的基本原理

LoRA 是一种低资源微调大模型方法。使用LORA,训练参数仅为整体参数的万分之一、GPU显存使用量减少2/3且不会引入额外的推理耗时。
原创
发布博客 2024.01.11 ·
7908 阅读 ·
42 点赞 ·
2 评论 ·
113 收藏

大模型 Decoder 的生成策略

Greedy Search、beam search、Sampling、Top-K、Top-p
原创
发布博客 2023.10.02 ·
2910 阅读 ·
3 点赞 ·
1 评论 ·
2 收藏

为什么现在的LLM都是Decoder only的架构?

总而言之,decoder-only 在参数量不太大时就更具有更强的zero-shot性能、更匹配主流的自监督训练范式;而在大参数量的加持下,具有了涌现能力后、可以匹敌encoder-decoder做finetuning的效果;在In Context的环境下、又能更好地做few-shot任务。decoder-only 架构符合传统的 Language Model 的模式。
原创
发布博客 2023.09.21 ·
5200 阅读 ·
17 点赞 ·
1 评论 ·
25 收藏

Zero-Shot、One-shot、Few-Shot 的简介

所以模型需要知道的信息是马的样本、老虎的样本、熊猫的样本和样本的标签,以及关于前三种动物和斑马的描述。”然后,爸爸给小明安排了一个任务,让他在动物园里找一种他从没见过的动物,叫斑马,并告诉了小明有关于斑马的信息:“斑马有着马的轮廓,身上有像老虎一样的条纹,而且它像熊猫一样是黑白色的。如今十分火热的纯监督模型往往需要足够多的样本才能训练出足够好的模型,并且用熊猫训练出来的分类器,只能对熊猫进行分类,其他物种都无法识别,也无法进行特征的综合推理,这样的模型功能还有待完善。
原创
发布博客 2023.09.20 ·
3707 阅读 ·
11 点赞 ·
0 评论 ·
25 收藏

GPT,GPT-2,GPT-3,InstructGPT的进化之路

GPT、GPT2、GPT3、InstructGPT 的进阶之路。
原创
发布博客 2023.09.20 ·
1791 阅读 ·
5 点赞 ·
1 评论 ·
4 收藏

MHA、MQA、GQA区别和联系

MHA: Multi Head AttentionMQA:Multi Query AttentionGQA:Grouped Query Attention
原创
发布博客 2023.09.19 ·
4478 阅读 ·
7 点赞 ·
1 评论 ·
14 收藏

AIGC入门 - LLM 信息概览

**本文将介绍以下 LLM**- **OPT**- **LLaMa**- **Alpaca**- **Vicuna**- **Moss**- **chatGLM**- **Baichuan**- **Openbuddy**
原创
发布博客 2023.09.18 ·
1093 阅读 ·
3 点赞 ·
0 评论 ·
6 收藏

Python 的垃圾回收机制(GC-GarbageCollection)

总体来说,在Python中,主要通过引用计数进行垃圾回收;通过 “标记-清除” 解决容器对象可能产生的循环引用问题;通过 “分代回收” 以空间换时间的方法提高垃圾回收效率。
原创
发布博客 2023.03.31 ·
2270 阅读 ·
3 点赞 ·
1 评论 ·
13 收藏

使用 python 实现动态规划之最长公共子串

这道题属于动态规划中十分经典的题目,在两个字符串中找到最长的公共子串,返回其最大长度或最大字符串。
原创
发布博客 2023.03.27 ·
1026 阅读 ·
1 点赞 ·
0 评论 ·
6 收藏

模型部署之TorchScript

TorchScript是Pytorch模型(继承自nn.Module)的中间表示,保存后的torchscript模型可以在像C++这种高性能的环境中运行TorchScript是一种从PyTorch代码创建可序列化和可优化模型的方法。任何TorchScript程序都可以从Python进程中保存,并加载到没有Python依赖的进程中。简单来说,TorchScript能将动态图转为静态图,在pytorch的灵活的动态图特性下,torchscript提供了依然能够获取模型结构(模型定义)的工具。
原创
发布博客 2023.03.22 ·
1560 阅读 ·
1 点赞 ·
0 评论 ·
5 收藏

A30、V100性能测试对比报告

共压80000数据,同时请求500数据。
原创
发布博客 2023.03.22 ·
7118 阅读 ·
1 点赞 ·
0 评论 ·
4 收藏

Bert-Ner在TensorRT推理中选择不同输出时的性能差异

原创
发布博客 2023.03.22 ·
179 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

安装 NVSwitch GPU 服务器的 cuda 驱动版本、nvidia-docker 指南

安装 NVSwitch GPU 服务器的 cuda 驱动版本、nvidia-docker 指南。
原创
发布博客 2022.12.12 ·
3716 阅读 ·
3 点赞 ·
1 评论 ·
7 收藏

升级 GPU 服务器 cuda 驱动版本指南

升级 GPU 服务器 cuda 驱动版本指南。
原创
发布博客 2022.08.19 ·
4411 阅读 ·
1 点赞 ·
3 评论 ·
9 收藏

宿主机搭建 Airflow 环境指引

宿主机中搭建 airflow 环境指引
原创
发布博客 2022.07.24 ·
1130 阅读 ·
1 点赞 ·
1 评论 ·
1 收藏

基于 Bert 的多任务改造

一. Bert 的多任务认识以bert为代表的预训练模型多任务可以应用在多种场景。1. 主辅任务:比如我们当前进行任务A,但是我们可以构造一个辅助任务B一起参与训练,来达到提高任务A性能的目的,比如人为的去构造一个辅助任务 MLM(Bert 预训练语言遮蔽模型)这样的辅助任务,辅助去提高任务A,线上推理时并不输出任务B的结果。2. 并行任务:本身就需要进行多个任务,比如ABC,一样重要,但任务类型相似,如果分开训练,那么就需要3个模型,此时可以尝试共享一个模型,即共享大部分参数,差异化小部分参
原创
发布博客 2022.05.07 ·
1916 阅读 ·
5 点赞 ·
0 评论 ·
10 收藏

NLP - glue 数据集

发布资源 2022.04.12 ·
zip

Python 开启简易 HTTP 服务

使用 python 在 linux 环境机器中开启简易 http 的开放端口一,python 版本 <= 2.3python -c "import SimpleHTTPServer as s; s.test();" 8000二,Python 版本 >= 2.4python -m SimpleHTTPServer 8000三,Python 3.x 版本python -m http.server 8000...
原创
发布博客 2022.01.07 ·
1641 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏
加载更多