tangjunjun-owen
码龄8年
关注
提问 私信
  • 博客:269,001
    269,001
    总访问量
  • 182
    原创
  • 9,559
    排名
  • 19,254
    粉丝
  • 1,995
    铁粉

个人简介:从事人工智能行业,已从事工业检测行业、智慧交通行业、智慧城市行业,已有如下经验: ARM/jetson部署、NVIDIA性能优化、道路感知2D、单目3D、点云3D、目标跟踪、深度估计、多模态大模型与语言大模型、lidar/radar/vison多传感融合、中间件ROS2开发、相机标定、工业2D检测/分类/分割、数据增强、attention、transformer、模型压缩加速 计算机技能:C++、Python、cuda、tensorrt、ros2

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:四川省
  • 加入CSDN时间: 2017-04-10
博客简介:

weixin_38252409的博客

查看详细资料
  • 原力等级
    领奖
    当前等级
    7
    当前总分
    3,778
    当月
    69
个人成就
  • 获得1,270次点赞
  • 内容获得151次评论
  • 获得2,776次收藏
  • 代码片获得14,594次分享
创作历程
  • 100篇
    2024年
  • 72篇
    2023年
  • 10篇
    2022年
成就勋章
TA的专栏
  • 大语言模型教程(基于llama模型)
    付费
    15篇
  • 多模态大模型教程(基于LLAVA模型)
    付费
    23篇
  • huggingface源码解读教程
    付费
    18篇
  • CUDA
    付费
    21篇
  • tools
    10篇
  • 深度估计
    6篇
  • python-pytorch
    13篇
  • 语言模型-多模态大模型
    17篇
  • paper解读
    18篇
  • huggingface
    7篇
  • 目标跟踪(track)
    1篇
  • 目标检测
    11篇
  • 模型蒸馏-distillation
    2篇
  • 坐标标定(相机-雷达)
    3篇
  • ROS2
    2篇
  • deepstream
    1篇
  • tensorrt
    7篇
兴趣领域 设置
  • 人工智能
    opencv计算机视觉深度学习神经网络pytorch图像处理
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

175人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

大语言模型数据流程源码解读(基于llama3模型)

如果只是简单构建训练与推理的大语言模型,还是比较简单,直接使用huggignface调用即可。然而,理解其源码或内部原理是比较麻烦的,尽管我在之前文章给出了很多解释,但我还是想通过数据流走向来解读模型整个流程与源码内部机理。这样,我们可方便更深入的理解大语言模型!
原创
发布博客 2024.10.28 ·
729 阅读 ·
14 点赞 ·
0 评论 ·
2 收藏

大语言模型训练与推理模型构建源码解读(huggingface)

我们已搭建了llama训练与推理方法,而llama模型来源huggingface提供。为此,本节来解读huggingface的llma模型训练与推理源码解读。
原创
发布博客 2024.10.28 ·
271 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大语言模型推理代码构建(基于llama3模型)

之前文章也已给出了自己构建llama3源码,本节给出如何构建推理代码,并给出完整源码。
原创
发布博客 2024.10.28 ·
253 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大语言模型推理源码解读(基于llama3模型:来源github)

本项目是解读开源github的代码,该项目基于Meta最新发布的新一代开源大模型Llama-3开发,是Chinese-LLaMA-Alpaca开源大模型相关系列项目(一期、二期)的第三期。而本项目开源了中文Llama-3基座模型和中文Llama-3-Instruct指令精调大模型。这些模型在原版Llama-3的基础上使用了大规模中文数据进行增量预训练,并且使用精选指令数据进行精调,进一步提升了中文基础语义和指令理解能力,相比二代相关模型获得了显著性能提升。
原创
发布博客 2024.10.25 ·
507 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

huggingface的generate推理方法源码解读

大语言模型基本使用huggingface的generate方法进行推理。而我最近也在使用llama3代码,于是我写下一份huggingface的generate方法,帮助读者了解huggingface如何对大语言模型进行推理。同样,我和其它博客不太一样,我是按照源码来解读huggingface的generate方法。
原创
发布博客 2024.10.25 ·
66 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

huggingface使用Trainer训练的Demo

大模型基本使用huggingface来实现。对于不太理解其内容基本按照官网教程或相关博客等来实现。想进一步激发开源大模型在行业领域提升性能是棘手问题。该问题会涉及开源代码二次开发进行实验测试。基于此,本教程不同文字或理论介绍内容,而从源码解读其训练逻辑、权重保存、高效微调方法(LoRA)、断点续训方法、模型推理权重处理等方法。本教程所有内容完全依托huggingface源码与相关Demo验证来解读,助力大模型使用。
原创
发布博客 2024.10.25 ·
44 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大语言模型训练方式探索(基于llma3模型)

前面已经构建了大语言模型代码,本篇文章在此基础上探索不同模块功能,包含数据划分加工处理、评估方法、resume训练、torchrun训练、wandb使用方法以及deepspeed训练方法。
原创
发布博客 2024.10.25 ·
658 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大模型lora训练、权重保存、训练方法与完整训练代码(基于llama模型)

本篇文章介绍lora训练与huggingface训练源码构建,以及权重保存、数据格式与完整训练代码内容!
原创
发布博客 2024.10.25 ·
148 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

huggingface的lora与resume方法训练模型(以BERT为列)

解读lora与resume训练方法,使其少量参数训练与断点继续训练!
原创
发布博客 2024.10.25 ·
538 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大语言模型数据处理方法(基于llama模型)

本文使用huggingface方法来构建大模型数据加工方法!当然,这些方法也可以为其它大模型使用!。
原创
发布博客 2024.10.25 ·
593 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

基于huggingface训练数据处理(load_dataset、map、data_loader等内容)

本篇文章基于huggingface框架来探索大语言模型数据处理方法。本文主要介绍如何基于huggingface训练模式构造自己的数据,类似与torch的dataset与dataloader方式来构建大语言模型数据。为后面大语言模型构建做理论支撑。提示:huggingface数据加载理论知识!
原创
发布博客 2024.10.25 ·
111 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大语言模型参数传递、model 构建与tokenizer构建(基于llama3模型)

上一篇说到huggingface的参数传递理论方法,本篇文章应用与llama3参数构建实践代码开发。并在参数传递基础上构建模型model与tokenizer。
原创
发布博客 2024.10.25 ·
502 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大模型如何使用huggingface库传参?配置参数、数据参数、模型参数配置?

在使用大模型时候,我们经常遇到参数传参问题,如何构建一个参数方法,即可使用默认参数,也可使用命令方式传参,是大模型构建的第一步。而大模型经常使用HfArgumentParser+parse_args_into_dataclasses+TrainingArguments等方式来实现。介于此,本篇文章纯粹解读huggingface参数传递与配置内容。
原创
发布博客 2024.10.25 ·
81 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

vscode如何debug环境配置?torchrun与deepspeed库又该如何配置?

本文验证完成基于vscode对deepspeed进行debug方法。特别的,该方式不仅适合deepspeed命令debug,也适用torchrun命令debug,更能延伸其它命令debug模式。本文内容分为三部分,第一部分介绍如何使用vscode传递参数debug;第二部分介绍如何使用deepspeed进行debug;第三部分介绍vscode通用命令方式进行debug。大模型扩充内容!点击这里。
原创
发布博客 2024.10.24 ·
261 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大语言模型数据类型与环境安装(llama3模型)

简单给出环境安装与数据类型及vscode运行配置,其中vscode运行配置是便于我们调试代码。
原创
发布博客 2024.10.24 ·
427 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

基于depth anything模型理解深度估计运行机理

深度估计是一个很有效方法来预测目标距离或其它场景应用。特别地,近期相关深度估计大模型出现,使其目标深度估计更具有工程应用价值。本文将介绍一个通用的深度估计模型depth anything来实现现实世界目标的深度估计,而模型运行较为简单,关键在于如何将预测深度图转为真实深度估计图。介于此,本文从工程角度做出剖析与分享。当然,有错误之处请指出。
原创
发布博客 2024.10.11 ·
1016 阅读 ·
10 点赞 ·
0 评论 ·
10 收藏

深度图可视化显示(kitti)

kitti数据是一个通用数据,有关kitti的深度图像内容我已有博客介绍。这里,我将给出一个工具,用于显示深度值对应像素坐标再图像上,也给出深度值可视化显示内容。
原创
发布博客 2024.09.20 ·
634 阅读 ·
5 点赞 ·
0 评论 ·
7 收藏

windows系统visual studio编译器配置opencv库

windows10的opencv的安装opencv配置:包含目录:D:\SOFT\InstallPackage\eigen-3.4.0E:\SOFT\soft_other\opencv4.2\build\includeE:\SOFT\soft_other\opencv4.2\build\include\opencv2库目录:E:\SOFT\soft_other\opencv4.2\build\...
原创
发布博客 2024.09.14 ·
455 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

YOLOV5 onnx推理 python

pip install onnx coremltools onnx-simplifier3.使用onnx-simplier简化模型python-m onnxsim best.onnx best-sim.onnx# coding=utf-8import cv2import numpy as npimport onnxruntimeimport torchimport torc...
原创
发布博客 2024.09.14 ·
479 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

爬虫代码 python

import requestsimport urllibimport osimport timeprint('欢迎使用Aking爬虫图片下载器!')time.sleep(0.5)print('欢迎使用Aking爬虫图片下载器!!')time.sleep(0.5)print('欢迎使用Aking爬虫图片下载器!!!')time.sleep(0.5)print('准备就绪!'...
原创
发布博客 2024.09.14 ·
786 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏
加载更多