![](https://img-blog.csdnimg.cn/20190927151124774.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
人工智能&深度学习&机器学习
文章平均质量分 84
本专栏主要发布有关人工智能和深度学习相关的文章
人工智能(Artificial Intelligence),英文缩写为AI。 [21]是新一轮科技革命和产业变革的重要驱动力量, [23]是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
技术瘾君子1573
十年磨一剑,经过长时间理论与实践的结合,旨在记录分享实用技术经验,常言道:授人以鱼不如授人以渔。因此本人将从硬件到操作系统再到具体应用,涉及服务器、存储、网络、操作系统、云计算大数据、容器、人工智能、HPC等众多领域的知识分享,您的关注就是我最大的动力,加油!
展开
-
glm-4v-9b_pytorch多模态OCR大模型
GLM-4V-9B 具备 1120 * 1120 高分辨率下的中英双语多轮对话能力,在中英文综合能力、感知推理、文字识别、图表理解等多方面多模态评测中,GLM-4V-9B 表现出超越 GPT-4-turbo-2024-04-09、Gemini 1.0 Pro、Qwen-VL-Max 和 Claude 3 Opus 的卓越性能。原创 2024-07-09 11:15:19 · 573 阅读 · 1 评论 -
conformer_pytorch语音识别和自然语言处理任务算法模型
Conformer模型是一种结合了Transformer的自注意力机制和卷积神经网络的模型结构,用于语音识别和自然语言处理任务,具有时域和频域特征的建模能力。原创 2024-07-09 17:00:00 · 182 阅读 · 0 评论 -
vgg16_mmcv图像分类算法模型
VGG模型是2014年ILSVRC竞赛的第二名,第一名是GoogLeNet。但是VGG模型在多个迁移学习任务中的表现要优于GoogLeNet。而且,从图像中提取CNN特征,VGG模型是首选算法。原创 2024-07-08 16:58:49 · 124 阅读 · 0 评论 -
video_migraphx视频类的目标检测推理模型
YOLOV7是2022年最新出现的一种YOLO系列目标检测模型,该模型的网络结构包括三个部分:input、backbone和head。原创 2024-07-08 11:15:03 · 376 阅读 · 0 评论 -
codeformer_pytorch 人脸修复&图形超分算法模型
codeformer可用于人脸修复原创 2024-07-06 19:32:33 · 965 阅读 · 0 评论 -
vision-transformers-cifar10_pytorch图像分类算法模型
Vision Transformer先将图像用卷积进行分块以降低计算量,再对每一块进行展平处理变成序列,然后将序列添加位置编码和cls token,再输入多层Transformer结构提取特征,最后将cls tooken取出来通过一个MLP(多层感知机)用于分类。原创 2024-07-09 05:45:00 · 149 阅读 · 0 评论 -
vit_migraphx 图像分类算法模型
Vision Transformer先将图像用卷积进行分块以降低计算量,再对每一块进行展平处理变成序列,然后将序列添加位置编码和cls token,再输入多层Transformer结构提取特征,最后将cls tooken取出来通过一个MLP(多层感知机)用于分类。原创 2024-07-04 18:45:00 · 281 阅读 · 0 评论 -
video_tvm目标检测算法模型
YOLOV7是2022年最新出现的一种YOLO系列目标检测模型,该模型的网络结构包括三个部分:input、backbone和head。原创 2024-07-03 11:47:01 · 289 阅读 · 0 评论 -
video_onnxruntime目标检测算法模型
YOLOV7是2022年最新出现的一种YOLO系列目标检测模型,该模型的网络结构包括三个部分:input、backbone和head。原创 2024-07-08 00:00:00 · 305 阅读 · 0 评论 -
TensorFlow在AI并行计算集群环境上安装与使用
本文主要介绍在GPU环境中如何安装tensorflow框架及使用框架提交推理和训练任务原创 2024-07-02 08:19:45 · 629 阅读 · 0 评论 -
animatediff_pytorch AIGC 文本转为动图算法模型
(Encoder,用于压缩原始图像),Base T2I(文本生成图像模型,如Stable Diffusion),Motion Modeling Module(运动模型模块),Personalized T2I(个性化图像生成模型,如使用DreamBoth训练得到的模型),(Decoder,用于恢复/生成图像)。原创 2024-07-07 16:30:00 · 482 阅读 · 1 评论 -
yolov3_migraphx目标检测算法模型
YOLOV3是由Joseph Redmon和Ali Farhadi在2018年提出的单阶段目标检测模型,主要用于自然场景的目标检测。原创 2024-07-07 00:00:00 · 474 阅读 · 0 评论 -
PyTorch在AI并行计算集群上部署与使用
本文主要介绍pytorch的作用、优势等,源码编译的几种方式以及安装完成使用框架提交训练或推理任务,原创 2024-07-06 06:15:00 · 797 阅读 · 0 评论 -
人工智能AI介绍及常用软件在国产化平台的支持情况
本文主要对人工智能AI相关概念做简单介绍以及常用软件在国产化平台的支持情况原创 2024-07-05 08:04:19 · 924 阅读 · 0 评论 -
并行编程-CUDA程序设计
本文主要介绍CUDA安装、CUDA编译流程、CUDA程序Makefile的编写、CUDA程序Makefile的编写、整体流程、CUDA线程模型、编程举例等内容原创 2024-07-01 09:53:48 · 853 阅读 · 0 评论 -
MIGraphX图形推理引擎如何在国产海光DCU AI集群安装使用
本文主要介绍MIGraphX框架如何在国产海光DCU 深算AI集群上部署与使用原创 2024-07-06 00:00:00 · 1051 阅读 · 0 评论 -
百度PaddlePaddle深度学习平台如何在国产海光DCU AI并行计算集群上部署使用?
本文主要介绍百度PaddlePaddle深度学习框架平台在国产海光DCU AI 并行计算集群的部署安装原创 2024-06-30 19:47:34 · 1397 阅读 · 0 评论 -
使用10万张nvidia H100 GPU卡的OpenAI大模型GPT-4 计算集群有多难搭?
在英伟达市值猛涨、各家科技巨头囤芯片的热潮中,我们往往会忽视GPU芯片是如何转变为数据中心算力的。最近,一篇SemiAnalysis的技术文章就深入解读了10万卡H100集群的构建过程。转载 2024-06-29 23:10:29 · 72 阅读 · 0 评论 -
yi_lmdeploy 对话问答算法模型
Yi系列模型结构与llama结构基本一致,以 Transformer 架构为基础:原创 2024-07-05 06:30:00 · 430 阅读 · 1 评论 -
photomaker_pytorch AIGC生成包含输入人物特征的图像算法模型
该模型主要包含Image Encoder用于对图像进行编码以获取相应的Embedding,在CLIP的Image Encoder基础上增加了额外的映射层,用于改变Embedding的维度;Text Encoder用于对Prompt进行编码以获取相应的Embedding;MLP用于融合class word embedding(图中蓝色方块)与每一个Image Embedding;Stacked ID Embedding由MLP生成的Embedding拼接得到;Updated Text Embedding是将c原创 2024-06-29 08:58:23 · 299 阅读 · 0 评论 -
instantid_pytorch AIGC算法模型
该模型主要结构为Stable Diffusion,并使用IdentityNet(提取面部特征),IPA(Porjection + FaceEmbedding + Cross Attention,获取面部prompt)以及Text Encoder + Text Embedding + Cross Attention(获取文字prompt)的输出作为Unet的控制条件。原创 2024-07-04 00:00:00 · 836 阅读 · 0 评论 -
flavr_pytorch图像超分算法模型
FLAVR是一种用于视频插值的深度学习模型,可以通过插值技术将低帧率视频转换为高帧率视频。它通过对低帧率视频进行逐帧处理,并使用深度学习网络来推断丢失的帧,以生成更平滑的高帧率视频。相原创 2024-07-03 14:00:00 · 518 阅读 · 0 评论 -
chatglm3_fastllm 对话问答算法模型
ChatGLM3 是智谱AI与清华大学KEG实验室联合发布的新一代对话预训练模型原创 2024-07-02 06:30:00 · 363 阅读 · 0 评论 -
repvit-optimize_pytorch图像分类算法模型
RepViT在iPhone 12上以1ms的延迟实现了超过80%的top-1准确率,本算法基于RepViT进一步优化后准确率超过82%。原创 2024-06-27 21:00:00 · 359 阅读 · 0 评论 -
repvit_pytorch图像分类算法模型
RepViT在iPhone 12上以1ms的延迟实现了超过80%的top-1准确率,为当前多个SOTA实例分割算法的backbone。原创 2024-06-27 15:05:57 · 323 阅读 · 0 评论 -
wenet_onnxruntime语音识别算法模型
WeNet是一种hybird连接主义时间分类(CTC)/注意力架构,以transformer或conformer作为编码器和注意力解码器来重新存储CTC假设。为了在统一的模型中实现流和非流,以及使用了一种基于动态块的注意力策略,该策略允许自注意力以随机长度集中在正确的上下文上。原创 2024-07-01 14:30:00 · 889 阅读 · 0 评论 -
vit_pytorch图像分类算法模型
ViT是一种新的基于Transformer应用于计算机视觉领域的神经网络模型,基于PyTorch实现测试,Vision Transformer先将图像用卷积进行分块以降低计算量,再对每一块进行展平处理变成序列,然后将序列添加位置编码和cls token,再输入多层Transformer结构提取特征,最后将cls tooken取出来通过一个MLP(多层感知机)用于分类。原创 2024-06-30 11:30:00 · 243 阅读 · 0 评论 -
yolox_mmcv模板检测算法模型
YoloX由旷视科技开源,通过对检测头解耦,样本匹配,训练策略等多个方面进行了改进,从而提升了模型性能和收敛速度原创 2024-06-28 15:00:00 · 738 阅读 · 0 评论 -
yolov5_migraphx目标检测算法模型
YoloV5是一种单阶段目标检测算法,该算法在YOLOV4的基础上添加了一些新的改进思路,使其速度与精度都得到了极大的性能提升。原创 2024-06-26 20:45:00 · 429 阅读 · 1 评论 -
yolov5_paddle目标检测算法模型
yolov5是一种基于深度学习的目标检测算法,可以广泛应用于各种计算机视觉和人工智能领域的应用中原创 2024-06-26 02:45:00 · 355 阅读 · 0 评论 -
yolov7-tiny_triton图形分类算法模型
yolov7-tiny triton是用triton框架进行的推理原创 2024-06-25 09:15:00 · 489 阅读 · 0 评论 -
yolov5s_tvm目标检测算法模型
YOLOv5s是一种目标检测模型,是YOLOv5系列中的一个较小版本,基于TVM进行优化原创 2024-06-24 21:00:00 · 382 阅读 · 0 评论 -
yolov7_migraphx目标检测算法模型
YOLOV7是2022年最新出现的一种YOLO系列目标检测模型。原创 2024-06-25 03:00:00 · 234 阅读 · 1 评论 -
yolov8_migraphx单阶段目标检测算法模型
YoloV8是一种单阶段目标检测算法,该算法在YOLOV5的基础上添加了一些新的改进思路,使其速度与精度都得到了极大的性能提升。原创 2024-06-30 11:15:00 · 1534 阅读 · 0 评论 -
anytext_pytorch AIGC 可以用于生成多语言文字图像算法模型
模型由4部分构成,分别是Auxiliary Latent Module,Text Embedding Module,Text-control Diffusion Pipeline以及Text Preceptual Loss。其中,Auxiliary Latent Module可产生3种附加信息用以生成,其中表示字形信息,表示文字的位置信息,表示被遮盖的图像(保留背景信息)。Text Embedding用于生成,表示待生成的文字,表示待生成文字的图像信息,表示OCR识别模型(用于提取文原创 2024-06-24 11:18:43 · 726 阅读 · 1 评论 -
resnet50-v2_tvm图像分类算法模型
ResNet50使用了多个具有残差连接的残差块来解决梯度消失或梯度爆炸问题,并使得网络可以向更深层发展。原创 2024-06-30 06:15:00 · 307 阅读 · 0 评论 -
chatglm_pytorch基于Pytorch框架的chatglm-6b对话问答算法模型
ChatGLM-6B 是清华大学开源的开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。ChatGLM-6B采用Transformer模型结构:原创 2024-06-28 18:30:00 · 576 阅读 · 1 评论 -
Linux并行计算&国产海光DCU深算处理器使用FAQ
DCU常见问题汇总:硬件产品端适配(cpu、加速卡、服务器)虚拟化hyqua/k8s/docker等工具运行环境dtk底层库性能调优深度学习框架/三方库原创 2024-06-28 00:00:00 · 1150 阅读 · 0 评论 -
fastsam-pytorch基于YOLACT方法的实例分割分支的目标检测器模型
FastSAM基于YOLACT方法的实例分割分支的目标检测器YOLOv8-seg,通过仅在SA-1B数据集的2%(1/50)上直接训练该CNN检测器,它实现了与SAM相当的性能。原创 2024-06-18 18:45:00 · 464 阅读 · 1 评论 -
hrnet-pytorch人体姿态估计模型
HRNet是一种新的人体姿态估计模型原创 2024-06-17 18:15:00 · 290 阅读 · 1 评论