猫先生Mr.Mao
码龄160天
关注
提问 私信
  • 博客:19,536
    视频:1
    19,537
    总访问量
  • 19
    原创
  • 43,167
    排名
  • 542
    粉丝
  • 学习成就

个人简介:AI技术从业者与爱好者,专注于AIGC、计算机视觉、多模态、大模型、AI绘画、AI视频、数字人、边缘智能等前沿科技成果的研究和技术分享!

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2024-06-06
博客简介:

m_aigc2022的博客

查看详细资料
  • 原力等级
    成就
    当前等级
    2
    当前总分
    192
    当月
    7
个人成就
  • 获得410次点赞
  • 内容获得1次评论
  • 获得366次收藏
创作历程
  • 19篇
    2024年
成就勋章
TA的专栏
  • 开源项目
    4篇
  • AIGC
    11篇
  • AI视频
    3篇
  • 魔方AI新视界
    4篇
  • YOLO
    3篇
  • 计算机视觉
    3篇
  • 综述
    2篇
  • LLM大模型
    6篇
兴趣领域 设置
  • 人工智能
    计算机视觉目标检测人工智能智慧城市视觉检测gpt-3AI作画stable diffusionchatgptDALL·E 2AudioLMYOLO
  • AIGC
    AIGCgptllamamidjourneyAI写作
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

175人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

开源项目 | 多模态大模型VideoGPT+:集成图像和视频编码器以增强视频理解

VideoGPT+:结合图像和视频编码器的优点,通过自适应池化策略提升视频理解性能,并在多个基准测试中表现优异。
原创
发布博客 2024.10.29 ·
933 阅读 ·
30 点赞 ·
0 评论 ·
13 收藏

开源项目 | 多模态大模型:Show-o 统一多模态理解和生成

Show-o,能够通过混合自回归和扩散建模同时处理多模态理解和生成任务。
原创
发布博客 2024.10.29 ·
1100 阅读 ·
29 点赞 ·
0 评论 ·
28 收藏

开源项目 | DiffIR2VR-Zero:模糊视频8K高清修复技术

DiffIR2VR-Zero:一种创新的零样本视频恢复技术,该技术利用预训练的图像恢复模型,解决了传统方法在不同场景下泛化能力不足的问题。
原创
发布博客 2024.10.14 ·
698 阅读 ·
31 点赞 ·
0 评论 ·
30 收藏

DiffIR2VR-Zero

发布视频 2024.10.14

开源项目 | 腾讯VTA-LDM:让你的视频自动生成完美音效

在这项工作中,VTA-LDM目标是提供对视频到音频生成范例的见解,重点关注三个关键方面:视觉编码器、辅助嵌入和数据增强技术。
原创
发布博客 2024.10.13 ·
739 阅读 ·
15 点赞 ·
0 评论 ·
15 收藏

AIGC月刊 | 多模态爆发,迅速迈向 AGI(2024.9月第五期)【魔方AI新视界】

【魔方AI新视界】专栏致力于梳理和探索AIGC领域内的创新技术与有影响力的实际应用案例。我们计划以月刊的形式定期发布内容,目的是让读者站在AI时代的最前沿,紧跟时代发展的步伐,自信而坚定地跟随AI技术的最新趋势。此外,猫先生也会根据读者的反馈,持续对专栏内容和版面设计进行更新和改进。我们非常欢迎读者提出宝贵的建议,一起交流和学习,共同推动专栏的完善和成长!💪。
原创
发布博客 2024.10.13 ·
970 阅读 ·
29 点赞 ·
0 评论 ·
12 收藏

Yolo-World | 检测一切模型:高效实时开放词汇目标检测

YOLO-World旨在通过视觉语言建模和大规模数据集的预训练来增强 YOLO 的开放词汇检测功能。
原创
发布博客 2024.09.20 ·
795 阅读 ·
8 点赞 ·
0 评论 ·
25 收藏

YOLOv10:毫秒级实时端到端目标检测开源模型

5月25日凌晨,由清华多媒体智能组开发的YOLOv10发布,毫秒级实时端到端目标检测开源模型。
原创
发布博客 2024.09.20 ·
1154 阅读 ·
18 点赞 ·
0 评论 ·
21 收藏

AIGC月刊 | 大模型/多模态/文生图/AI视频最新技术进展(2024.8月第四期)|【魔方AI新视界】

【魔方AI新视界】专栏致力于梳理和探索AIGC领域内的创新技术与有影响力的实际应用案例。我们计划以月刊的形式定期发布内容,目的是让读者站在AI时代的最前沿,紧跟时代发展的步伐,自信而坚定地跟随AI技术的最新趋势。此外,猫先生也会根据读者的反馈,持续对专栏内容和版面设计进行更新和改进。我们非常欢迎读者提出宝贵的建议,一起交流和学习,共同推动专栏的完善和成长!💪。
原创
发布博客 2024.09.08 ·
1140 阅读 ·
11 点赞 ·
0 评论 ·
27 收藏

综述 | YOLOv10的起源:YOLO系列的十年全面回顾【YOLOv1-YOLOv10】

在本文中,探讨了从初代YOLOv1到最新的YOLOv10模型的发展历程。同时预测,YOLO的发展将向多模态数据处理转变,利用大语言模型和自然语言处理的进步来增强目标检测系统。
原创
发布博客 2024.08.30 ·
1131 阅读 ·
9 点赞 ·
0 评论 ·
13 收藏

综述 | 一文系统性全面了解“人体视频生成”技术:挑战、方法和见解

本综述首次全面回顾了人体视频生成的现状,分析了基于文本、音频和姿势的人体视频生成方法,并讨论常用的数据集和评估指标。最后,讨论了该领域的当前挑战,并提出未来的研究方向。
原创
发布博客 2024.08.16 ·
1038 阅读 ·
16 点赞 ·
0 评论 ·
10 收藏

AIGC月刊 | 技术革新与应用案例(2024.7月第三期)|【魔方AI新视界】

本文是《魔方AI新视界》专栏的第三期,周期为2024年7月1日-2024年7月31日。在本期中,我们将介绍7月份新发布的 AIGC 新技术!!!
原创
发布博客 2024.08.01 ·
1040 阅读 ·
31 点赞 ·
0 评论 ·
18 收藏

LLM大模型基础入门系列之:(六)Tokens 和 Embeddings

本文是LLM大模型基础入门系列的第6篇。在这篇文章中,我们重点介绍LLMs中的Tokens 和 Embeddings!
原创
发布博客 2024.07.21 ·
1240 阅读 ·
16 点赞 ·
1 评论 ·
13 收藏

LLM大模型基础入门系列之:(五)手动求解Transformer

本文是LLM基础入门系列的第5篇。在第3篇和第4篇文章中,详细介绍了Transformer架构,但我觉得有必要从另一个层面再写一篇文章来探讨它,这有助于我们认识并掌握它!
原创
发布博客 2024.07.08 ·
1176 阅读 ·
24 点赞 ·
0 评论 ·
21 收藏

AIGC月刊 | 技术革新与应用案例(2024.6月第二期)【魔方AI新视界】

本文是《魔方AI新视界》专栏的第二期,周期为2024年 6月1日-2024年6月30日。在本期中,猫先生将采用精炼而扼要的语言,对AIGC领域的前沿技术进行介绍,并提供详情链接,以便于您能够进一步探索和学习!
原创
发布博客 2024.07.02 ·
1114 阅读 ·
35 点赞 ·
0 评论 ·
25 收藏

AIGC月刊 | 技术革新与应用案例(2024.5月第一期)|【魔方AI新视界】

本文是《魔方AI新视界》专栏的第一期,周期为2024年5月1日-2024年5月31日。在本期中,猫先生将采用精炼而扼要的语言,对AI领域的前沿技术进行介绍,并提供详情链接,以便于您能够进一步探索和学习。
原创
发布博客 2024.06.30 ·
847 阅读 ·
18 点赞 ·
0 评论 ·
22 收藏

LLM大模型基础入门系列之:(四)从头开始编写LLM代码

从头开始实现一个类 GPT 的 transformer。
原创
发布博客 2024.06.30 ·
1467 阅读 ·
24 点赞 ·
0 评论 ·
24 收藏

LLM大模型基础入门系列之:(三)Transformer 架构

本文是 LLM 基础入门系列的第 3 篇。在本文中,我们将介绍并解释基于 Transformer 的大语言模型的每个步骤。
原创
发布博客 2024.06.27 ·
1007 阅读 ·
11 点赞 ·
0 评论 ·
21 收藏

LLM大模型基础入门系列之:(二)大模型如何工作

读到这里,我相信您需要一段时间才能消化所有信息,特别是对于那些刚接触LLM的人来说。现在我相信我们已经在基本概念和背景信息方面涵盖了足够的基础。现在是我们开始准备构建我们自己的大语言模型的时候了。理论已经讲完了,我们将在下一篇文章中讨论Transformers 架构的关键组成部分。技术交流加入「AIGCmagic社区」群聊,一起交流讨论,涉及 AI视频、AI绘画、Sora技术拆解、数字人、多模态、大模型、传统深度学习、自动驾驶等多个不同方向,可私信或添加微信号:【m_aigc2022。
原创
发布博客 2024.06.20 ·
929 阅读 ·
27 点赞 ·
0 评论 ·
10 收藏

LLM大模型基础入门系列之:(一)什么是大语言模型?

从高层次全面概述大语言模型 (LLM) 的具体含义。
原创
发布博客 2024.06.14 ·
977 阅读 ·
28 点赞 ·
0 评论 ·
17 收藏
加载更多