沉迷单车的追风少年
CSDN博客专家,CSDN商业化专家,官方内容合作伙伴,官方认证“人工智能领域优质创作者”,入选2023年中国开发者影响力年度榜单。
代表专栏《Diffusion Models与深度学习》、《手把手写深度学习》、《深度学习-计算机视觉》、《手把手写C++服务器》等。
展开
-
OSError: Can‘t load tokenizer for ‘facebook/wav2vec2-large-xlsr-53‘. If you were trying to load it
在使用facebook/wav2vec2-large-xlsr-53进行音频编码时,遇到了无法加载分词器的问题,错误提示为OSError: Can't load tokenizer for 'facebook/wav2vec2-large-xlsr-53'。原创 2025-05-21 20:09:15 · 132 阅读 · 0 评论 -
ValueError: Expected more than 1 value per channel when training, got input size torch.Size([1, 512]
在 PyTorch 中,批归一化(Batch Normalization,简称 BatchNorm)层在不同模式下(训练模式和测试模式)会有不同的行为。含有nn.BatchNorm1d(512) 网络的训练和测试。,并使用这些统计量来归一化输入数据。在训练模式下,批归一化层会。计算均值和方差,而是使用。在测试模式下,批归一化层。原创 2025-04-18 08:30:00 · 701 阅读 · 0 评论 -
from psbody.mesh import MeshModuleNotFoundError: No module named ‘psbody‘
DiffposeTalk复现。原创 2025-03-08 16:52:49 · 349 阅读 · 0 评论 -
如何在无图形化界面的服务器上下载百度网盘的超大文件(10GB以上)?
登录百度网盘账号进入特定的文件夹下载完整教程原创 2025-03-04 20:23:58 · 377 阅读 · 0 评论 -
解决 ffmpeg “Unknown encoder ‘hevc_nvenc‘“
ffmpeg 剪切视频。原创 2024-12-31 21:00:00 · 583 阅读 · 1 评论 -
NotImplementedError: Cannot copy out of meta tensor; no data! Please use torch.nn.Module.to_empty()
使用huggingface transformers/diffusion from_pretrained() 时报错,二次开发模型的时候报错。这是因为在用预训练模型进行二次开发的时候,自己新增了一些模块。原创 2024-12-25 20:45:00 · 1044 阅读 · 0 评论 -
扩散模型经典问题:在Image-to-Image或Image-to-Video任务中,如何尽可能地保持住原始输入Image的特征?
在Image-to-Image或Image-to-Video任务中,如何尽可能地保持住原始输入Image的特征?你知道有哪些经典方法?这些方法各有什么优缺点?原创 2024-12-23 20:45:00 · 667 阅读 · 1 评论 -
解决Failed to build tinycudann building ‘tinycudann_bindings._80_C‘ extension
安装 tiny-cuda-nn。原创 2024-12-08 11:45:00 · 611 阅读 · 0 评论 -
总结OpenGL和pyrender安装和使用过程中的坑
Google和GPT了很久,大部分方案都没有用!直接运行下面的命令可完美解决!原创 2024-10-25 10:29:26 · 660 阅读 · 1 评论 -
lib/libstdc++.so.6: version `GLIBCXX_3.4.30‘ not found (required by /lib/x86_64-linux-gnu/libLLVM-15
【代码】lib/libstdc++.so.6: version `GLIBCXX_3.4.30' not found (required by /lib/x86_64-linux-gnu/libLLVM-15。原创 2024-10-25 08:00:00 · 1456 阅读 · 0 评论 -
解决:__init__() got an unexpected keyword argument ‘logging_dir‘
复现diffuser的dreambooth、lora等finetune方法。原创 2024-10-05 07:45:00 · 200 阅读 · 1 评论 -
解决OpenCV保存视频 视频全部为绿色的bug
使用OpenCV-Python 保存视频,视频为numpy array格式,保存的视频全部为无意义的绿色。原创 2024-10-03 08:00:00 · 539 阅读 · 1 评论 -
RuntimeError: Couldn‘t clone Stable Diffusion.
安装stable diffusion webui原创 2024-09-29 07:45:00 · 487 阅读 · 1 评论 -
【保姆级教程】批量下载Pexels视频Python脚本(以HumanVid数据集为例)
这个链接地址就是原视频的链接地址了,因此可以直接wget下载,也可以用response下载。那么用脚本如何批量下载呢?原创 2024-09-28 07:45:00 · 421 阅读 · 1 评论 -
解决huggingface下载时Username/Password Authentication Failed.问题
解决huggingface下载时Username/Password Authentication Failed.问题原创 2024-08-30 15:55:42 · 1371 阅读 · 2 评论 -
解决assert isinstance(model, ModelWrapper), “Please boost the model before saving!“
使用colossalai训练模型。原创 2024-08-23 11:27:56 · 289 阅读 · 1 评论 -
AAAI Reproducibility Checklist Latex 模板
AAAI-25 Reproducibility Checklist - AAAIThis paper:Does this paper make theoretical contributions? (yes/no)If yes, please complete the list below.Does this paper rely on one or more datasets? (yes/no)If yes, please complete the list below.Does this paper i原创 2024-08-15 10:22:42 · 917 阅读 · 1 评论 -
【原创】下载RealEstate10K数据集原始视频的方法
目前互联网上能搜到下载RealEstate10K数据集原始视频的方法都已经不能用了,这篇博客介绍一种目前可用的下载RealEstate10K数据集原始视频的方法,并给出自动化的脚本代码。原创 2024-08-05 15:00:03 · 1273 阅读 · 12 评论 -
从Overleaf上导出Latex论文发布到arxiv详细教程(常见问题与解决)
如果是做cv的论文请选择“Computer Vision and Pattern Recognition”,选择“Artificial Intelligence”可能会被on hold,貌似这个指的是传统的人工智能?我用公司邮箱注册发布一篇论文,一个多月还是“on hold”状态,换成edu邮箱第二天就被发布了。3、有可能是subject class选错了,编辑会帮你手动选择,然后发一封邮件告知你解除……报错缺失bbl等文件,这是因为从Menu中下载的话,是没有bbl文件的。论文被on hold。原创 2024-06-04 11:42:28 · 2204 阅读 · 2 评论 -
每日AIGC最新进展(9):定制化多主题文本到视频的生成、3D动漫角色生成、具有多种几何形状和纹理细节的3D高斯引导服装合成
特别地,在动漫角色头部重建任务中,NOVA-3D平均在SSIM、LPIPS和PSNR指标上取得了94.453、7.726和19.575的高分,验证了该方法的有效性。通过全面的定性和定量实验,验证了GarmentDreamer的有效性,并展示了其在与现有最先进方法相比时的优越性能。此外,还进行了消融研究,突出了关键组件在管道中的作用,如孔损失(Hole Loss)和法线损失(Normal Loss)对于生成具有清晰开口和无噪声表面的服装网格至关重要。本文提出了一种名为NOVA-3D的新框架,原创 2024-05-24 07:45:00 · 125 阅读 · 2 评论 -
视觉算法岗(AIGC方向)求职经验分享
博主的个人求职经验分享,原载于同名知乎专栏(24届视觉算法岗(AIGC方向)秋招经验分享 - 知乎),希望对读者们有所帮助。原创 2024-05-13 11:42:57 · 1328 阅读 · 2 评论 -
我们真的需要5G吗?再读《5G将是一个彻底的失败通信技术》
2018年开始大规模装备5G设备,因此2018年被称为5G元年。一般5G基站的寿命为8年左右,如今很多5G基站的寿命已经过去了一半。我国在5G投资约为1.2万亿,而2021年军费为1.35万亿,5G的投资费用之高,已接近军费。5G商用四年过去了,他给我们生活带来了多少改变呢?原创 2024-05-10 13:55:40 · 993 阅读 · 2 评论 -
2023年腾讯暑期实习 笔试原题与答案解析
试卷名称:腾讯2023实习生招聘-技术研究考试时间:(北京时间)2023-03-26 20:00:00 -- 22:00:00考试时长:120分钟。原创 2024-05-07 14:01:11 · 384 阅读 · 4 评论 -
解决 raise GatedRepoError(message, response) from ehuggingface_hub.utils._errors.GatedRepoError: 401
复制刚才的tokens,然后在服务器上登陆,输入刚才复制的tokens即可。细看报错信息,说的是模型没有权限,因为有些模型需要权限申请才能下载。从huggingface中下载模型。原创 2024-05-04 08:45:00 · 881 阅读 · 2 评论 -
【国内专供】如何不使用代理服务从hugging face上下载大模型/大型数据集?
中国大陆的朋友会发现hugging face经常无法访问了,特别是在服务器上下载模型,如果先在电脑上下载完再传输到服务器上,对于大模型来说会非常麻烦,这篇博客一共提供了三种有效的方法不使用代理服务从hugging face上下载大模型,帮助读者丝滑下载模型。原创 2024-05-01 09:30:00 · 3755 阅读 · 2 评论 -
PyTorch DataLoader 报错 Segmentation fault (core dumped) 的原因及解决方案
其他出core的方法都可以通过这个方法来排查,查看出core的具体原因。这里是因为torch的版本和CUDA的版本不匹配导致的错误。Pytorch DataLoader 读取数据。原创 2024-04-28 10:54:13 · 2007 阅读 · 2 评论 -
解决PaddleOCR 切换到本地模型权重路径时的结果乱码问题
PaddleOCR 切换到本地模型权重路径时的结果乱码问题。原创 2024-04-14 23:06:24 · 498 阅读 · 2 评论 -
解决:cannot import name ‘FLAX_WEIGHTS_NAME‘ from ‘transformers.utils‘
stable diffusion相关原创 2024-04-07 10:57:25 · 289 阅读 · 1 评论 -
代码讲解:如何把3D数据转换成旋转的视频?
这里以shapenet数据集为例,通过代码讲解如何把3D数据转换成旋转的视频?原创 2024-03-10 14:55:26 · 949 阅读 · 2 评论 -
解决gradio中Button.click长时间没有返回的问题
其他部分的代码不重要,重要的是我在trainer.run函数当中执行了我的模型训练逻辑,然后……就一直卡在返回的地方……我猜测是launch姿势不正确,造成了阻塞,导致事件的信号一直等待结束,没有返回。如果把模型训练的逻辑注释掉,能正常返回!原创 2023-12-24 23:59:57 · 990 阅读 · 2 评论 -
解决飞书文档导出word后公式乱码/不可显示问题
飞书文档导出为word:但是公式会出现在word中无法显示、乱码等问题。原创 2023-12-18 07:45:00 · 2413 阅读 · 6 评论 -
解决ModuleNotFoundError: No module named ‘diffusers.models.cross_attention‘
diffusers库中一个常见的问题原创 2023-09-20 20:06:59 · 5219 阅读 · 2 评论 -
更快更强更稳定:腾讯向量数据库测评
腾讯云向量数据库的HNSW 索引都可以达到99%以上的召回率,QPS大约在13800以上,开源的向量数据库Faiss、Elasticsearch等在同等测试条件下,QPS都不超过4000,所以腾讯云向量数据库取得了至少3倍以上的性能提升。例如向量聚类:根据给定的相似度度量,将数据库中的向量分类,例如根据图片的内容或风格,将图片分成不同的主题。腾讯云向量数据库单索引支持10亿级向量数据规模,在同等向量维度下和数据量级下,相比于开源向量数据库有极大的性能提升,博主在下一节也亲手测试体验了强悍的性能表现。原创 2023-09-09 11:24:42 · 7340 阅读 · 7 评论 -
使用Git上传大文件模型(超过100MB)教程
如果你发现有的文件没有按照预期的格式写在.gitattributes文件中,直接修改.gitattributes文件,然后再把.gitattributes文件push即可。这里的意思很好懂,简单解释一下,例如下面这句,意思是将.7z结尾的文件用lfs上传,如果模型超过100MB会被服务器直接拒绝!原创 2023-07-13 09:49:01 · 720 阅读 · 2 评论 -
huggingface_hub.utils._errors.LocalEntryNotFoundError: Connection error, and we cannot find the
huggingface_hub diffuser stable diffusion 训练原创 2023-07-10 14:01:24 · 3442 阅读 · 2 评论 -
AI无处不在,科技改变生活:开放原子全球开源峰会参会感悟
2023年开放原子全球开源峰会目前中国源代码贡献量已达到世界第二,开源软件开发者数量也已突破800万,居全球第二。在众多开发者的关注下,2023年开放原子全球开源峰会在北京隆重举办。各大开源领军企业都拿出了自己的“看家本领”,有阿里巴巴的龙蜥社区,有华为云的CCE Turbo,有腾讯云的TDSQL,有百度的XuperChain……但是最吸引我的是英特尔的展台和软硬协同开源论坛。英特尔的开源之路本次峰会的Intel展台。原创 2023-06-17 10:23:47 · 13783 阅读 · 6 评论 -
fatal: 无法访问 ‘https://github.com/huggingface/diffusers/‘ error: subprocess-exited-with-error
安装diffuser fatal: 无法访问 ‘https://github.com/huggingface/diffusers/‘ error: subprocess-exited-with-error原创 2023-06-12 10:53:42 · 2247 阅读 · 4 评论 -
更快更稳更优质:华为云CDN下载加速解决方案测评
在信息化时代,从互联网中获取各类软件、电影、游戏内容是我们网上冲浪的基本需求,在用户对相关内容下载的过程中,经常遇到下载速度慢、下载失败等问题,给用户带来了极差的体验,这会影响内容提供方企业的品牌口碑,甚至会让企业大量用户流失,让企业遭受无谓的损失。为此,华为云CDN下载加速服务应运而生,为企业加速域名下的静态内容提供快速稳定的加速服务,显著提升企业用户下载体验。原创 2023-03-27 10:31:55 · 5493 阅读 · 8 评论 -
技术满满的开源盛宴—OceanBase开发者大会参会体验
九点半,开发者大会准时开始!第一个上台的是OceanBase的首席科学家阳振坤,阳老师分享了"我眼中的数据库",从数据库的发展历史娓娓道来,传统的分库分表型数据库已经无法满足日益增长的业务需求,OceanBase4.0采用的单机分布式一体化架构设计,以业务为中心,让数据库适应于业务,能够很好地适应业务高速发展。只有这样才能打破了单机与分布式之间的界限,将二者的优势融为一体,实现更低的部署成本和运维复杂度,灵活满足不同应用场景需求,让更多的成长型企业有机会低成本享受分布式数据库的高性能。原创 2023-03-26 15:13:33 · 3214 阅读 · 13 评论 -
解决:tools\caffe\CMakeFiles\caffe2ncnn.dir\build.make(62) : fatal error U1033: 语法错误: 意外的“::”Stop.
我一开始使用的VS2017环境,会出现这个报错。折腾了一圈之后无法解决。卸载VS2017后,重新安装安装VS2019,即可解决。安装、编译ncnn环境。原创 2023-03-06 14:26:54 · 409 阅读 · 6 评论