自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

十年以上架构设计经验，专注于软件架构和人工智能领域，对机器视觉、NLP、音视频等领域都有涉猎

智慧医疗探索者 CSDN认证博客专家 CSDN认证企业博客

码龄18年

华为技术有限公司

280: 原创

535: 周排名

2万+: 总排名

113万+: 访问

: 等级

8356: 积分

1万+: 粉丝

4573: 获赞

373: 评论

8930: 收藏

私信

关注

热门文章

分类专栏

最新评论

语音特征提取: 梅尔频谱(Mel-spectrogram)与梅尔倒频系数（MFCCS）
xhaoyixiang: 有两个问题。一是20s音频，25ms一帧，两帧之前有10s重叠，那么有1333帧。二是为什么要zero padding，而不是直接舍弃最后不足一帧的信号？这样效果会不会更好？
计算机视觉之ResNet
wei_shen_me_: RestNet50网络结构conv2_x的第二个bottleneck，最后一个卷积通道应该是256，图上标成512了
基于OpenAI的Whisper构建的高效语音识别模型：faster-whisper
夜猫子_regs: 请问，为什么有时候会输出广告信息，比如：优优独播剧场...
openai多模态大模型：clip详解及实战
『追梦』选手: 强烈推荐，这个视频讲解的 CLIP 讲的挺清晰的 https://www.bilibili.com/video/BV1xM4m1m7vA/?spm_id_from=333.999.0.0&vd_source=c9745e4447536b28b2b0735071d30bd6
AIGC:语音克隆模型Bert-VITS2-2.3部署与实战
神奈川___: 报错了： register_finder(pkgutil.ImpImporter, find_on_path) ^^^^^^^^^^^^^^^^^^^ AttributeError: module 'pkgutil' has no attribute 'ImpImporter'. Did you mean: 'zipimporter'? [end of output] note: This error originates from a subprocess, and is likely not a problem with pip. error: subprocess-exited-with-error × Getting requirements to build wheel did not run successfully. │ exit code: 1 ╰─> See above for output. note: This error originates from a subprocess, and is likely not a problem with pip. 怎么解决啊 .0.0

最新文章

2024

AIGC

关注

文章平均质量分 95

分享AIGC领域的技术、模型等

关注数：文章数：18 文章阅读量：106067 文章收藏量：768

作者: 智慧医疗探索者

浙江大学研究生，专注于后端技术架构和人工智能算法的研究，具有多年大厂工作经验。

展开