摸爬滚打的包菜
码龄2年
关注
提问 私信
  • 博客:4,830
    4,830
    总访问量
  • 3
    原创
  • 169,522
    排名
  • 31
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:湖南省
  • 毕业院校: 湖南师范大学
  • 加入CSDN时间: 2022-12-28
博客简介:

2203_76099506的博客

查看详细资料
  • 原力等级
    当前等级
    1
    当前总分
    52
    当月
    1
个人成就
  • 获得26次点赞
  • 内容获得14次评论
  • 获得45次收藏
创作历程
  • 3篇
    2024年
成就勋章
兴趣领域 设置
  • Python
    pythondjangopygameflasknumpyscipymatplotlibpipconda
创作活动更多

开源数据库 KWDB 社区征文大赛,赢取千元创作基金!

提交参赛作品,有机会冲刺至高2000元的创作基金,快来参与吧!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

基于Pytorch的猫狗分类的代码演练

这个代码是以tensorflow为框架训练的,由于之前一直没有系统的了解tensorflow框架和Pytorch框架的区别,得着今天闲来无事,了解了一下,顺便看看能不能自己用Pytorch框架来训练猫狗分类的代码。Pytorch主要凭借其动态计算图和用户的易使用性在广大研究中脱颖而出,它以Python为基础,并提供了丰富的工具和接口,使得构建和训练神经网络变得简单快捷。这里一定要注意对图像进行归一化处理,保证每一张图的尺寸都是一样大小的,所以在这里我重新定义了transform1,将图片进行统一的预处理。
原创
发布博客 2024.11.26 ·
324 阅读 ·
5 点赞 ·
2 评论 ·
13 收藏

Paddle安装-过程梳理

这里就涉及到语义匹配的工作。(最开始我没有按照它的官网的步骤,靠着自己的经验去下载安装,结果吃了很多亏。但是我看网上普遍用的是3.8,所以为了保险起见我这里用的是python3.8的版本。但其实在这里块我遇见了很多问题,你要自己用nvidia-smi去看看自己的CUDA version,这里我清楚了蛮多nvcc-V和nvidia-smi之间的区别,大家可以参考这篇博客。然后你就是各种安装包,这里可能再安装paddle会有些复杂,你要根据它报的错误,把那些没有的模块全部安装好,最后才能成功安装paddle。
原创
发布博客 2024.10.02 ·
625 阅读 ·
3 点赞 ·
0 评论 ·
8 收藏

whisper+speaker.diarization.3.1实现根据说话人转文本

whisper模型有好几种,base、medium、large-v1、large-v2,large-v3.我选择的是large-v2,但其实medium的翻译就差不多了,可以满足日常的需要。其实效果最好的是通义听悟,毕竟是阿里做的效果真的非常好,他会对你上传的视频的语音进行分析,不仅能根据说话人进行转录(翻译的准确度非常高)而且还有大模型的辅助,真的强。其实大家要是不想要这么麻烦可以直接调用科大讯飞的API,我感觉效果也挺好的,有各种选择,还能实现实时的转录,真的还不错。这里你可以参考以下这篇博客的内容。
原创
发布博客 2024.07.31 ·
3877 阅读 ·
18 点赞 ·
14 评论 ·
24 收藏