YOLOv8模型的简单测试,Windows环境下安装部署(Python+PyTorch+Conda+cpu+CLI)

一、概述

先记录下时间 [2024-3-31]

本文讲述的是在Windows系统下YOLOv8模型的简单应用。从零开始,使用YOLOv8模型进行图片/视频预测,并得到结果。本文使用的是cpu版本(不需要N卡),方式为命令行界面CLI,在cmd中运行。后续会记录下在Python环境中进行测试,感兴趣的朋友可以期待一下哦。

这里附带上YOLOv8官方文档,里面记载了详细的使用方法,如果觉得看文档比较麻烦的话,可以直接看文章,需要用到的部分已经在文章中进行了摘录。

需要搭建的环境(下文会讲述)清单:

  • miniconda3
  • Python 3.9(>=3.8即可)
  • PyTorch 1.13.1(>=1.8即可)

二、安装conda

安装conda主要的操作是:1. 下载安装包;2. 安装

这里提供了 2 种安装方式:1. 官网;2. 清华源


1. 官网下载

官网下载,点击这里,但是它加载的速度很慢。

如下图所示,下载Python 3.9版本的Miniconda3即可。

在这里插入图片描述


2. 清华大学开源软件镜像站

如果官网打不开的话,点击这里,可以在这个镜像站下载。

小技巧:按住Ctrl+F可以进行网页内容搜索,超级方便!

下载如图所示版本即可

在这里插入图片描述


3. 安装注意事项

经过上一步骤,我们已经下载了Miniconda3的安装包,接下来进行安装。注意:安装路径不要出现中文。

安装过程基本上只要默认下一步下一步就行,如果不想自己去配置系统环境的话,就勾选第二项(如下图):Add to PATH

然后Install,安装即可。

在这里插入图片描述


如果忘记勾选的话,可以去系统环境中自行添加。

Windows11下的操作路径是:设置–>系统–>系统信息–>高级系统设置–>高级–>环境变量–>PATH,找到之后新建,把需要的路径添加进去即可。添加完后一路点击确定,一定要点到最后一个确定,否则很有可能没有添加进去。最后注意cmd刷新。


注意:路径写实际电脑上安装的位置,每个人都不一样,不要照抄。

在这里插入图片描述


4. 安装完成测试一下

按住win+r打开cmd,检查python环境

# 输入命令  python --version
# 输完命令之后按下回车(后面输完命令都要)
# 如果搭建完毕,系统会返回python版本,我们刚刚安装的版本是3.9

C:\Users\32453>python --version

Python 3.9.18

接着检查conda虚拟环境(就是刚刚安装的miniconda3

# 输入命令  conda env list

C:\Users\32453>conda env list

# conda environments:
#
base                     C:\Users\32453\miniconda3

# 其中,base是miniconda3安装好后自带的

三、安装Ultralytics(yolov8)


Ultralytics 提供了多种安装方法,如果你的电脑上安装了git工具,可以直接将仓库克隆到本地。

git clone https://github.com/ultralytics/ultralytics

考虑到部分没有安装git的情况,这里演示直接下载安装包方法。

点击这里,进入网页仓库,点击Code,下载ZIP安装包到本地,然后解压,尽量安装路径不要出现中文

在这里插入图片描述


四、搭建环境,运行YOLOv8模型

接下来,我们新建虚拟环境yolo_test,并在其中搭建模型测试的环境。


1. 创建虚拟环境

conda create -n yolo_test python=3.9
Proceed ([y]/n)? y

# 检查下是否创建成功
C:\Users\32453>conda env list
# conda environments:
#
base                     C:\Users\32453\miniconda3
yolo_test                C:\Users\32453\miniconda3\envs\yolo_test

# 如果yolo_test创建有问题,或者想要重新创建的话,
# 就找到yolo_test存放的位置(一个名为yolo_test的文件夹),删除该文件夹即可。

2. 激活Conda环境

conda activate yolo_test

# 激活成功后进入该环境
(yolo_test) C:\Users\32453>

3. 配置清华源镜像

升级 pip 到最新的版本 (>=10.0.0) 后进行配置:

想了解更多,点击这里

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

4. 安装PyTorch

进入官网,在里面找合适的版本,文中使用的是Windows下的CPU only版本,没有特殊要求的话,直接复制安装即可。

pip install torch==1.13.1+cpu torchvision==0.14.1+cpu torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cpu

在这里插入图片描述


5. 进入ultralytics-main目录

找到我们刚刚安装的Ultralytics的根目录ultralytics-main,在yolo_test环境中进入该目录。

然后在该目录下,以可编辑模式安装一些包,从而进行开发。

# cd ultralytics-main文件夹的路径
(yolo_test) C:\Users\32453>cd C:\Repo\Projects\Python\ultralytics-main

(yolo_test) C:\Repo\Projects\Python\ultralytics-main>pip install -e .

6. 重置yolo(非必要)

如果之前有其他项目使用过yolo,可能会导致YOLOv8训练时生成的runs文件不在项目根目录中而在其他项目路径中的问题。

解决办法是重置一下:

yolo settings reset

7. 查看官方文档

通过查看Ultralytics官方文档可知,我们可以使用yolov8n.pt模型对jpg图像、以及mp4视频进行预测。(这里只是举个例子,并不是说其他的不行)

在这里插入图片描述


8. 预测图片

ultralytics-main/ultralytics/assets文件夹下图片bus.jpg为例:

yolo predict model = yolov8n.pt source=ultralytics/assets/bus.jpg

# 反馈结果 Results saved to为预测结果保存的路径
image 1/1 C:\Repo\Projects\Python\ultralytics-main\ultralytics\assets\bus.jpg: 640x480 4 persons, 1 bus, 1 stop sign, 277.2ms
Results saved to runs\detect\predict

在该文件夹中进行查看

在这里插入图片描述


9. 预测视频

预测视频同理,下载一段视频保存在ultralytics-main/ultralytics/assets文件夹下,视频格式为mp4

运行,然后查看结果:

yolo predict model = yolov8n.pt source=ultralytics/assets/dy.mp4

根据提示找到识别结果:

注意:视频素材来源于网络,仅用于测试演示。

在这里插入图片描述


五、总结


通过本文,我们能使用CLI的方式运行yolov8n.pt模型,对图像和视频进行目标识别,并得到结果。


一些参考资料:

YOLOv8官方文档:https://docs.ultralytics.com/zh/
Anaconda官网:https://docs.anaconda.com/free/miniconda/miniconda-other-installer-links/
清华大学开源软件镜像站:https://mirrors.tuna.tsinghua.edu.cn/anaconda/miniconda/
PyTorch官网:https://pytorch.org/get-started/previous-versions/

  • 31
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 12
    评论
### 回答1: PythonPyTorch是用于语音识别的两个重要工具。Python是一种高级编程语言,具有易学易用、灵活多变、开源免费等优点,被广泛应用于人工智能、机器学习等领域。PyTorch是一个基于Python的科学计算库,主要用于深度学习和神经网络的构建和训练。在语音识别领域,PythonPyTorch可以结合使用,通过搭建深度学习模型实现语音识别任务。 ### 回答2: PythonPyTorch语音识别是一种基于深度学习和人工智能技术的语音识别方法,它能够将人类语音转换为文本数据。这种技术已经得到了广泛的应用,应用领域涵盖语音识别系统、自动翻译、智能交互等多个领域。 Python语言是一种简单易用、高效性能和广泛应用的编程语言。它的优点是语法简洁,可读性强,支持面向对象和函数式编程,同时还有完善的第三方库和工具支持。这使得Python成为了开发深度学习技术的首选语言之一。 PyTorch是Facebook推出的深度学习框架之一,它具有易于使用、灵活和可扩展性强等特点。PyTorch提供了一系列用于实现深度学习模型的API,并且支持自定义开发,这使得PyTorch成为了深度学习开发者的首选框架之一。 在语音识别方面,PythonPyTorch可以有效结合,通过PyTorch的API可以实现深度学习模型的开发,而Python的第三方库和工具可以对语音识别系统进行扩展和应用。 总的来说,PythonPyTorch结合的语音识别系统具有模型灵活、易于使用、丰富的应用场景等特点。因此,这种技术有望成为未来语音识别系统发展的一大趋势,将得到越来越广泛的应用。 ### 回答3: Python pytorch语音识别是一项基于深度学习算法的语音识别技术。在实现语音识别的过程中,pytorch是一个很好的选择,因为它提供了简单、灵活、可扩展的框架,且易于使用pytorch语音识别的基础是声音的数学表示,即将声音信号转化为数字信号。它是基于一种神经网络的深度学习算法,通过多次训练,在大量数据上进行权重调整,最终实现从声音信号到语音文本的转换。 在pytorch框架下,通常使用的语音识别模型是CTC、Attention和Transformer。其中,CTC模型是传统的深度学习模型,通过输出每个音素的概率,使用贝叶斯公式对音素序列进行解码;Attention模型是针对CTC模型的改进,更加关注每个时间步的输入,因此在语音识别中表现更加出色;而Transformer模型是一种新兴的模型,可以获得更好的性能和更短的训练时间。 此外,在pytorch语音识别中,常用的数据集是Librispeech、Common Voice、TED-LIUM和Aurora-4等。这些数据集提供了一系列简单到复杂的语音识别任务,可供研究者和开发人员进行模型优化和性能测试。 总的来说,Python pytorch语音识别是一项高效、准确、可扩展的语音识别技术,可以在多种应用场景中得到广泛应用,如电子助手、智能客服、语音翻译等。随着深度学习技术的不断发展和优化,相信pytorch语音识别模型将会在未来的语音识别领域中发挥越来越重要的作用。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值