碰到第一次接触的技术,我的习惯是先猜测它的实现原理,然后根据资料等再去验证我的猜测,这样对于我来说更容易理解新的技术。昨晚想到图像识别,然后安装了yolo,具体就是下载一些环境安装程序,然后这样在那样
然后一顿操作
./darknet detect cfg/yolov3.cfg yolov3.weights data/dog.jpg
You will see some output like this:
layer filters size input output
0 conv 32 3 x 3 / 1 416 x 416 x 3 -> 416 x 416 x 32 0.299 BFLOPs
1 conv 64 3 x 3 / 2 416 x 416 x 32 -> 208 x 208 x 64 1.595 BFLOPs
.......
105 conv 255 1 x 1 / 1 52 x 52 x 256 -> 52 x 52 x 255 0.353 BFLOPs
106 detection
truth_thresh: Using default '1.000000'
Loading weights from yolov3.weights...Done!
data/dog.jpg: Predicted in 0.029329 seconds.
dog: 99%
truck: 93%
bicycle: 99%
看介绍这个功能用了python和c,我猜它的原理是穿入一张图片,把这张图片分成若干网格,根据每个网格的像素计算图像物种的可能性。不知道我的猜测靠不靠谱?毕竟我是第一次接触yolo,如果有大神了解这个yolo请指出我的错误。话不多说接下来就要验证我的猜测了。有兴趣的继续关注谢谢。
各种疑惑解答不止技术。只要打赏一块钱,包你满意(解惑方式 文章,视频,等)
Great minds think alike