本文由kaggle上的代码而来,基于CNN实现了肺部数据集的识别。
什么是CNN,其实你并不需要知道它的层逻辑是什么,你只需要知道,它可以用于
图像识别、目标检测、图像生成等问题。
说到这里,大家做这些项目为什么老是动不了手,还有就是动手了没效果,大家一定要尝试换一个方向,不能死磕。就算是别人的代码,你也是需要考虑一些问题的,否则,你自己在怎么做,也没有效果,会对自己产生怀疑。所以要尽量避免这个。
一,首先将一下环境的问题,你要知道python是编译器,而像其他的什么pycharm,vs code,jupyter都是依附与python存在的,python才是他们的底层。
所以在配置环境上,你需要找到适合自己的电脑的python,一般都是用镜像安装,因为官方网站在国外,所以下载起来,超级慢,这里附上国内镜像python的网址。
Index of python-local (huaweicloud.com)
认准下面这个,别下载了盗版。
选择适合的版本号,然后再次点击。
然后需要查看自己的电脑是x64,还是32位的,网上可以搜到,这里就不赘述的。
一般都是下载3.0.0以上的版本,对应自己的系统是win,还是linux,或者其他。
我下在的版本是3.7,window系统,64bit位。
然后需要下载vs code 社区版,直接下载window版本。
进入后,点击这里直接下载后完成安装即可。
二,介绍一下lung X-ray dataset,是在kaggle上开源的数据集,被用于多种方面,但是今天这里只谈它被用于三种形式的识别。
1,数据集网址,也是根据这个实现的项目。如果找不到数据集下载的地方,可以私聊博主。
2,接下来就是根据它写的这篇改为我们需要的论文的方式。如下并且由前端。
3,首先要知道在kaggle上的代码都是jupyter的形式,但是我们不需要那种,所以这里就需要将它改为我们需要的。
3.1,一般开始都是import libraries,这里我们就先将它它需要的库全部导入我们的的创建的文件夹下,如上述所示,一般导入train.py,predict.py,model.py.中,因为他们放在代码的最前面不会影响后续的代码运行,如果带存在的话。导入后,只需要运行,然后看错误,百度一下,找出需要安装的库即可,这里也附上镜像安装库的方式
pip install 库名 -i https://pypi.tuna.tsinghua.edu.cn/simple/
3.2,这里提到一点我遇到卡了很久的错误,就是需要将
from tensorflow.keras import models, layers
#上述这种改为
from tensorflow import keras
from keras import models
3.3完成上述后,已经完成了一大半任务了,后面就需要看懂模块,将他们分别装入model,train,predict中。这里一般推荐使用kimi ai去识别出相应的句段的意思,然后在复制下来装入其中。然后还要舍弃一些不必要的,增加一些必须的,这些可以问ai。
举一个例子,比如下面这段代码,很明显就是需要装入model中去。但是它缺少东西,就是缺少保存模型的代码。这里可以直接问ai,(怎样保存训练的模型),下面是我搜索出来的,不得不说,确实很智能。将这段代码赋值到model中即可,但是还是不完整,这里就需要自己运行看缺少什么东西了,缺少什么补什么。
# 保存模型到HDF5文件
model.save('my_model.h5')
# 如果你只想保存模型结构,不包括权重,可以使用以下命令
# model.save('my_model_structure.h5', include_optimizer=False)
3.4,在完成model,训练出模型,然后在通过train后保存下权重,(权重保存也是需要通过ai来搜索,并且copy到train下)。
# 选择一个文件名来保存权重
weights_filename = 'model_weights.h5'
# 保存权重
model.save_weights(weights_filename)
3.5,训练好权重文件和模型文件后,我们就可以通过着两个文件来写前端界面了,当然还是通过ai来搜索出,然后copy,然后在对应改错。
最终就可以将它变成自己的项目了,下面是运行app.py后再次点击,生成的网址,上传图像后即可得到预测的结果。
这里如果想要作者自己改的这个模型的代码源文件,关注后,后台私信即可。会给相应的数据集还有代码源文件。
如果由不懂的可以在评论区问。