一、项目介绍
在网络程序设计课程中,我们在孟宁老师的带领下进行了一个关于血常规检验报告OCR识别、深度学习与分析的项目的开发。主要内容是从血常规检验报告的图片识别出年龄、性别及血常规检验的各项数据,然后显示到前端,其中还要利用神经网络等机器学习技术构建模型对这些数据进行分析,预测年龄和性别。
1.安装运行方法
运行环境
# 安装numpy,
sudo apt-get install python-numpy # http://www.numpy.org/
# 安装opencv
sudo apt-get install python-opencv # http://opencv.org/
#安装OCR和预处理相关依赖
sudo apt-get install tesseract-ocr
sudo pip install pytesseract
sudo apt-get install python-tk
sudo pip install pillow
# 安装Flask框架、mongo
sudo pip install Flask
sudo apt-get install mongodb # 如果找不到可以先sudo apt-get update
sudo service mongodb started
sudo pip install pymongo
# 安装PIL
sudo apt-get install python-imaging
# 安装Tensorflow
pip install --upgrade https://storage.googleapis.com/tensorflow/linux/cpu/tensorflow-0.12.0rc0-cp27-none-linux_x86_64.whl
#安装Tensorflow报错有可能需要安装JDK8,以及升级pip
#安装JDK8 (ubuntu14.04)
sudo add-apt-repository ppa:webupd8team/java
sudo apt-get update
sudo apt-get install oracle-java8-installer
升级pip
pip install --upgrade pip
运行
# \np2016\BloodTestReportOCR
cd BloodTestReportOCR
# 运行 view.py
python view.py
# 在浏览器打开http://yourip:8080
2.项目演示
1.运行view.py
2.打开浏览器,访问localhost:8080
3.点击Browse选择体检报告图片
4.点击提交,在下方会显示图片。若图片上没有我们的目标或存在拍摄不全等情况时,系统会提示图片不合格。
5.点生成报告,系统将识别出的体检数据显示在下方。
6.点击predict,系统通过机器学习算法构建的模型对上述体检数据进行分析,预测体检人的年龄和性别。