最近想研究一下红外图像的对象检测算法,于是先拿TensorFlow对象检测API学习一下。
准备工作
准备工作主要有:
pyenv安装python 3.9.6。
1 | pyenv install 3.9.6 |
创建虚拟环境
在windows系统中,使用如下命令:
1 | # 使用venv |
在Linux系统中,使用如下命令:
1 | # 使用pyenv |
安装ipython,方便测试
1 | # 进入虚拟环境 |
安装tensorflow
安装非GPU版本tensorflow
1 | # 如果没有独立GPU |
安装GPU版本tensorflow
如果机器上有nvidia的显卡,则安装tensorflow的gpu版本,具体步骤如下:
第一步,安装tensorflow-gpu。
1 | # 如果有独立GPU |
第二步,安装CUDA与cuDNN。
- 安装CUDA11.2。CUDA的版本由tensorflow-gpu的版本确定。具体请参考在 Windows 环境中从源代码构建。本步骤在有nvidia独立显卡的前提下执行。
- 安装CUDNN v8.1文件。CUDNN的版本由tensorflow-gpu的版本确定。具体请参考在 Windows 环境中从源代码构建。本步骤在有nvidia独立显卡的前提下执行。
第三步,测试tensorflow能否识别使用nvidia gpu。
1 | import tensorflow as tf |
tensorflow环境测试
1 | # tensorflow环境测试 |
安装TensorFlow Models
下载TensorFlow Models
TensorFlow Model Garden。TensorFlow 模型花园是一个存储库,为 TensorFlow 用户提供了许多不同的最先进 (SOTA) 模型和建模解决方案的实现。我们旨在展示建模的最佳实践,以便 TensorFlow 用户可以充分利用 TensorFlow 进行研究和产品开发。
1 | git clone https://github.com/tensorflow/models |
安装TensorFlow Models中的Object Detection 模块
存在两种安装TensorFlow Models中的Object Detection 模块的方法,如下所示:
- 配置目标检测API目录,以便python能找到object detect api。使用pth文件,将object detect模块的路径添加到python模块的搜索路径中。在python安装目录的Lib\site-packages下创建tensorflow.pth文件,在其中添加Object Detection API文件路径:
1 | # 创建tensorflow.pth文件,输入如下内容 |
- 安装目标检测API。两种方法二选一即可。
1 | # From within TensorFlow/models/research/ |
安装Protobuf,生成python语言的消息协议
安装Protobuf的过程具体参考TensorFlow2.x目标检测API安装配置步骤详细教程 Object Detection API with TensorFlow2.x 。
1 | cd models/research/ |
测试tf object detect api,并安装缺失模块。
1 | # 测试tf object detect api |
开源数据集
数据集是进行深度学习的前提和基础。
Oxford-IIIT 宠物数据集
我们创建了一个包含 37 个类别的宠物数据集,每个类别大约有 200 张图像。这些图像在比例、姿势和照明方面有很大的变化。所有图像都有相关的品种、头部 ROI 和像素级三元图分割的地面实况注释。
具体下载地址请参考Oxford-IIIT 宠物数据集。
COCO数据集
MS COCO的全称是Microsoft Common Objects in Context,起源于微软于2014年出资标注的Microsoft COCO数据集,与ImageNet竞赛一样,被视为是计算机视觉领域最受关注和最权威的比赛之一。
COCO数据集是一个大型的、丰富的物体检测,分割和字幕数据集。这个数据集以scene understanding为目标,主要从复杂的日常场景中截取,图像中的目标通过精确的segmentation进行位置的标定。图像包括91类目标,328,000影像和2,500,000个label。目前为止有语义分割的最大数据集,提供的类别有80 类,有超过33 万张图片,其中20 万张有标注,整个数据集中个体的数目超过150 万个。
COCO数据集使用
请参考COCO数据集使用。
COCOAPI
完整的COCO数据集有十几个G大小,我们没有必要全部下载下来,只需要下载自己感兴趣的类别图像即可。这时就需要使用COCOAPI。
COCO API 协助加载、解析和可视化 COCO 中的注释。API 支持多种注释格式(请参见数据格式页面)。
- 下载cocoapi
1 | git clone https://github.com/cocodataset/cocoapi.git |
- pythonapi安装
进入COCOAPI的PythonAPI文件夹,输入如下命令:
1 | python setup.py build_ext install |
安装错误解决方法请参考错误:cl: 命令行 error D8021 :无效的数值参数“/Wno-cpp”。
模型训练
准备数据集
注解数据集
安装LabelImg工具
LabelImg 是一个图形图像标注工具。它是用 Python 编写的,并使用 Qt 作为其图形界面。
注释以 PASCAL VOC 格式保存为 XML 文件,这是ImageNet使用的格式。此外,它还支持 YOLO 和 CreateML 格式。
可以从LabelImg的官方存储库labelImg中下载最新的LabelImg工具。
使用K折交叉验证分区数据集
可使用python脚本,请参考partition_dataset.py。
创建标签映射
TensorFlow 需要一个标签映射,即将每个使用的标签映射到一个整数值。此标签图用于训练和检测过程。
下面我们展示一个示例标签映射(例如label_map.pbtxt),假设我们的数据集包含 2 个标签,dogs并且cats:
1 | item { |
标签地图文件有扩展.pbtxt名,应该放在training_demo/annotations文件夹内。
创建TensorFlow Records文件
TFRecord 是Google官方推荐的一种数据格式,是Google专门为TensorFlow设计的一种数据格式。通过将训练数据或测试数据打包成TFRecord文件,就可以配合TF中相关的DataLoader / Transformer等API实现数据的加载和处理,便于高效地训练和评估模型。
实际上,TFRecord是一种二进制文件,其能更好的利用内存,其内部包含了多个tf.train.Example, 而Example是protocol buffer(protobuf) 数据标准的实现,在一个Example消息体中包含了一系列的tf.train.feature属性,而 每一个feature 是一个key-value的键值对,其中,key 是string类型,而value 的取值有三种:
- bytes_list: 可以存储string 和byte两种数据类型。
- float_list: 可以存储float(float32)与double(float64) 两种数据类型 。
- int64_list: 可以存储:bool, enum, int32, uint32, int64, uint64 。
重用预训练模型
下载预训练模型
从此处TensorFlow 2 Detection Model Zoo选择预训练模型下载。此处下载SSD ResNet50 V1 FPN 640x640 模型。
重新配置训练管线
修改模型文件夹下的pipeline.config文件,用于训练自己的模型。以SSD ResNet50 V1 FPN 640x640模型的pipeline.config文件为例,具体些修改内容如下:
1 | model { |
训练新模型
准备训练模型
将TensorFlow/models/research/object_detection/model_main_tf2.py文件粘贴到training_demo文件夹。该文件是训练和评估新模型的入口文件。
训练模型
使用如下命令开始训练新模型:
1 | cd J:\tensorflow\workspace\training_demo |
注意:此处参数–model_dir是模型输出目录,除了存在pipeline.config外,应该是空的。*否则将发生错误Pretrained Models number of classes doesnt match own dataset number of classes : Cannot assign to variable。
评估模型
使用如下命令评估训练好的模型:
1 | cd J:\tensorflow\workspace\training_demo |
监控训练作业进度
使用如下命令监控模型训练进度:
1 | cd J:\tensorflow\workspace\training_demo |
上面的命令将启动一个新的 TensorBoard 服务器,它(默认)监听你机器的 6006 端口。完成此操作后,转到您的浏览器并http://localhost:6006/在地址栏中输入,然后您应该会看到一个仪表板(如果您的模型刚刚开始训练,可能会显示较少)。
导出训练模型
训练工作完成后,使用如下步骤导出模型:
(1)复制TensorFlow/models/research/object_detection/exporter_main_v2.py脚本并将其直接粘贴到您的training_demo文件夹中。
(2)运行如下命令:
1 | cd J:\tensorflow\workspace\training_demo |
评价指标
对于一个目标检测模型的好坏,总的来说可以从以下三个方面来评估:
- 分类的精度如何。一般可以用准确度(Accuracy),精度(Precision),召回率(Recall Rate), PR 曲线,AP,mAP等
- 定位的精度如何。比如 IoU
- 运行的速度如何。比如 fps,一秒处理几张图。
具体内容请参考目标检测模型的评价指标(Acc, Precision, Recall, AP, mAP, RoI)。
参考文献
- TensorFlow Object Detection API,by tensorflow.
- TensorFlow2.x GPU版安装与CUDA版本选择指南,by Color_Space.
- 在 Windows 环境中从源代码构建,by tensorflow.
- COCO2014/2017数据集,by THE@JOKER.
- TensorFlow2.x目标检测API测试代码使用演示,by Color Space.
- TensorFlow2.x目标检测API安装配置步骤详细教程 Object Detection API with TensorFlow2.x ,by Color_Space.
- python安装第三方包的安装路径,dist-packages和site-packages区别,by 陈 超.
- 用 .pth 文件附加 Python 模块搜索路径,by 隔叶黄莺.
- Google Protobuf简明教程,by geekpy.
- Tensorflow-GPU: How to Install Tensorflow with NVIDIA CUDA,cuDNN and GPU support on Windows,by Ilekura Idowu.
- Dataset之COCO数据集:COCO数据集的简介、下载、使用方法之详细攻略,by 一个处女座的程序猿.
- COCO数据集的标注格式,by Gemfield.
- COCO数据集标注详解,by 2044914130.
- RLE格式分割标注文件表示,by AIHGF.
- TensorFlow 2 Object Detection API tutorial,by github.
- TFRecord 简介,by xmfbit.
- Using regular expression flags in Python,by John Lekberg.
- 错误:cl: 命令行 error D8021 :无效的数值参数“/Wno-cpp”,by 点亮~黑夜.
- COCO数据集使用,by Meumax-GDUT.
- 目标检测数据集PASCAL VOC简介,by arleyzhang.
- Building a Toy Detector with Tensorflow Object Detection API,by Priya Dwivedi.
- 【Tensorflow】tf.app.run()与命令行参数解析,by TwT520Ly.
- 关于TFRecords和tf.Example的使用,by Zessay.
- Pandas教程 | 超好用的Groupby用法详解,by 易执.
- Pandas组合操作,by lysh1987.
- TensorFlow 数据输入格式之 TFRecord,by 逑识.
- 使用 Tensorflow Object Detection API 训练自己的模型,by 菁菁者莪.
- tensorflow出现显存不足的提示,by 楠仔码头.
- 使用COCOAPI操作COCO数据集 遇到的问题 TypeError: ‘numpy.float64’ object cannot be interpreted,by TheOldManAndTheSea.
- Pretrained Models number of classes doesnt match own dataset number of classes : Cannot assign to variable,by tensorflow.
- Some Python objects were not bound to checkpointed values,by stackoverflow.
- 目标检测模型的评价指标(Acc, Precision, Recall, AP, mAP, RoI),by kuweicai.
- tensorflow2转tflite提示OP不支持的解决方案,by nudt_qxx.
- ModuleNotFoundError: No module named ‘gin’,by stackoverflow.