Sorry, your browser cannot access this site
This page requires browser support (enable) JavaScript
Learn more >

MengFanjun的博客

原视频链接:PyTorch深度学习目标检测入门实战系列【土堆 x 布尔艺数】

下载VOC数据集

下载地址:http://host.robots.ox.ac.uk/pascal/VOC/

数据集里面都有什么

在这里插入图片描述
  • Annotations 标注文件夹(包含xml文件,图片的各种信息)
  • ImageSets 图片集合(主要关注Main文件夹的内容)
  • JPEGImages 数据集包含的图片
  • SegmentationClass 语义分割图片
  • SegmentationObject 实例分割图片 #### 需要关注的是ImageSets

打开ImageSets-Main-aeroplane_train.txt 在这里插入图片描述 可以看到32和33为1,在JPEGImages中,32号的图片 在这里插入图片描述

打开Annotations

打开Annotations-000032.xml

1
2
3
4
5
6
7
8
9
10
11
12
<object>
<name>aeroplane</name><图片类别名字>
<pose>Frontal</pose><拍摄物体的角度,可以看出是在前面拍的>
<truncated>0</truncated><有无被截断,0是无>
<difficult>0</difficult><识别出来是否困难,0代表不困难>
<bndbox>
<xmin>104</xmin><物体在图片上横坐标最小值>
<ymin>78</ymin><物体在图片上纵坐标最小值>
<xmax>375</xmax><物体在图片上横坐标最大值>
<ymax>183</ymax><物体在图片上纵坐标最大值>
</bndbox>
</object>

下载COCO数据集

官网:https://cocodataset.org/#home

解读Annotations

在这里插入图片描述 从第一行开始扫描,是46格像素,到第三行才出现白色的像素,一行一行的扫描 "counts":[147,3,1......]

未完待续

评论