@TOC

下载

官网下载

直接在ILSVRC2012官网进行下载,需要注册账号登陆。
训练集
训练集下载地址:http://www.image-net.org/challenges/LSVRC/2012/dd31405981ef5f776aa17412e1f0c112/ILSVRC2012_img_train.tar
验证集
验证集下载地址:http://www.image-net.org/challenges/LSVRC/2012/dd31405981ef5f776aa17412e1f0c112/ILSVRC2012_img_val.tar

迅雷下载

训练集
训练集种子:http://academictorrents.com/download/a306397ccf9c2ead27155983c254227c0fd938e2.torrent
验证集
验证集种子:http://academictorrents.com/download/5d6d0df7ed81efd49ca99ea4737e0ae5e3a5f2e5.torren

使用aria2加速下载

1
aria2c -x 16 -s 16 'http://academictorrents.com/download/5d6d0df7ed81efd49ca99ea4737e0ae5e3a5f2e5.torren' 'http://academictorrents.com/download/a306397ccf9c2ead27155983c254227c0fd938e2.torrent'

数据集校验

1
2
3
md5sum ILSVRC2012_img_val.tar ILSVRC2012_img_train.tar
29b22e2961454d5413ddabcf34fc5622 ILSVRC2012_img_val.tar
1d675b47d978889d74fa0da5fadfb00e ILSVRC2012_img_train.tar

训练

解压训练集

将ILSVRC2012_img_train.tar解压,1000个类别的*.tar包。

1
2
mkdir train
tar -xvf ILSVRC2012_img_train.tar -C train

然后可以使用下面这段python代码,将训练集的1000个.tar包解压缩,并删除源.tar包。

1
2
3
4
5
6
7
8
9
10
11
12
13
import glob
import os

filelist = glob.glob('./train/*.tar')

for f in filelist:
os.system("mkdir ./train/" + f.split('.')[0])

for f in filelist:
os.system("tar -xvf " + f + " -C ./train/" + f.split('.')[0])

for f in filelist:
os.system("rm ./train/" + f)

解压验证集

将ILSVRC2012_img_val.tar解压,得到没有种类标签的图片。

1
2
mkdir val
tar -xvf ILSVRC2012_img_val.tar -C val

然后使用valprep.sh文件,将验证集整理为和训练集相同的格式,按照种类标签划分文件夹。

1
2
3
cd val
aria2c -x 16 -s 16 ‘https://raw.githubusercontent.com/soumith/imagenetloader.torch/master/valprep.sh’
sh valprep.sh