训练#

本节例子中假设你已经处于你的实验目录中,你的模型配置文件名为 resnet50.py

单机训练#

目前单机训练会占用全部 GPU :

cls_train -f resnet50.py

若中途训练中断,可追加 --resume 参数,BaseCls 会从上一次保存的 checkpoint 开始继续训练。

训练结束后,模型将自动使用最后一个 checkpoint ,测试其在 ImageNet 1k validation set 上的 Top-1 Accuracy 和 Top-5 Accuracy。

可以在终端中追加参数覆盖模型配置文件中的字段,例如你需要在显存更大的机器上训练模型:

cls_train -f resnet50.py batch_size 128 solver.basic_lr 0.1

模型配置文件中的 batch_sizesolver.basic_lr 字段将被覆盖。

警告

并不推荐通过传参修改配置项,因为这可能会影响“模型配置文件—测试结果”的可复现性。直接修改模型配置文件是更推荐的做法。