参考文献:https://blog.csdn.net/wills798/article/details/97974617文章来源:https://uudwc.com/A/Mx335
token是指文本中的一个最小单位。通常,一个token可以是一个单词、一个标点符号、一个数字、一个符号等。
Batch是批量的大小,就是你训练的时候每次输入多少张图片。
Patch是图像块的大小,比如说原图1024x1024,随机从图中裁剪出256x256大小的块,就是patch。更准确来说:“patch”, 指一个二维图片中的其中一个小块, 即一张二维图像中有很多个patch. 正如在神经网络的卷积计算中, 图像并不是一整块图像直接同卷积核进行运算, 而是被分成了很多很多个patch分别同卷积核进行卷积运算, 这些patch的大小取决于卷积核的size. 卷积核每次只查看一个patch, 然后移动到另一个patch, 直到图像分成的所有patch都参与完运算。文章来源地址https://uudwc.com/A/Mx335