2
D
:
N
×
C
×
H
×
W
2D: N \times C \times H \times W
2D:N×C×H×W
N
−
n
u
m
b
e
r
o
f
s
a
m
p
l
e
s
\qquad N-number \;of \;samples
N−numberofsamples
C
−
c
h
a
n
n
e
l
s
p
e
r
s
a
m
p
l
e
\qquad C - channels \;per \;sample
C−channelspersample
H
−
h
e
i
g
h
t
\qquad H-height
H−height
W
−
w
i
d
t
h
\qquad W-width
W−width
3
D
:
N
×
C
×
D
×
H
×
W
3D: N \times C \times D \times H \times W
3D:N×C×D×H×W
N
−
n
u
m
b
e
r
o
f
s
a
m
p
l
e
s
\qquad N-number \;of \;samples
N−numberofsamples
C
−
c
h
a
n
n
e
l
s
p
e
r
s
a
m
p
l
e
\qquad C - channels \;per \;sample
C−channelspersample
D
−
d
e
p
t
h
\qquad D-depth
D−depth
H
−
h
e
i
g
h
t
\qquad H-height
H−height
W
−
w
i
d
t
h
\qquad W-width
W−width
channels和depth区别可以简单理解为如下:
不同channels的同一位置(x、y坐标相同)对应场景的同一点,只是颜色空间不同;
不同depth的同一位置(x、y坐标相同)对应场景的不同点,例如,一个序列的dicom ct图像包含多张图像,每张图像表示人体不同位置的扫描图像,不同depth的同一位置表示人体的不同部位。
【samples】
2D: 100幅宽度为800高度为600的RGB图像:
100
×
3
×
600
×
800
100×3×600×800
100×3×600×800
3D: 100个序列的dicom ct图像,每个序列包含200幅ct图像,每个ct图像为灰度图,宽度为800,高度为600:
100
×
1
×
200
×
600
×
800
100×1×200\times 600×800
100×1×200×600×800