对pytorch中x = x.view(x.size(0), -1) 的理解说明
(编辑:jimmy 日期: 2025/1/8 浏览:3 次 )
在pytorch的CNN代码中经常会看到
x.view(x.size(0), -1)
首先,在pytorch中的view()函数就是用来改变tensor的形状的,例如将2行3列的tensor变为1行6列,其中-1表示会自适应的调整剩余的维度
a = torch.Tensor(2,3) print(a) # tensor([[0.0000, 0.0000, 0.0000], # [0.0000, 0.0000, 0.0000]]) print(a.view(1,-1)) # tensor([[0.0000, 0.0000, 0.0000, 0.0000, 0.0000, 0.0000]])
在CNN中卷积或者池化之后需要连接全连接层,所以需要把多维度的tensor展平成一维,x.view(x.size(0), -1)就实现的这个功能
def forward(self,x): x=self.pre(x) x=self.layer1(x) x=self.layer2(x) x=self.layer3(x) x=self.layer4(x) x=F.avg_pool2d(x,7) x=x.view(x.size(0),-1) return self.fc(x)
卷积或者池化之后的tensor的维度为(batchsize,channels,x,y),其中x.size(0)指batchsize的值,最后通过x.view(x.size(0), -1)将tensor的结构转换为了(batchsize, channels*x*y),即将(channels,x,y)拉直,然后就可以和fc层连接了
补充:pytorch中view的用法(重构张量)
view在pytorch中是用来改变张量的shape的,简单又好用。
pytorch中view的用法通常是直接在张量名后用.view调用,然后放入自己想要的shape。如
tensor_name.view(shape)
Example:
1. 直接用法:
> x = torch.randn(4, 4) > x.size() torch.Size([4, 4]) > y = x.view(16) > y.size() torch.Size([16])
2. 强调某一维度的尺寸:
> z = x.view(-1, 8) # the size -1 is inferred from other dimensions > z.size() torch.Size([2, 8])
3. 拉直张量:
(直接填-1表示拉直, 等价于tensor_name.flatten())
> y = x.view(-1) > y.size() torch.Size([16])
4. 做维度变换时不改变内存排列
> a = torch.randn(1, 2, 3, 4) > a.size() torch.Size([1, 2, 3, 4]) > b = a.transpose(1, 2) # Swaps 2nd and 3rd dimension > b.size() torch.Size([1, 3, 2, 4]) > c = a.view(1, 3, 2, 4) # Does not change tensor layout in memory > c.size() torch.Size([1, 3, 2, 4]) > torch.equal(b, c) False
注意最后的False,在张量b和c是不等价的。从这里我们可以看得出来,view函数如其名,只改变“看起来”的样子,不会改变张量在内存中的排列。
以上为个人经验,希望能给大家一个参考,也希望大家多多支持。如有错误或未考虑完全的地方,望不吝赐教。
下一篇:python和opencv构建运动检测器的实现