【torch.nn.Fold】和【torch.nn.Unfold】,i9023（torch.flatten与torch.nn.flatten）_智能终端演进

文件名：【torch.nn.Fold】和【torch.nn.Unfold】,i9023 【torch.nn.Fold】和【torch.nn.Unfold】

文章目录 torch.nn.Unfold直观理解官方文档 toch.nn.Fold直观理解官方文档

torch.nn.Unfold 直观理解

torhc.nn.Unfold的功能：从一个batch的样本中，提取出滑动的局部区域块patch（也就是卷积操作中的提取kernel filter对应的滑动窗口）把它按照顺序展开，得到的特征数就是通道数*卷积核的宽*卷积核的高，下图中的L就是滑动完成后总的patch的个数。举个例子：

import torchinput1=torch.randn(1,3,4,6)print(input1)unfold1=torch.nn.Unfold(kernel_size=(2,3),stride=(2,3))patches1=unfold1(input1)print(patches1.shape)print(patches1)

下图中的红框、蓝框、黄框、绿框分别是2x3的窗口按照步幅2x3滑动时得到的4个patch。每个patch的特征总数是2*3*3=18 ( $滑动窗口的高 * 滑动窗口的宽 * 通道数$ ) 得到的输出patches1就是把每个patch的特征按照顺序展开，输出的大小就是(1,18,4)

官方文档 CLASStorch.nn.Unfold(kernel_size, dilation=1, padding=0, stride=1)

功能：从批量输入张量中提取滑动局部块。

假设一个batch的输入张量大小为 $(N, C, *)$ ，其中 $N$ 表示batch的维度， $C$ 表示通道维度， $*$ 表示任意的空间维度。该操作将输入空间维度内的每个kernel_size大小的滑动块展平到一列中, 输出的大小为 $\left(N, C \times \prod( kernel\_size ), L\right)$ , 其中 $\times \prod( kernel\_size)$ 表示每个block中包含的所有值的个数，一个block是kernel_size的面积和通道数的乘积， $L$ 是这样的block的个数。

$spatial_size [ d ] + 2 × padding ⁡ [ d ] − dilation ⁡ [ d ] × ( kernel ⁡ _ size [ d ] − 1 ) − 1 stride ⁡ [ d ] + 1 ] , L=\prod_d\left\lfloor\frac{\text { spatial\_size }[d]+2 \times \operatorname{padding}[d]-\operatorname{dilation}[d] \times\left(\operatorname{kernel} \_ \text {size }[d]-1\right)-1}{\operatorname{stride}[d]}+1\right] \text {, }$

其中 $spatial\_size$ 是输入的空间维度（对应上述的*）， $d$ 是所有的空间维度。

因此，最后一个维度(列维度)的索引输出给出了某个块内的所有值。

padding、stride和dilation参数指定如何检索滑动块。

Stride控制滑块的步幅; Padding控制重塑前每个维度的点的填充数两边隐式零填充的数量。

dilation 控制kenel 点之间的间距;也被称为à trous算法。

参数

kernel_size(int or tuple) : 滑块的尺寸dilation(int or tuple,optional): 控制邻域内元素步幅的参数。默认值:1padding(int or tuple, optional) : 在输入的两侧添加隐式零填充。默认值:0stride(int or tuple, optional) : 滑动块在输入空间维度中的步长。默认值:1

如果kernel_size、dilation、padding或stride是int或长度为1的元组，它们的值将在所有空间维度上复制。

形状：

输入：

(N, C, *)

输出：

\left(N, C \times \prod( kernel\_size ), L\right)

例子

unfold = nn.Unfold(kernel_size=(2, 3))input = torch.randn(2, 5, 3, 4)output = unfold(input)# each patch contains 30 values (2x3=6 vectors, each of 5 channels)# 4 blocks (2x3 kernels) in total in the 3x4 inputoutput.size()# Convolution is equivalent with Unfold + Matrix Multiplication + Fold (or view to output shape)inp = torch.randn(1, 3, 10, 12)w = torch.randn(2, 3, 4, 5)inp_unf = torch.nn.functional.unfold(inp, (4, 5))out_unf = inp_unf.transpose(1, 2).matmul(w.view(w.size(0), -1).t()).transpose(1, 2)out = torch.nn.functional.fold(out_unf, (7, 8), (1, 1))# or equivalently (and avoiding a copy),# out = out_unf.view(1, 2, 7, 8)(torch.nn.functional.conv2d(inp, w) - out).abs().max() toch.nn.Fold 直观理解

toch.nn.Fold 就是torch.nn.Unfold的逆操作，将提取出的滑动局部区域块还原成batch的张量形式。举个例子：我们把上面输出的patches 通过具有相同大小的卷积核以及步幅进行Flod操作，得到的input_restore 和 input1 相同，说明Fold和UnFold互为逆操作。

fold1=torch.nn.Fold(output_size=(4,6),kernel_size=(2,3),stride=(2,3))input_restore=fold1(patches1)print(input_restore.shape)print(input_restore==input1)print(input_restore)

官方文档 CLASStorch.nn.Fold(output_size, kernel_size, dilation=1, padding=0, stride=1) 功能：

和Unfold相反，将提取出的滑动局部区域块还原成batch的张量形式。

参数 output_size(int or tuple) : 输出的空间维度的形状kernel_size(int or tuple) : 滑块的尺寸dilation(int or tuple,optional): 控制邻域内元素步幅的参数。默认值:1padding(int or tuple, optional) : 在输入的两侧添加隐式零填充。默认值:0stride(int or tuple, optional) : 滑动块在输入空间维度中的步长。默认值:1 形状输入：

kernel_size ) , L ) \left(N, C \times \prod(\text { kernel\_size }), L\right)

或者

kernel_size ) , L ) \left( C \times \prod(\text { kernel\_size }), L\right)

输出：

output_size [ 0 ] , output_size [ 1 ] , … ) (N, C, \text { output\_size }[0], \text { output\_size }[1], \ldots)

或

output_size [ 0 ] , output_size [ 1 ] , … ) (N, C, \text { output\_size }[0], \text { output\_size }[1], \ldots)

例子 >>> fold = nn.Fold(output_size=(4, 5), kernel_size=(2, 2))>>> input = torch.randn(1, 3 * 2 * 2, 12)>>> output = fold(input)>>> output.size()torch.Size([1, 3, 4, 5])

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

【torch.nn.Fold】和【torch.nn.Unfold】,i9023（torch.flatten与torch.nn.flatten）

2019降电价开闸！发改委：电网企业增值税税率调整相应降低一般工商业电价

【torch.nn.PixelShuffle】和【torch.nn.UnpixelShuffle】,qq外观皮肤图片非主流

【PXIE301-211】基于PXIE总线的16路并行LVDS数据采集、4路低速、2路隔离RS422数据处理平台,QQ音乐2009

【Ptyhon】关于自定义对象的Json序列化和反序列化,诺亚舟np1100（java自定义序列化和反序列化）

【QGIS入门实战精品教程】9.1：QGIS构建泰森多边形（Thiessen Polygon）实例精解,戴尔灵越14r拆机

【Qt之QLocale】使用,索爱neo

【Qt开发流程】之元对象系统,松下zs3（qt 元对象系统）

【Qt绘制仪表盘】,lg t320

【RK3399Pro学习笔记】七、ROS订阅者Subscriber的编程实现,索尼t90

【ROS导航Navigation】五 - 导航相关的消息 - 地图 - 里程计 - 坐标变换 - 定位 - 目标点和路径规划 - 激光雷达 - 相机,el71

【RabbitMQ】初识消息队列 MQ，基于 Docker 部署 RabbitMQ，探索 RabbitMQ 基本使用，了解常见的消息类型,开奇网