update pooling

6 years ago · 1e9e42e839
--- a/fastNLP/modules/aggregator/init.py
+++ b/fastNLP/modules/aggregator/init.py
@@ -1,8 +1,8 @@
 from .max_pool import MaxPool
 from .max_pool import MaxPoolWithMask
 from .avg_pool import AvgPool
 from .avg_pool import MeanPoolWithMask
 from .kmax_pool import KMaxPool
 from .pooling import MaxPool
 from .pooling import MaxPoolWithMask
 from .pooling import AvgPool
 from .pooling import MeanPoolWithMask
 from .pooling import KMaxPool
 from .attention import Attention
 from .attention import BiAttention
--- a/fastNLP/modules/aggregator/avg_pool.py
+++ b/fastNLP/modules/aggregator/avg_pool.py
@@ -1,36 +0,0 @@
 # python: 3.6
 # encoding: utf-8
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
 class AvgPool(nn.Module):
    """1-d average pooling module."""
    def __init__(self, stride=None, padding=0):
        super(AvgPool, self).__init__()
        self.stride = stride
        self.padding = padding
    def forward(self, x):
        # [N,C,L] -> [N,C]
        kernel_size = x.size(2)
        x = F.max_pool1d(
            input=x,
            kernel_size=kernel_size,
            stride=self.stride,
            padding=self.padding)
        return x.squeeze(dim=-1)
 class MeanPoolWithMask(nn.Module):
    def __init__(self):
        super(MeanPoolWithMask, self).__init__()
        self.inf = 10e12
    def forward(self, tensor, mask, dim=0):
        masks = mask.view(mask.size(0), mask.size(1), -1).float()
        return torch.sum(tensor * masks, dim=dim) / torch.sum(masks, dim=1)
--- a/fastNLP/modules/aggregator/kmax_pool.py
+++ b/fastNLP/modules/aggregator/kmax_pool.py
@@ -1,20 +0,0 @@
 # python: 3.6
 # encoding: utf-8
 import torch
 import torch.nn as nn
 # import torch.nn.functional as F
 class KMaxPool(nn.Module):
    """K max-pooling module."""
    def __init__(self, k=1):
        super(KMaxPool, self).__init__()
        self.k = k
    def forward(self, x):
        # [N,C,L] -> [N,C*k]
        x, index = torch.topk(x, self.k, dim=-1, sorted=False)
        x = torch.reshape(x, (x.size(0), -1))
        return x
--- a/fastNLP/modules/aggregator/max_pool.py
+++ b/fastNLP/modules/aggregator/max_pool.py
@@ -1,38 +0,0 @@
 # python: 3.6
 # encoding: utf-8
 import torch
 import torch.nn as nn
 import torch.nn.functional as F
 class MaxPool(nn.Module):
    """1-d max-pooling module."""
    def __init__(self, stride=None, padding=0, dilation=1):
        super(MaxPool, self).__init__()
        self.stride = stride
        self.padding = padding
        self.dilation = dilation
    def forward(self, x):
        x = torch.transpose(x, 1, 2)  # [N,L,C] -> [N,C,L]
        kernel_size = x.size(2)
        x = F.max_pool1d(  # [N,L,C] -> [N,C,1]
            input=x,
            kernel_size=kernel_size,
            stride=self.stride,
            padding=self.padding,
            dilation=self.dilation)
        return x.squeeze(dim=-1)  # [N,C,1] -> [N,C]
 class MaxPoolWithMask(nn.Module):
    def __init__(self):
        super(MaxPoolWithMask, self).__init__()
        self.inf = 10e12
    def forward(self, tensor, mask, dim=0):
        masks = mask.view(mask.size(0), mask.size(1), -1)
        masks = masks.expand(-1, -1, tensor.size(2)).float()
        return torch.max(tensor + masks.le(0.5).float() * -self.inf, dim=dim)
--- a/fastNLP/modules/aggregator/pooling.py
+++ b/fastNLP/modules/aggregator/pooling.py
@@ -0,0 +1,133 @@
 # python: 3.6
 # encoding: utf-8
 import torch
 import torch.nn as nn
 class MaxPool(nn.Module):
    """Max-pooling模块。"""
    def __init__(
            self, stride=None, padding=0, dilation=1, dimension=1, kernel_size=None,
            return_indices=False, ceil_mode=False
    ):
        """
        :param stride: 窗口移动大小，默认为kernel_size
        :param padding: padding的内容，默认为0
        :param dilation: 控制窗口内元素移动距离的大小
        :param dimension: MaxPool的维度，支持1，2，3维。
        :param kernel_size: max pooling的窗口大小，默认为tensor最后k维，其中k为dimension
        :param return_indices:
        :param ceil_mode:
        """
        super(MaxPool, self).__init__()
        assert (1 <= dimension) and (dimension <= 3)
        self.dimension = dimension
        self.stride = stride
        self.padding = padding
        self.dilation = dilation
        self.kernel_size = kernel_size
        self.return_indices = return_indices
        self.ceil_mode = ceil_mode
    def forward(self, x):
        if self.dimension == 1:
            pooling = nn.MaxPool1d(
                stride=self.stride, padding=self.padding, dilation=self.dilation,
                kernel_size=self.kernel_size if self.kernel_size is not None else x.size(-1),
                return_indices=self.return_indices, ceil_mode=self.ceil_mode
            )
            x = torch.transpose(x, 1, 2)  # [N,L,C] -> [N,C,L]
        elif self.dimension == 2:
            pooling = nn.MaxPool2d(
                stride=self.stride, padding=self.padding, dilation=self.dilation,
                kernel_size=self.kernel_size if self.kernel_size is not None else (x.size(-2), x.size(-1)),
                return_indices=self.return_indices, ceil_mode=self.ceil_mode
            )
        else:
            pooling = nn.MaxPool2d(
                stride=self.stride, padding=self.padding, dilation=self.dilation,
                kernel_size=self.kernel_size if self.kernel_size is not None else (x.size(-3), x.size(-2), x.size(-1)),
                return_indices=self.return_indices, ceil_mode=self.ceil_mode
            )
        x = pooling(x)
        return x.squeeze(dim=-1)  # [N,C,1] -> [N,C]
 class MaxPoolWithMask(nn.Module):
    """带mask矩阵的1维max pooling"""
    def __init__(self):
        super(MaxPoolWithMask, self).__init__()
        self.inf = 10e12
    def forward(self, tensor, mask, dim=1):
        """
        :param torch.Tensor tensor: [batch_size, seq_len, channels] 初始tensor
        :param torch.Tensor mask: [batch_size, seq_len] 0/1的mask矩阵
        :param int dim: 需要进行max pooling的维度
        :return:
        """
        masks = mask.view(mask.size(0), mask.size(1), -1)
        masks = masks.expand(-1, -1, tensor.size(2)).float()
        return torch.max(tensor + masks.le(0.5).float() * -self.inf, dim=dim)[0]
 class KMaxPool(nn.Module):
    """K max-pooling module."""
    def __init__(self, k=1):
        super(KMaxPool, self).__init__()
        self.k = k
    def forward(self, x):
        """
        :param torch.Tensor x: [N, C, L] 初始tensor
        :return: torch.Tensor x: [N, C*k] k-max pool后的结果
        """
        x, index = torch.topk(x, self.k, dim=-1, sorted=False)
        x = torch.reshape(x, (x.size(0), -1))
        return x
 class AvgPool(nn.Module):
    """1-d average pooling module."""
    def __init__(self, stride=None, padding=0):
        super(AvgPool, self).__init__()
        self.stride = stride
        self.padding = padding
    def forward(self, x):
        """
        :param torch.Tensor x: [N, C, L] 初始tensor
        :return: torch.Tensor x: [N, C] avg pool后的结果
        """
        # [N,C,L] -> [N,C]
        kernel_size = x.size(2)
        pooling = nn.AvgPool1d(
            kernel_size=kernel_size,
            stride=self.stride,
            padding=self.padding)
        x = pooling(x)
        return x.squeeze(dim=-1)
 class MeanPoolWithMask(nn.Module):
    def __init__(self):
        super(MeanPoolWithMask, self).__init__()
        self.inf = 10e12
    def forward(self, tensor, mask, dim=1):
        """
        :param torch.Tensor tensor: [batch_size, seq_len, channels] 初始tensor
        :param torch.Tensor mask: [batch_size, seq_len] 0/1的mask矩阵
        :param int dim: 需要进行max pooling的维度
        :return:
        """
        masks = mask.view(mask.size(0), mask.size(1), -1).float()
        return torch.sum(tensor * masks, dim=dim) / torch.sum(masks, dim=1)