From 1e9e42e839ac4f9f7cdab7aba21a53f6493efbea Mon Sep 17 00:00:00 2001
From: xuyige <ygxu18@fudan.edu.cn>
Date: Tue, 23 Apr 2019 16:43:22 +0800
Subject: [PATCH] update pooling

---
 fastNLP/modules/aggregator/__init__.py  |  10 +-
 fastNLP/modules/aggregator/avg_pool.py  |  36 -------
 fastNLP/modules/aggregator/kmax_pool.py |  20 ----
 fastNLP/modules/aggregator/max_pool.py  |  38 -------
 fastNLP/modules/aggregator/pooling.py   | 133 ++++++++++++++++++++++++
 5 files changed, 138 insertions(+), 99 deletions(-)
 delete mode 100644 fastNLP/modules/aggregator/avg_pool.py
 delete mode 100644 fastNLP/modules/aggregator/kmax_pool.py
 delete mode 100644 fastNLP/modules/aggregator/max_pool.py
 create mode 100644 fastNLP/modules/aggregator/pooling.py

diff --git a/fastNLP/modules/aggregator/__init__.py b/fastNLP/modules/aggregator/__init__.py
index 43d60cac..c0a63fd3 100644
--- a/fastNLP/modules/aggregator/__init__.py
+++ b/fastNLP/modules/aggregator/__init__.py
@@ -1,8 +1,8 @@
-from .max_pool import MaxPool
-from .max_pool import MaxPoolWithMask
-from .avg_pool import AvgPool
-from .avg_pool import MeanPoolWithMask
-from .kmax_pool import KMaxPool
+from .pooling import MaxPool
+from .pooling import MaxPoolWithMask
+from .pooling import AvgPool
+from .pooling import MeanPoolWithMask
+from .pooling import KMaxPool
 
 from .attention import Attention
 from .attention import BiAttention
diff --git a/fastNLP/modules/aggregator/avg_pool.py b/fastNLP/modules/aggregator/avg_pool.py
deleted file mode 100644
index e6f3fd4b..00000000
--- a/fastNLP/modules/aggregator/avg_pool.py
+++ /dev/null
@@ -1,36 +0,0 @@
-# python: 3.6
-# encoding: utf-8
-
-import torch
-import torch.nn as nn
-import torch.nn.functional as F
-
-
-class AvgPool(nn.Module):
-    """1-d average pooling module."""
-
-    def __init__(self, stride=None, padding=0):
-        super(AvgPool, self).__init__()
-        self.stride = stride
-        self.padding = padding
-
-    def forward(self, x):
-        # [N,C,L] -> [N,C]
-        kernel_size = x.size(2)
-        x = F.max_pool1d(
-            input=x,
-            kernel_size=kernel_size,
-            stride=self.stride,
-            padding=self.padding)
-        return x.squeeze(dim=-1)
-
-
-class MeanPoolWithMask(nn.Module):
-    def __init__(self):
-        super(MeanPoolWithMask, self).__init__()
-        self.inf = 10e12
-
-    def forward(self, tensor, mask, dim=0):
-        masks = mask.view(mask.size(0), mask.size(1), -1).float()
-        return torch.sum(tensor * masks, dim=dim) / torch.sum(masks, dim=1)
-
diff --git a/fastNLP/modules/aggregator/kmax_pool.py b/fastNLP/modules/aggregator/kmax_pool.py
deleted file mode 100644
index 4d71130e..00000000
--- a/fastNLP/modules/aggregator/kmax_pool.py
+++ /dev/null
@@ -1,20 +0,0 @@
-# python: 3.6
-# encoding: utf-8
-
-import torch
-import torch.nn as nn
-# import torch.nn.functional as F
-
-
-class KMaxPool(nn.Module):
-    """K max-pooling module."""
-
-    def __init__(self, k=1):
-        super(KMaxPool, self).__init__()
-        self.k = k
-
-    def forward(self, x):
-        # [N,C,L] -> [N,C*k]
-        x, index = torch.topk(x, self.k, dim=-1, sorted=False)
-        x = torch.reshape(x, (x.size(0), -1))
-        return x
diff --git a/fastNLP/modules/aggregator/max_pool.py b/fastNLP/modules/aggregator/max_pool.py
deleted file mode 100644
index 60d68497..00000000
--- a/fastNLP/modules/aggregator/max_pool.py
+++ /dev/null
@@ -1,38 +0,0 @@
-# python: 3.6
-# encoding: utf-8
-
-import torch
-import torch.nn as nn
-import torch.nn.functional as F
-
-
-class MaxPool(nn.Module):
-    """1-d max-pooling module."""
-
-    def __init__(self, stride=None, padding=0, dilation=1):
-        super(MaxPool, self).__init__()
-        self.stride = stride
-        self.padding = padding
-        self.dilation = dilation
-
-    def forward(self, x):
-        x = torch.transpose(x, 1, 2)  # [N,L,C] -> [N,C,L]
-        kernel_size = x.size(2)
-        x = F.max_pool1d(  # [N,L,C] -> [N,C,1]
-            input=x,
-            kernel_size=kernel_size,
-            stride=self.stride,
-            padding=self.padding,
-            dilation=self.dilation)
-        return x.squeeze(dim=-1)  # [N,C,1] -> [N,C]
-
-
-class MaxPoolWithMask(nn.Module):
-    def __init__(self):
-        super(MaxPoolWithMask, self).__init__()
-        self.inf = 10e12
-
-    def forward(self, tensor, mask, dim=0):
-        masks = mask.view(mask.size(0), mask.size(1), -1)
-        masks = masks.expand(-1, -1, tensor.size(2)).float()
-        return torch.max(tensor + masks.le(0.5).float() * -self.inf, dim=dim)
diff --git a/fastNLP/modules/aggregator/pooling.py b/fastNLP/modules/aggregator/pooling.py
new file mode 100644
index 00000000..876f5fb1
--- /dev/null
+++ b/fastNLP/modules/aggregator/pooling.py
@@ -0,0 +1,133 @@
+# python: 3.6
+# encoding: utf-8
+
+import torch
+import torch.nn as nn
+
+
+class MaxPool(nn.Module):
+    """Max-pooling模块。"""
+
+    def __init__(
+            self, stride=None, padding=0, dilation=1, dimension=1, kernel_size=None,
+            return_indices=False, ceil_mode=False
+    ):
+        """
+        :param stride: 窗口移动大小，默认为kernel_size
+        :param padding: padding的内容，默认为0
+        :param dilation: 控制窗口内元素移动距离的大小
+        :param dimension: MaxPool的维度，支持1，2，3维。
+        :param kernel_size: max pooling的窗口大小，默认为tensor最后k维，其中k为dimension
+        :param return_indices:
+        :param ceil_mode:
+        """
+        super(MaxPool, self).__init__()
+        assert (1 <= dimension) and (dimension <= 3)
+        self.dimension = dimension
+        self.stride = stride
+        self.padding = padding
+        self.dilation = dilation
+        self.kernel_size = kernel_size
+        self.return_indices = return_indices
+        self.ceil_mode = ceil_mode
+
+    def forward(self, x):
+        if self.dimension == 1:
+            pooling = nn.MaxPool1d(
+                stride=self.stride, padding=self.padding, dilation=self.dilation,
+                kernel_size=self.kernel_size if self.kernel_size is not None else x.size(-1),
+                return_indices=self.return_indices, ceil_mode=self.ceil_mode
+            )
+            x = torch.transpose(x, 1, 2)  # [N,L,C] -> [N,C,L]
+        elif self.dimension == 2:
+            pooling = nn.MaxPool2d(
+                stride=self.stride, padding=self.padding, dilation=self.dilation,
+                kernel_size=self.kernel_size if self.kernel_size is not None else (x.size(-2), x.size(-1)),
+                return_indices=self.return_indices, ceil_mode=self.ceil_mode
+            )
+        else:
+            pooling = nn.MaxPool2d(
+                stride=self.stride, padding=self.padding, dilation=self.dilation,
+                kernel_size=self.kernel_size if self.kernel_size is not None else (x.size(-3), x.size(-2), x.size(-1)),
+                return_indices=self.return_indices, ceil_mode=self.ceil_mode
+            )
+        x = pooling(x)
+        return x.squeeze(dim=-1)  # [N,C,1] -> [N,C]
+
+
+class MaxPoolWithMask(nn.Module):
+    """带mask矩阵的1维max pooling"""
+    def __init__(self):
+        super(MaxPoolWithMask, self).__init__()
+        self.inf = 10e12
+
+    def forward(self, tensor, mask, dim=1):
+        """
+        :param torch.Tensor tensor: [batch_size, seq_len, channels] 初始tensor
+        :param torch.Tensor mask: [batch_size, seq_len] 0/1的mask矩阵
+        :param int dim: 需要进行max pooling的维度
+        :return:
+        """
+        masks = mask.view(mask.size(0), mask.size(1), -1)
+        masks = masks.expand(-1, -1, tensor.size(2)).float()
+        return torch.max(tensor + masks.le(0.5).float() * -self.inf, dim=dim)[0]
+
+
+class KMaxPool(nn.Module):
+    """K max-pooling module."""
+
+    def __init__(self, k=1):
+        super(KMaxPool, self).__init__()
+        self.k = k
+
+    def forward(self, x):
+        """
+        :param torch.Tensor x: [N, C, L] 初始tensor
+        :return: torch.Tensor x: [N, C*k] k-max pool后的结果
+        """
+        x, index = torch.topk(x, self.k, dim=-1, sorted=False)
+        x = torch.reshape(x, (x.size(0), -1))
+        return x
+
+
+class AvgPool(nn.Module):
+    """1-d average pooling module."""
+
+    def __init__(self, stride=None, padding=0):
+        super(AvgPool, self).__init__()
+        self.stride = stride
+        self.padding = padding
+
+    def forward(self, x):
+        """
+        :param torch.Tensor x: [N, C, L] 初始tensor
+        :return: torch.Tensor x: [N, C] avg pool后的结果
+        """
+        # [N,C,L] -> [N,C]
+        kernel_size = x.size(2)
+        pooling = nn.AvgPool1d(
+            kernel_size=kernel_size,
+            stride=self.stride,
+            padding=self.padding)
+        x = pooling(x)
+        return x.squeeze(dim=-1)
+
+
+class MeanPoolWithMask(nn.Module):
+    def __init__(self):
+        super(MeanPoolWithMask, self).__init__()
+        self.inf = 10e12
+
+    def forward(self, tensor, mask, dim=1):
+        """
+        :param torch.Tensor tensor: [batch_size, seq_len, channels] 初始tensor
+        :param torch.Tensor mask: [batch_size, seq_len] 0/1的mask矩阵
+        :param int dim: 需要进行max pooling的维度
+        :return:
+        """
+        masks = mask.view(mask.size(0), mask.size(1), -1).float()
+        return torch.sum(tensor * masks, dim=dim) / torch.sum(masks, dim=1)
+
+
+
+