From 74a697651e8ed6cafbbc372048c28e5ecff4b7a1 Mon Sep 17 00:00:00 2001
From: yunfan <yunfan.shao@outlook.com>
Date: Sat, 24 Nov 2018 22:36:43 +0800
Subject: [PATCH] - fix Dataset & Trainer - update CNNText model

---
 fastNLP/core/dataset.py                   | 15 +++++------
 fastNLP/core/trainer.py                   | 17 +++++-------
 fastNLP/models/cnn_text_classification.py | 33 ++++++++++++-----------
 3 files changed, 32 insertions(+), 33 deletions(-)

diff --git a/fastNLP/core/dataset.py b/fastNLP/core/dataset.py
index 34ce56ba..2b1e9ca8 100644
--- a/fastNLP/core/dataset.py
+++ b/fastNLP/core/dataset.py
@@ -254,19 +254,18 @@ class DataSet(object):
         :param str new_field_name: If not None, results of the function will be stored as a new field.
         :return results: returned values of the function over all instances.
         """
-        results = []
-        for ins in self:
-            results.append(func(ins))
+        results = [func(ins) for ins in self]
         if new_field_name is not None:
             if new_field_name in self.field_arrays:
                 # overwrite the field, keep same attributes
                 old_field = self.field_arrays[new_field_name]
-                padding_val = old_field.padding_val
-                need_tensor = old_field.need_tensor
-                is_target = old_field.is_target
-                self.add_field(new_field_name, results, padding_val, need_tensor, is_target)
+                self.add_field(name=new_field_name,
+                               fields=results,
+                               padding_val=old_field.padding_val,
+                               is_input=old_field.is_input,
+                               is_target=old_field.is_target)
             else:
-                self.add_field(new_field_name, results)
+                self.add_field(name=new_field_name, fields=results)
         else:
             return results
 
diff --git a/fastNLP/core/trainer.py b/fastNLP/core/trainer.py
index 063de676..e6a49721 100644
--- a/fastNLP/core/trainer.py
+++ b/fastNLP/core/trainer.py
@@ -1,10 +1,6 @@
 import time
-from datetime import timedelta
-from datetime import datetime
-
-import warnings
-from collections import defaultdict
-
+rom datetime import timedelta, datetime
+import os
 import torch
 from tensorboardX import SummaryWriter
 
@@ -28,7 +24,7 @@ class Trainer(object):
 
     """
 
-    def __init__(self, train_data, model, n_epochs=1, batch_size=32, print_every=-1,
+   def __init__(self, train_data, model, n_epochs, batch_size, n_print=1,
                  dev_data=None, use_cuda=False, loss=Loss(None), save_path="./save",
                  optimizer=Optimizer("Adam", lr=0.001, weight_decay=0),
                  evaluator=Evaluator(),
@@ -56,7 +52,7 @@ class Trainer(object):
         for k, v in kwargs.items():
             setattr(self, k, v)
 
-        self._summary_writer = SummaryWriter(self.save_path + 'tensorboard_logs')
+        self._summary_writer = SummaryWriter(os.path.join(self.save_path, 'tensorboard_logs'))
         self._graph_summaried = False
         self.step = 0
         self.start_time = None  # start timestamp
@@ -112,9 +108,9 @@ class Trainer(object):
                     self._summary_writer.add_scalar(name + "_mean", param.mean(), global_step=self.step)
                     # self._summary_writer.add_scalar(name + "_std", param.std(), global_step=self.step)
                     # self._summary_writer.add_scalar(name + "_grad_sum", param.sum(), global_step=self.step)
-            if self.print_every > 0 and self.step % self.print_every == 0:
+           if n_print > 0 and self.step % n_print == 0:
                 end = time.time()
-                diff = timedelta(seconds=round(end - kwargs["start"]))
+                diff = timedelta(seconds=round(end - start))
                 print_output = "[epoch: {:>3} step: {:>4}] train loss: {:>4.6} time: {}".format(
                     epoch, self.step, loss.data, diff)
                 print(print_output)
@@ -177,6 +173,7 @@ class Trainer(object):
         return self.loss_func(predict, truth)
 
     def save_model(self, model, model_name, only_param=False):
+        model_name = os.path.join(self.save_path, model_name)
         if only_param:
             torch.save(model.state_dict(), model_name)
         else:
diff --git a/fastNLP/models/cnn_text_classification.py b/fastNLP/models/cnn_text_classification.py
index 15a65221..e814717b 100644
--- a/fastNLP/models/cnn_text_classification.py
+++ b/fastNLP/models/cnn_text_classification.py
@@ -15,25 +15,25 @@ class CNNText(torch.nn.Module):
     Classification.'
     """
 
-    def __init__(self, args):
+    def __init__(self, embed_num,
+                 embed_dim,
+                 num_classes,
+                 kernel_nums=(3,4,5),
+                 kernel_sizes=(3,4,5),
+                 padding=0,
+                 dropout=0.5):
         super(CNNText, self).__init__()
 
-        num_classes = args["num_classes"]
-        kernel_nums = [100, 100, 100]
-        kernel_sizes = [3, 4, 5]
-        vocab_size = args["vocab_size"]
-        embed_dim = 300
-        pretrained_embed = None
-        drop_prob = 0.5
-
         # no support for pre-trained embedding currently
-        self.embed = encoder.embedding.Embedding(vocab_size, embed_dim)
-        self.conv_pool = encoder.conv_maxpool.ConvMaxpool(
+        self.embed = encoder.Embedding(embed_num, embed_dim)
+        self.conv_pool = encoder.ConvMaxpool(
             in_channels=embed_dim,
             out_channels=kernel_nums,
-            kernel_sizes=kernel_sizes)
-        self.dropout = nn.Dropout(drop_prob)
-        self.fc = encoder.linear.Linear(sum(kernel_nums), num_classes)
+            kernel_sizes=kernel_sizes,
+            padding=padding)
+        self.dropout = nn.Dropout(dropout)
+        self.fc = encoder.Linear(sum(kernel_nums), num_classes)
+        self._loss = nn.CrossEntropyLoss()
 
     def forward(self, word_seq):
         """
@@ -44,4 +44,7 @@ class CNNText(torch.nn.Module):
         x = self.conv_pool(x)  # [N,L,C] -> [N,C]
         x = self.dropout(x)
         x = self.fc(x)  # [N,C] -> [N, N_class]
-        return x
+        return {'output':x}
+
+    def loss(self, output, label_seq):
+        return self._loss(output, label_seq)