update callbacks in Trainer

6 years ago · a7274c667c
--- a/fastNLP/core/batch.py
+++ b/fastNLP/core/batch.py
@@ -26,7 +26,8 @@ class Batch(object):
        self.as_numpy = as_numpy
        self.idx_list = None
        self.curidx = 0
        self.num_batches = len(dataset)//batch_size + int(len(dataset)%batch_size!=0)
        self.num_batches = len(dataset) // batch_size + int(len(dataset) % batch_size != 0)
        self.cur_batch_indices = None
    def __iter__(self):
        self.idx_list = self.sampler(self.dataset)
@@ -42,6 +43,7 @@ class Batch(object):
            batch_x, batch_y = {}, {}
            indices = self.idx_list[self.curidx:endidx]
            self.cur_batch_indices = indices
            for field_name, field in self.dataset.get_all_fields().items():
                if field.is_target or field.is_input:
@@ -60,6 +62,9 @@ class Batch(object):
    def __len__(self):
        return self.num_batches
    def get_batch_indices(self):
        return self.cur_batch_indices
 def to_tensor(batch, dtype):
    if dtype in (int, np.int8, np.int16, np.int32, np.int64):
--- a/fastNLP/core/callback.py
+++ b/fastNLP/core/callback.py
@@ -8,35 +8,35 @@ class Callback(object):
    def __init__(self):
        super(Callback, self).__init__()
    def before_train(self):
    def before_train(self, *args):
        # before the main training loop
        pass
    def before_epoch(self):
    def before_epoch(self, *args):
        # at the beginning of each epoch
        pass
    def before_batch(self):
    def before_batch(self, *args):
        # at the beginning of each step/mini-batch
        pass
    def before_loss(self):
    def before_loss(self, *args):
        # after data_forward, and before loss computation
        pass
    def before_backward(self):
    def before_backward(self, *args):
        # after loss computation, and before gradient backward
        pass
    def after_batch(self):
    def after_batch(self, *args):
        # at the end of each step/mini-batch
        pass
    def after_epoch(self):
    def after_epoch(self, *args):
        # at the end of each epoch
        pass
    def after_train(self):
    def after_train(self, *args):
        # after training loop
        pass
@@ -48,12 +48,12 @@ def transfer(func):
    :return:
    """
    def wrapper(manager):
    def wrapper(manager, *arg):
        returns = []
        for callback in manager.callbacks:
            for env_name, env_value in manager.env.items():
                setattr(callback, env_name, env_value)
            returns.append(getattr(callback, func.__name__)())
            returns.append(getattr(callback, func.__name__)(*arg))
        return returns
    return wrapper
@@ -91,19 +91,27 @@ class CallbackManager(Callback):
        pass
    @transfer
    def before_epoch(self):
    def before_epoch(self, cur_epoch, total_epoch):
        pass
    @transfer
    def before_batch(self):
    def before_batch(self, batch_x, batch_y, indices):
        pass
    @transfer
    def before_loss(self):
    def before_loss(self, batch_y, predict_y):
        pass
    @transfer
    def before_backward(self):
    def before_backward(self, loss, model):
        pass
    @transfer
    def after_backward(self, model):
        pass
    @transfer
    def after_step(self):
        pass
    @transfer
@@ -111,18 +119,25 @@ class CallbackManager(Callback):
        pass
    @transfer
    def after_epoch(self):
    def after_valid(self, eval_result, metric_key, optimizer):
        pass
    @transfer
    def after_train(self):
    def after_epoch(self, cur_epoch, n_epoch, optimizer):
        pass
    @transfer
    def after_train(self, model):
        pass
    @transfer
    def on_exception(self, exception, model, indices):
        pass
 class DummyCallback(Callback):
    def before_train(self):
        print("before train!!!")
        print(self.n_epoch)
    def before_train(self, *arg):
        print(arg)
    def after_epoch(self):
        print("after epoch!!!")
@@ -157,5 +172,5 @@ class EchoCallback(Callback):
 if __name__ == "__main__":
    manager = CallbackManager(env={"n_epoch": 3}, callbacks=[DummyCallback(), DummyCallback()])
    manager.before_train()
    print(manager.after_epoch())
    manager.before_train(10, 11, 12)
    # print(manager.after_epoch())
--- a/fastNLP/core/trainer.py
+++ b/fastNLP/core/trainer.py
@@ -203,7 +203,7 @@ class Trainer(object):
                self._tqdm_train()
            else:
                self._print_train()
            self.callback_manager.after_train()
            self.callback_manager.after_train(self.model)
            if self.dev_data is not None:
                print("\nIn Epoch:{}/Step:{}, got best dev performance:".format(self.best_dev_epoch, self.best_dev_step) +
@@ -229,24 +229,35 @@ class Trainer(object):
        self.step = 0
        data_iterator = Batch(self.train_data, batch_size=self.batch_size, sampler=self.sampler,
                                as_numpy=False)
        total_steps = data_iterator.num_batches*self.n_epochs
        total_steps = data_iterator.num_batches * self.n_epochs
        with tqdm(total=total_steps, postfix='loss:{0:<6.5f}', leave=False, dynamic_ncols=True) as pbar:
            avg_loss = 0
            for epoch in range(1, self.n_epochs+1):
                pbar.set_description_str(desc="Epoch {}/{}".format(epoch, self.n_epochs))
                self.callback_manager.before_epoch()
                # early stopping
                self.callback_manager.before_epoch(epoch, self.n_epochs)
                for batch_x, batch_y in data_iterator:
                    self.callback_manager.before_batch()
                    indices = data_iterator.get_batch_indices()
                    # negative sampling; replace unknown; re-weight batch_y
                    self.callback_manager.before_batch(batch_x, batch_y, indices)
                    _move_dict_value_to_device(batch_x, batch_y, device=self._model_device)
                    prediction = self._data_forward(self.model, batch_x)
                    self.callback_manager.before_loss()
                    # edit prediction
                    self.callback_manager.before_loss(batch_y, prediction)
                    loss = self._compute_loss(prediction, batch_y)
                    avg_loss += loss.item()
                    self.callback_manager.before_backward()
                    # Is loss NaN or inf? requires_grad = False
                    self.callback_manager.before_backward(loss, self.model)
                    self._grad_backward(loss)
                    # gradient clipping
                    self.callback_manager.after_backward(self.model)
                    self._update()
                    # lr scheduler; lr_finder; one_cycle
                    self.callback_manager.after_step()
                    self._summary_writer.add_scalar("loss", loss.item(), global_step=self.step)
                    for name, param in self.model.named_parameters():
                        if param.requires_grad:
@@ -258,23 +269,27 @@ class Trainer(object):
                        avg_loss = 0
                        pbar.update(self.print_every)
                    self.step += 1
                    # do nothing
                    self.callback_manager.after_batch()
                    if self.validate_every > 0 and self.step % self.validate_every == 0 \
                    if ((self.validate_every > 0 and self.step % self.validate_every == 0) or
                        (self.validate_every < 0 and self.step % self.batch_size == len(data_iterator))) \
                            and self.dev_data is not None:
                        eval_res = self._do_validation(epoch=epoch, step=self.step)
                        eval_str = "Epoch {}/{}. Step:{}/{}. ".format(epoch, self.n_epochs, self.step, total_steps) + \
                                   self.tester._format_eval_results(eval_res)
                        pbar.write(eval_str)
                if self.validate_every < 0 and self.dev_data:
                    eval_res = self._do_validation(epoch=epoch, step=self.step)
                    eval_str = "Epoch {}/{}. Step:{}/{}. ".format(epoch, self.n_epochs, self.step, total_steps) + \
                               self.tester._format_eval_results(eval_res)
                    pbar.write(eval_str)
                if epoch!=self.n_epochs:
                # if self.validate_every < 0 and self.dev_data:
                #     eval_res = self._do_validation(epoch=epoch, step=self.step)
                #     eval_str = "Epoch {}/{}. Step:{}/{}. ".format(epoch, self.n_epochs, self.step, total_steps) + \
                #                self.tester._format_eval_results(eval_res)
                #     pbar.write(eval_str)
                if epoch != self.n_epochs:
                    data_iterator = Batch(self.train_data, batch_size=self.batch_size, sampler=self.sampler,
                                          as_numpy=False)
                self.callback_manager.after_epoch()
                # lr decay; early stopping
                self.callback_manager.after_epoch(epoch, self.n_epochs, self.optimizer)
            pbar.close()
    def _print_train(self):
@@ -340,6 +355,8 @@ class Trainer(object):
            self.best_dev_perf = res
            self.best_dev_epoch = epoch
            self.best_dev_step = step
        # get validation results; adjust optimizer
        self.callback_manager.after_valid(res, self.metric_key, self.optimizer)
        return res
    def _mode(self, model, is_test=False):