From 7325f78dfb900578b52badcacf9b1bab30626e34 Mon Sep 17 00:00:00 2001 From: ChenXin Date: Fri, 24 May 2019 01:21:29 +0800 Subject: [PATCH] =?UTF-8?q?=E4=BF=AE=E6=94=B9=E4=BA=86=E4=B8=80=E4=BA=9B?= =?UTF-8?q?=E6=96=87=E6=A1=A3=E9=97=AE=E9=A2=98?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- fastNLP/core/callback.py | 9 +++++---- fastNLP/core/trainer.py | 7 ++++--- 2 files changed, 9 insertions(+), 7 deletions(-) diff --git a/fastNLP/core/callback.py b/fastNLP/core/callback.py index 07654cc8..e617cf2a 100644 --- a/fastNLP/core/callback.py +++ b/fastNLP/core/callback.py @@ -370,16 +370,17 @@ class GradientClipCallback(Callback): 每次backward前,将parameter的gradient clip到某个范围。 - :param None,torch.Tensor,List[torch.Tensor] parameters: 一般通过model.parameters()获得。如果为None则默认对Trainer - 的model中所有参数进行clip + :param None,torch.Tensor,List[torch.Tensor] parameters: 一般通过model.parameters()获得。 + 如果为None则默认对Trainer的model中所有参数进行clip :param float clip_value: 将gradient 限制到[-clip_value, clip_value]。clip_value应该为正数 :param str clip_type: 支持'norm', 'value' 两种:: 1 'norm', 将gradient的norm rescale到[-clip_value, clip_value] - 2 'value', 将gradient限制在[-clip_value, clip_value], 小于-clip_value的gradient被赋值为-clip_value; - 大于clip_value的gradient被赋值为clip_value. + 2 'value', 将gradient限制在[-clip_value, clip_value], + 小于-clip_value的gradient被赋值为-clip_value; + 大于clip_value的gradient被赋值为clip_value. """ diff --git a/fastNLP/core/trainer.py b/fastNLP/core/trainer.py index 702cb6e7..2523a957 100644 --- a/fastNLP/core/trainer.py +++ b/fastNLP/core/trainer.py @@ -498,14 +498,15 @@ class Trainer(object): """ 使用该函数使Trainer开始训练。 - :param bool load_best_model: 该参数只有在初始化提供了dev_data的情况下有效,如果True, trainer将在返回之前重新加载dev表现 - 最好的模型参数。 + :param bool load_best_model: 该参数只有在初始化提供了dev_data的情况下有效, + 如果True, trainer将在返回之前重新加载dev表现最好的模型参数。 :return dict: 返回一个字典类型的数据, 内含以下内容:: seconds: float, 表示训练时长 以下三个内容只有在提供了dev_data的情况下会有。 - best_eval: Dict of Dict, 表示evaluation的结果。第一层的key为Metric的名称,第二层的key为具体的Metric + best_eval: Dict of Dict, 表示evaluation的结果。第一层的key为Metric的名称, + 第二层的key为具体的Metric best_epoch: int,在第几个epoch取得的最佳值 best_step: int, 在第几个step(batch)更新取得的最佳值