Merge branch 'dev0.8.0' of github.com:fastnlp/fastNLP into dev0.8.0

3 years ago · 0500682191
--- a/fastNLP/core/drivers/paddle_driver/initialize_paddle_driver.py
+++ b/fastNLP/core/drivers/paddle_driver/initialize_paddle_driver.py
@@ -14,7 +14,7 @@ if _NEED_IMPORT_PADDLE:
    import paddle

 def initialize_paddle_driver(driver: str, device: Optional[Union[str, int, List[int]]],
                            model: paddle.nn.Layer, **kwargs) -> PaddleDriver:
                            model: "paddle.nn.Layer", **kwargs) -> PaddleDriver:
    r"""
    用来根据参数 `driver` 和 `device` 来确定并且初始化一个具体的 `Driver` 实例然后返回回去；
    1、如果检测到当前进程为用户通过 `python -m paddle.distributed.launch xxx.py` 方式拉起的，则将
--- a/fastNLP/core/drivers/torch_driver/initialize_torch_driver.py
+++ b/fastNLP/core/drivers/torch_driver/initialize_torch_driver.py
@@ -11,8 +11,8 @@ from fastNLP.core.log import logger
 from fastNLP.envs import FASTNLP_BACKEND_LAUNCH


 def initialize_torch_driver(driver: str, device: Optional[Union[str, torch.device, int, List[int]]],
                            model: torch.nn.Module, **kwargs) -> TorchDriver:
 def initialize_torch_driver(driver: str, device: Optional[Union[str, "torch.device", int, List[int]]],
                            model: "torch.nn.Module", **kwargs) -> TorchDriver:
    r"""
    用来根据参数 `driver` 和 `device` 来确定并且初始化一个具体的 `Driver` 实例然后返回回去；
    注意如果输入的 `device` 如果和 `driver` 对应不上就直接报错；
--- a/fastNLP/core/metrics/utils.py
+++ b/fastNLP/core/metrics/utils.py
@@ -11,9 +11,8 @@ _IS_ALLENNLP_AVAILABLE = _module_available('allennlp')
 if _IS_ALLENNLP_AVAILABLE:
    from allennlp.training.metrics import Metric as allennlp_Metric

 if _NEED_IMPORT_TORCH and _IS_TORCHMETRICS_AVAILABLE:
    if _IS_TORCHMETRICS_AVAILABLE:
        from torchmetrics import Metric as torchmetrics_Metric
 if _IS_TORCHMETRICS_AVAILABLE:
    from torchmetrics import Metric as torchmetrics_Metric

 if _NEED_IMPORT_PADDLE:
    from paddle.metric import Metric as paddle_Metric
--- a/tests/core/callbacks/test_load_best_model_callback_torch.py
+++ b/tests/core/callbacks/test_load_best_model_callback_torch.py
@@ -16,7 +16,7 @@ from fastNLP.core.controllers.trainer import Trainer
 from fastNLP.core.metrics.accuracy import Accuracy
 from fastNLP.core.callbacks.load_best_model_callback import LoadBestModelCallback
 from fastNLP.core import Evaluator
 from fastNLP.core.utils.utils import safe_rm
 from fastNLP.core import rank_zero_rm
 from fastNLP.core.drivers.torch_driver import TorchSingleDriver
 from tests.helpers.models.torch_model import TorchNormalModel_Classification_1
 from tests.helpers.datasets.torch_data import TorchArgMaxDataset
@@ -112,7 +112,7 @@ def test_load_best_model_callback(
    results = evaluator.run()
    assert np.allclose(callbacks[0].monitor_value, results['acc#acc#dl1'])
    if save_folder:
        safe_rm(save_folder)
        rank_zero_rm(save_folder)
    if dist.is_initialized():
        dist.destroy_process_group()

--- a/tests/core/controllers/_test_trainer_fleet.py
+++ b/tests/core/controllers/_test_trainer_fleet.py
@@ -4,7 +4,6 @@
 python -m paddle.distributed.launch --gpus=0,2,3 test_trainer_fleet.py
 """
 import os
 os.environ["FASTNLP_BACKEND"] = "paddle"
 import sys
 sys.path.append("../../../")

--- a/tests/core/controllers/_test_trainer_fleet_outside.py
+++ b/tests/core/controllers/_test_trainer_fleet_outside.py
@@ -4,7 +4,6 @@
 python -m paddle.distributed.launch --gpus=0,2,3 test_trainer_fleet_outside.py
 """
 import os
 os.environ["FASTNLP_BACKEND"] = "paddle"
 import sys
 sys.path.append("../../../")

--- a/tests/core/controllers/test_trainer_paddle.py
+++ b/tests/core/controllers/test_trainer_paddle.py
@@ -1,6 +1,4 @@
 import pytest
 import os
 os.environ["FASTNLP_BACKEND"] = "paddle"
 from dataclasses import dataclass

 from fastNLP.core.controllers.trainer import Trainer
@@ -25,7 +23,7 @@ class TrainPaddleConfig:
    shuffle: bool = True
    evaluate_every = 2

@pytest.mark.parametrize("driver,device", [("paddle", "cpu"), ("paddle", 1)])
@pytest.mark.parametrize("driver,device", [("paddle", "cpu"), ("paddle", 1), ("fleet", [0, 1])])
 # @pytest.mark.parametrize("driver,device", [("fleet", [0, 1])])
@pytest.mark.parametrize("callbacks", [[RecordMetricCallback(monitor="acc#acc", metric_threshold=0.0, larger_better=True), 
                                        RichCallback(5)]])
--- a/tests/core/dataloaders/jittor_dataloader/init.py
+++ b/tests/core/dataloaders/jittor_dataloader/init.py
--- a/tests/core/dataloaders/paddle_dataloader/init.py
+++ b/tests/core/dataloaders/paddle_dataloader/init.py
--- a/tests/core/dataloaders/torch_dataloader/init.py
+++ b/tests/core/dataloaders/torch_dataloader/init.py
--- a/tests/core/drivers/paddle_driver/test_dist_utils.py
+++ b/tests/core/drivers/paddle_driver/test_dist_utils.py
@@ -3,7 +3,6 @@ import sys
 import signal
 import pytest
 import traceback
 os.environ["FASTNLP_BACKEND"] = "paddle"

 import numpy as np

--- a/tests/core/drivers/paddle_driver/test_fleet.py
+++ b/tests/core/drivers/paddle_driver/test_fleet.py
@@ -1,8 +1,6 @@
 import pytest
 import os
 from pathlib import Path

 os.environ["FASTNLP_BACKEND"] = "paddle"
 from fastNLP.core.drivers.paddle_driver.fleet import PaddleFleetDriver
 from fastNLP.core.samplers import (
    RandomSampler,
--- a/tests/core/drivers/paddle_driver/test_initialize_paddle_driver.py
+++ b/tests/core/drivers/paddle_driver/test_initialize_paddle_driver.py
@@ -1,8 +1,5 @@
 import os
 import pytest

 os.environ["FASTNLP_BACKEND"] = "paddle"

 from fastNLP.core.drivers import PaddleSingleDriver, PaddleFleetDriver
 from fastNLP.core.drivers.paddle_driver.initialize_paddle_driver import initialize_paddle_driver
 from fastNLP.envs import get_gpu_count
--- a/tests/core/drivers/paddle_driver/test_single_device.py
+++ b/tests/core/drivers/paddle_driver/test_single_device.py
@@ -1,6 +1,3 @@
 import os
 from re import S
 os.environ["FASTNLP_BACKEND"] = "paddle"
 import pytest
 from pathlib import Path

--- a/tests/core/drivers/paddle_driver/test_utils.py
+++ b/tests/core/drivers/paddle_driver/test_utils.py
@@ -1,6 +1,4 @@
 import os
 import pytest
 os.environ["FASTNLP_BACKEND"] = "paddle"

 from fastNLP.core.drivers.paddle_driver.utils import (
    get_device_from_visible,
--- a/tests/core/drivers/torch_driver/test.py
+++ b/tests/core/drivers/torch_driver/test.py
@@ -0,0 +1,31 @@
 import sys
 sys.path.append("../../../../")
 from fastNLP.core.drivers.torch_driver.ddp import TorchDDPDriver
 from tests.helpers.models.torch_model import TorchNormalModel_Classification_1

 import torch

 device = [0, 1]
 torch_model = TorchNormalModel_Classification_1(10, 10)
 torch_opt = torch.optim.Adam(params=torch_model.parameters(), lr=0.01)
 device = [torch.device(i) for i in device]
 driver = TorchDDPDriver(
    model=torch_model,
    parallel_device=device,
    fp16=False
 )
 driver.set_optimizers(torch_opt)
 driver.setup()
 print("-----------first--------------")

 device = [0, 2]
 torch_model = TorchNormalModel_Classification_1(10, 10)
 torch_opt = torch.optim.Adam(params=torch_model.parameters(), lr=0.01)
 device = [torch.device(i) for i in device]
 driver = TorchDDPDriver(
    model=torch_model,
    parallel_device=device,
    fp16=False
 )
 driver.set_optimizers(torch_opt)
 driver.setup()
--- a/tests/core/drivers/torch_driver/test_ddp.py
+++ b/tests/core/drivers/torch_driver/test_ddp.py
@@ -1,8 +1,6 @@
 import pytest
 import os
 from pathlib import Path

 os.environ["FASTNLP_BACKEND"] = "torch"
 from fastNLP.core.drivers.torch_driver.ddp import TorchDDPDriver
 from fastNLP.core.samplers import (
    RandomSampler,
--- a/tests/core/drivers/torch_driver/test_initialize_torch_driver.py
+++ b/tests/core/drivers/torch_driver/test_initialize_torch_driver.py
@@ -1,8 +1,5 @@
 import os
 import pytest

 os.environ["FASTNLP_BACKEND"] = "torch"

 from fastNLP.core.drivers import TorchSingleDriver, TorchDDPDriver
 from fastNLP.core.drivers.torch_driver.initialize_torch_driver import initialize_torch_driver
 from fastNLP.envs import get_gpu_count
--- a/tests/core/drivers/torch_driver/test_single_device.py
+++ b/tests/core/drivers/torch_driver/test_single_device.py
@@ -1,5 +1,3 @@
 import os
 os.environ["FASTNLP_BACKEND"] = "torch"
 import pytest
 from pathlib import Path

--- a/tests/core/drivers/torch_driver/test_utils.py
+++ b/tests/core/drivers/torch_driver/test_utils.py
@@ -1,6 +1,4 @@
 import os
 import pytest
 os.environ["FASTNLP_BACKEND"] = "torch"

 from fastNLP.core.drivers.torch_driver.utils import (
    replace_batch_sampler,
--- a/tests/core/samplers/test_unrepeated_sampler.py
+++ b/tests/core/samplers/test_unrepeated_sampler.py
@@ -28,12 +28,12 @@ class TestUnrepeatedSampler:
    @pytest.mark.parametrize('num_replicas', [2, 3])
    @pytest.mark.parametrize('num_of_data', [2, 3, 4, 100])
    @pytest.mark.parametrize('shuffle', [False, True])
    def test_multi(self, num_replica, num_of_data, shuffle):
    def test_multi(self, num_replicas, num_of_data, shuffle):
        data = DatasetWithVaryLength(num_of_data=num_of_data)
        samplers = []
        for i in range(num_replica):
        for i in range(num_replicas):
            sampler = UnrepeatedRandomSampler(dataset=data, shuffle=shuffle)
            sampler.set_distributed(num_replica, rank=i)
            sampler.set_distributed(num_replicas, rank=i)
            samplers.append(sampler)

        indexes = list(chain(*samplers))
@@ -52,12 +52,12 @@ class TestUnrepeatedSortedSampler:

    @pytest.mark.parametrize('num_replicas', [2, 3])
    @pytest.mark.parametrize('num_of_data', [2, 3, 4, 100])
    def test_multi(self, num_replica, num_of_data):
    def test_multi(self, num_replicas, num_of_data):
        data = DatasetWithVaryLength(num_of_data=num_of_data)
        samplers = []
        for i in range(num_replica):
        for i in range(num_replicas):
            sampler = UnrepeatedSortedSampler(dataset=data, length=data.data)
            sampler.set_distributed(num_replica, rank=i)
            sampler.set_distributed(num_replicas, rank=i)
            samplers.append(sampler)

        # 保证顺序是没乱的
@@ -83,12 +83,12 @@ class TestUnrepeatedSequentialSampler:

    @pytest.mark.parametrize('num_replicas', [2, 3])
    @pytest.mark.parametrize('num_of_data', [2, 3, 4, 100])
    def test_multi(self, num_replica, num_of_data):
    def test_multi(self, num_replicas, num_of_data):
        data = DatasetWithVaryLength(num_of_data=num_of_data)
        samplers = []
        for i in range(num_replica):
        for i in range(num_replicas):
            sampler = UnrepeatedSequentialSampler(dataset=data, length=data.data)
            sampler.set_distributed(num_replica, rank=i)
            sampler.set_distributed(num_replicas, rank=i)
            samplers.append(sampler)

        # 保证顺序是没乱的