!601 Add the summary loading switch mechanism

Merge pull request !601 from LiHongzhang/fix_caching
5 years ago · 5e6932f0f6
--- a/mindinsight/backend/data_manager/init.py
+++ b/mindinsight/backend/data_manager/init.py
@@ -13,8 +13,8 @@
 # limitations under the License.
 # ============================================================================
 """Trigger data manager load."""
 import time

 from mindinsight.conf import settings
 from mindinsight.datavisual.common.log import logger
 from mindinsight.datavisual.data_transform.data_manager import DATA_MANAGER
 from mindinsight.lineagemgr.cache_item_updater import LineageCacheItemUpdater
@@ -31,5 +31,7 @@ def init_module(app):
    # Just to suppress pylint warning about unused arg.
    logger.debug("App: %s", type(app))
    DATA_MANAGER.register_brief_cache_item_updater(LineageCacheItemUpdater())
    DATA_MANAGER.start_load_data(reload_interval=int(settings.RELOAD_INTERVAL),
                                 max_threads_count=int(settings.MAX_THREADS_COUNT))
    # Let gunicorn load other modules first.
    time.sleep(1)

    DATA_MANAGER.start_load_data(auto_reload=True)
--- a/mindinsight/common/hook/datavisual.py
+++ b/mindinsight/common/hook/datavisual.py
@@ -17,29 +17,9 @@
 import argparse
 import os

 from mindinsight.conf import settings
 from mindinsight.utils.hook import BaseHook


 class ReloadIntervalAction(argparse.Action):
    """Reload interval action class definition."""

    def __call__(self, parser, namespace, values, option_string=None):
        """
        Inherited __call__ method from argparse.Action.

        Args:
            parser (ArgumentParser): Passed-in argument parser.
            namespace (Namespace): Namespace object to hold arguments.
            values (object): Argument values with type depending on argument definition.
            option_string (str): Option string for specific argument name.
        """
        reload_interval = values
        if reload_interval < 0:
            parser.error(f'{option_string} should be greater than or equal to 0')
        setattr(namespace, self.dest, reload_interval)


 class SummaryBaseDirAction(argparse.Action):
    """Summary base dir action class definition."""

@@ -67,15 +47,6 @@ class Hook(BaseHook):
        Args:
            parser (ArgumentParser): Specify parser to which arguments are added.
        """
        parser.add_argument(
            '--reload-interval',
            type=int,
            action=ReloadIntervalAction,
            help="""
                data reload time(Seconds). It should be greater than 0 or equal to 0.
                If it equals 0, load data only once. Default value is %s seconds.
            """ % settings.RELOAD_INTERVAL)

        parser.add_argument(
            '--summary-base-dir',
            type=str,
--- a/mindinsight/conf/constants.py
+++ b/mindinsight/conf/constants.py
@@ -14,35 +14,7 @@
 # ============================================================================
 """Constants module for mindinsight settings."""
 import logging
 import math
 import os


 _DEFAULT_MAX_THREADS_COUNT = 15


 def _calc_default_max_processes_cnt():
    """Calc default processes count."""

    # We need to make sure every summary directory has a process to load data.
    min_cnt = _DEFAULT_MAX_THREADS_COUNT
    # Do not use too many processes to avoid system problems (eg. out of memory).
    max_cnt = 45
    used_cpu_ratio = 0.75

    cpu_count = os.cpu_count()
    if cpu_count is None:
        return min_cnt

    processes_cnt = math.floor(cpu_count * used_cpu_ratio)

    if processes_cnt < min_cnt:
        return min_cnt

    if processes_cnt > max_cnt:
        return max_cnt

    return processes_cnt
 import multiprocessing


 ####################################
@@ -77,8 +49,7 @@ API_PREFIX = '/v1/mindinsight'
 ####################################
 # Datavisual default settings.
 ####################################
 MAX_THREADS_COUNT = _DEFAULT_MAX_THREADS_COUNT
 MAX_PROCESSES_COUNT = _calc_default_max_processes_cnt()
 MAX_PROCESSES_COUNT = max(min(int(multiprocessing.cpu_count() * 0.75), 45), 1)

 MAX_TAG_SIZE_PER_EVENTS_DATA = 300
 DEFAULT_STEP_SIZES_PER_TAG = 500
--- a/mindinsight/conf/defaults.py
+++ b/mindinsight/conf/defaults.py
@@ -35,5 +35,4 @@ ENABLE_DEBUGGER = False
 ####################################
 # Datavisual default settings.
 ####################################
 RELOAD_INTERVAL = 3  # Seconds
 SUMMARY_BASE_DIR = os.getcwd()
--- a/mindinsight/datavisual/common/enums.py
+++ b/mindinsight/datavisual/common/enums.py
@@ -32,13 +32,6 @@ class DataManagerStatus(BaseEnum):
    INVALID = 'INVALID'


 class DetailCacheManagerStatus(BaseEnum):
    """Data manager status."""
    INIT = 'INIT'
    LOADING = 'LOADING'
    DONE = 'DONE'


 class PluginNameEnum(BaseEnum):
    """Plugin Name Enum."""
    IMAGE = 'image'
--- a/mindinsight/datavisual/data_transform/data_loader.py
+++ b/mindinsight/datavisual/data_transform/data_loader.py
@@ -34,11 +34,14 @@ class DataLoader:
        self._summary_dir = summary_dir
        self._loader = None

    def load(self, computing_resource_mgr):
    def load(self, executor=None):
        """Load the data when loader is exist.

        Args:
            computing_resource_mgr (ComputingResourceManager): The ComputingResourceManager instance.
            executor (Optional[Executor]): The executor instance.

        Returns:
            bool, True if the loader is finished loading.
        """

        if self._loader is None:
@@ -53,7 +56,7 @@ class DataLoader:
                logger.warning("No valid files can be loaded, summary_dir: %s.", self._summary_dir)
                raise exceptions.SummaryLogPathInvalid()

        self._loader.load(computing_resource_mgr)
        return self._loader.load(executor)

    def get_events_data(self):
        """
--- a/mindinsight/datavisual/data_transform/data_manager.py
+++ b/mindinsight/datavisual/data_transform/data_manager.py
@@ -27,15 +27,13 @@ import time
 import os
 from typing import Iterable, Optional

 from concurrent.futures import ThreadPoolExecutor, wait, ALL_COMPLETED

 from mindinsight.datavisual.data_transform.summary_watcher import SummaryWatcher

 from mindinsight.conf import settings
 from mindinsight.datavisual.common import exceptions
 from mindinsight.datavisual.common.enums import CacheStatus
 from mindinsight.datavisual.common.log import logger
 from mindinsight.datavisual.common.enums import DataManagerStatus, DetailCacheManagerStatus
 from mindinsight.datavisual.common.enums import DataManagerStatus
 from mindinsight.datavisual.common.enums import PluginNameEnum
 from mindinsight.datavisual.common.exceptions import TrainJobNotExistError
 from mindinsight.datavisual.data_transform.loader_generators.loader_generator import MAX_DATA_LOADER_SIZE
@@ -294,7 +292,8 @@ class BaseCacheItemUpdater(abc.ABC):
 class _BaseCacheManager:
    """Base class for cache manager."""

    def __init__(self):
    def __init__(self, summary_base_dir):
        self._summary_base_dir = summary_base_dir
        # Use dict to remove duplicate updaters.
        self._updaters = {}

@@ -342,40 +341,17 @@ class _BaseCacheManager:
        """Whether this cache manager has train jobs."""
        return bool(self._cache_items)

    def update_cache(self, disk_train_jobs: Iterable[_BasicTrainJob]):
    def update_cache(self, executor):
        """
        Update cache according to given train jobs on disk.

        Different cache manager should implement different cache update policies in this method.

        Args:
            disk_train_jobs (Iterable[_BasicTrainJob]): Train jobs on disk.
            executor (Executor): The Executor instance.
        """
        raise NotImplementedError()

    def _merge_with_disk(self, disk_train_jobs: Iterable[_BasicTrainJob]):
        """
        Merge train jobs in cache with train jobs from disk

        This method will remove train jobs not on disk. Call this function with lock for thread safety.

        Args:
            disk_train_jobs (Iterable[_BasicTrainJob]): Basic train jobs info from disk.

        Returns:
            dict, a dict containing train jobs to be cached.
        """
        new_cache_items = {}
        for train_job in disk_train_jobs:
            if train_job.train_id not in self._cache_items:
                new_cache_items[train_job.train_id] = CachedTrainJob(train_job)
            else:
                reused_train_job = self._cache_items[train_job.train_id]
                reused_train_job.basic_info = train_job
                new_cache_items[train_job.train_id] = reused_train_job

        return new_cache_items


 class _BriefCacheManager(_BaseCacheManager):
    """A cache manager that holds all disk train jobs on disk."""
@@ -394,15 +370,57 @@ class _BriefCacheManager(_BaseCacheManager):

        return False

    def update_cache(self, disk_train_jobs):
    def update_cache(self, executor):
        """Update cache."""
        logger.info('Start to update BriefCacheManager.')
        summaries_info = SummaryWatcher().list_summary_directories(self._summary_base_dir)

        basic_train_jobs = []
        for info in summaries_info:
            profiler = info['profiler']
            basic_train_jobs.append(_BasicTrainJob(
                train_id=info['relative_path'],
                abs_summary_base_dir=self._summary_base_dir,
                abs_summary_dir=os.path.realpath(os.path.join(
                    self._summary_base_dir,
                    info['relative_path']
                )),
                create_time=info['create_time'],
                update_time=info['update_time'],
                profiler_dir=None if profiler is None else profiler['directory'],
                profiler_type="" if profiler is None else profiler['profiler_type'],
            ))

        with self._lock:
            new_cache_items = self._merge_with_disk(disk_train_jobs)
            new_cache_items = self._merge_with_disk(basic_train_jobs)
            self._cache_items = new_cache_items
        for updater in self._updaters.values():
            for cache_item in self._cache_items.values():
                updater.update_item(cache_item)

    def _merge_with_disk(self, disk_train_jobs: Iterable[_BasicTrainJob]):
        """
        Merge train jobs in cache with train jobs from disk

        This method will remove train jobs not on disk. Call this function with lock for thread safety.

        Args:
            disk_train_jobs (Iterable[_BasicTrainJob]): Basic train jobs info from disk.

        Returns:
            dict, a dict containing train jobs to be cached.
        """
        new_cache_items = {}
        for train_job in disk_train_jobs:
            if train_job.train_id not in self._cache_items:
                new_cache_items[train_job.train_id] = CachedTrainJob(train_job)
            else:
                reused_train_job = self._cache_items[train_job.train_id]
                reused_train_job.basic_info = train_job
                new_cache_items[train_job.train_id] = reused_train_job

        return new_cache_items

    @property
    def cache_items(self):
        """Get cache items."""
@@ -417,21 +435,14 @@ DATAVISUAL_CACHE_KEY = "datavisual"

 class _DetailCacheManager(_BaseCacheManager):
    """A cache manager that holds detailed info for most recently used train jobs."""
    def __init__(self, loader_generators):
        super().__init__()
    def __init__(self, summary_base_dir):
        super().__init__(summary_base_dir)
        self._loader_pool = {}
        self._deleted_id_list = []
        self._loader_pool_mutex = threading.Lock()
        self._max_threads_count = 30
        self._loader_generators = loader_generators
        self._status = DetailCacheManagerStatus.INIT.value
        self._loader_generators = [DataLoaderGenerator(summary_base_dir)]
        self._loading_mutex = threading.Lock()

    @property
    def status(self):
        """Get loading status, if it is loading, return True."""
        return self._status

    def has_content(self):
        """Whether this cache manager has train jobs."""
        return bool(self._loader_pool)
@@ -451,37 +462,22 @@ class _DetailCacheManager(_BaseCacheManager):
        """Get loader pool size."""
        return len(self._loader_pool)

    def _load_in_cache(self):
        """Generate and execute loaders."""
        def load():
            self._generate_loaders()
            self._execute_load_data()
        try:
            exception_wrapper(load())
        except UnknownError as ex:
            logger.warning("Load event data failed. Detail: %s.", str(ex))
        finally:
            self._status = DetailCacheManagerStatus.DONE.value
        logger.info("Load event data end, status: %r, and loader pool size is %r.",
                    self._status, self.loader_pool_size())

    def update_cache(self, disk_train_jobs: Iterable[_BasicTrainJob]):
    def update_cache(self, executor):
        """
        Update cache.

        Will switch to using disk_train_jobs in the future.

        Args:
            disk_train_jobs (Iterable[_BasicTrainJob]): Basic info about train jobs on disk.

            executor (Executor): The Executor instance.
        """
        with self._loading_mutex:
            if self._status == DetailCacheManagerStatus.LOADING.value:
                logger.debug("Event data is loading, and loader pool size is %r.", self.loader_pool_size())
                return
            self._status = DetailCacheManagerStatus.LOADING.value
            thread = threading.Thread(target=self._load_in_cache, name="load_detail_in_cache")
            thread.start()
            load_in_cache = exception_wrapper(self._execute_load_data)
            try:
                while not load_in_cache(executor):
                    yield
            except UnknownError as ex:
                logger.warning("Load event data failed. Detail: %s.", str(ex))

    def cache_train_job(self, train_id):
        """Cache given train job."""
@@ -501,11 +497,6 @@ class _DetailCacheManager(_BaseCacheManager):
                if loader is None:
                    raise TrainJobNotExistError(train_id)

                # Update cache status loader to CACHING if loader is NOT_IN_CACHE
                # before triggering the next interval.
                if loader.cache_status == CacheStatus.NOT_IN_CACHE:
                    loader.cache_status = CacheStatus.CACHING

                self._add_loader(loader)
                need_reload = True

@@ -546,7 +537,7 @@ class _DetailCacheManager(_BaseCacheManager):
            logger.debug("delete loader %s", loader_id)
            self._loader_pool.pop(loader_id)

    def _execute_loader(self, loader_id, computing_resource_mgr):
    def _execute_loader(self, loader_id, executor):
        """
        Load data form data_loader.

@@ -554,20 +545,25 @@ class _DetailCacheManager(_BaseCacheManager):

        Args:
            loader_id (str): An ID for `Loader`.
            computing_resource_mgr (ComputingResourceManager): The ComputingResourceManager instance.
            executor (Executor): The Executor instance.

        Returns:
            bool, True if the loader is finished loading.
        """
        try:
            with self._loader_pool_mutex:
                loader = self._loader_pool.get(loader_id, None)
                if loader is None:
                    logger.debug("Loader %r has been deleted, will not load data.", loader_id)
                    return
                    return True

            loader.data_loader.load(computing_resource_mgr)

            # Update loader cache status to CACHED.
            # Loader with cache status CACHED should remain the same cache status.
            loader.cache_status = CacheStatus.CACHED
            loader.cache_status = CacheStatus.CACHING
            if loader.data_loader.load(executor):
                # Update loader cache status to CACHED.
                # Loader with cache status CACHED should remain the same cache status.
                loader.cache_status = CacheStatus.CACHED
                return True
            return False

        except MindInsightException as ex:
            logger.warning("Data loader %r load data failed. "
@@ -575,6 +571,7 @@ class _DetailCacheManager(_BaseCacheManager):

            with self._loader_pool_mutex:
                self._delete_loader(loader_id)
            return True

    def _generate_loaders(self):
        """This function generates the loader from given path."""
@@ -607,38 +604,14 @@ class _DetailCacheManager(_BaseCacheManager):
                if self._loader_pool[loader_id].latest_update_time < loader.latest_update_time:
                    self._update_loader_latest_update_time(loader_id, loader.latest_update_time)

    def _execute_load_data(self):
    def _execute_load_data(self, executor):
        """Load data through multiple threads."""
        threads_count = self._get_threads_count()
        if not threads_count:
            logger.info("Can not find any valid train log path to load, loader pool is empty.")
            return

        logger.info("Start to execute load data. threads_count: %s.", threads_count)

        with ComputingResourceManager(
                executors_cnt=threads_count,
                max_processes_cnt=settings.MAX_PROCESSES_COUNT) as computing_resource_mgr:

            with ThreadPoolExecutor(max_workers=threads_count) as executor:
                futures = []
                loader_pool = self._get_snapshot_loader_pool()
                for loader_id in loader_pool:
                    future = executor.submit(self._execute_loader, loader_id, computing_resource_mgr)
                    futures.append(future)
                wait(futures, return_when=ALL_COMPLETED)

    def _get_threads_count(self):
        """
        Use the maximum number of threads available.

        Returns:
            int, number of threads.

        """
        threads_count = min(self._max_threads_count, len(self._loader_pool))

        return threads_count
        self._generate_loaders()
        loader_pool = self._get_snapshot_loader_pool()
        loaded = True
        for loader_id in loader_pool:
            loaded = self._execute_loader(loader_id, executor) and loaded
        return loaded

    def delete_train_job(self, train_id):
        """
@@ -864,11 +837,8 @@ class DataManager:
        self._status = DataManagerStatus.INIT.value
        self._status_mutex = threading.Lock()

        self._reload_interval = 3

        loader_generators = [DataLoaderGenerator(self._summary_base_dir)]
        self._detail_cache = _DetailCacheManager(loader_generators)
        self._brief_cache = _BriefCacheManager()
        self._detail_cache = _DetailCacheManager(self._summary_base_dir)
        self._brief_cache = _BriefCacheManager(self._summary_base_dir)

        # This lock is used to make sure that only one self._load_data_in_thread() is running.
        # Because self._load_data_in_thread() will create process pool when loading files, we can not
@@ -880,126 +850,58 @@ class DataManager:
        """Get summary base dir."""
        return self._summary_base_dir

    def start_load_data(self,
                        reload_interval=settings.RELOAD_INTERVAL,
                        max_threads_count=MAX_DATA_LOADER_SIZE):
    def start_load_data(self, auto_reload=False):
        """
        Start threads for loading data.

        Args:
            reload_interval (int): Time to reload data once.
            max_threads_count (int): Max number of threads of execution.

        """
        logger.info("Start to load data, reload_interval: %s, "
                    "max_threads_count: %s.", reload_interval, max_threads_count)
        DataManager.check_reload_interval(reload_interval)
        DataManager.check_max_threads_count(max_threads_count)

        self._reload_interval = reload_interval
        self._max_threads_count = max_threads_count

        thread = threading.Thread(target=self._reload_data_in_thread,
                                  name='start_load_data_thread')
        thread.daemon = True
        thread.start()

    def _reload_data_in_thread(self):
        """This function periodically loads the data."""
        # Let gunicorn load other modules first.
        time.sleep(1)
        while True:
            self._load_data_in_thread_wrapper()

            if not self._reload_interval:
                break
            time.sleep(self._reload_interval)

    def reload_data(self):
        """
        Reload the data once.

        This function needs to be used after `start_load_data` function.
        Returns:
            Thread, the background Thread instance.
        """
        logger.debug("start to reload data")
        logger.info("Start to load data")
        thread = threading.Thread(target=self._load_data_in_thread_wrapper,
                                  name='reload_data_thread')
        thread.daemon = False
                                  name='start_load_data_thread',
                                  args=(auto_reload,),
                                  daemon=True)
        thread.daemon = True
        thread.start()
        return thread

    def _load_data_in_thread_wrapper(self):
    def _load_data_in_thread_wrapper(self, auto_reload):
        """Wrapper for load data in thread."""
        if self._load_data_lock.locked():
            return
        try:
            with self._load_data_lock:
                exception_wrapper(self._load_data())
                while True:
                    exception_wrapper(self._load_data)()
                    if not auto_reload:
                        break
        except UnknownError as exc:
            # Not raising the exception here to ensure that data reloading does not crash.
            logger.warning(exc.message)

    def _load_data(self):
        """This function will load data once and ignore it if the status is loading."""
        logger.info("Start to load data, reload interval: %r.", self._reload_interval)
        with self._status_mutex:
            if self.status == DataManagerStatus.LOADING.value:
                logger.debug("Current status is %s , will ignore to load data.", self.status)
                return
            self.status = DataManagerStatus.LOADING.value

        summaries_info = SummaryWatcher().list_summary_directories(self._summary_base_dir)

        basic_train_jobs = []
        for info in summaries_info:
            profiler = info['profiler']
            basic_train_jobs.append(_BasicTrainJob(
                train_id=info['relative_path'],
                abs_summary_base_dir=self._summary_base_dir,
                abs_summary_dir=os.path.realpath(os.path.join(
                    self._summary_base_dir,
                    info['relative_path']
                )),
                create_time=info['create_time'],
                update_time=info['update_time'],
                profiler_dir=None if profiler is None else profiler['directory'],
                profiler_type="" if profiler is None else profiler['profiler_type'],
            ))

        self._brief_cache.update_cache(basic_train_jobs)
        self._detail_cache.update_cache(basic_train_jobs)

        if not self._brief_cache.has_content() and not self._detail_cache.has_content() \
                and self._detail_cache.status == DetailCacheManagerStatus.DONE.value:
            self.status = DataManagerStatus.INVALID.value
        else:
            self.status = DataManagerStatus.DONE.value

        logger.info("Load brief data end, and loader pool size is %r.", self._detail_cache.loader_pool_size())

    @staticmethod
    def check_reload_interval(reload_interval):
        """
        Check reload interval is valid.

        Args:
            reload_interval (int): Reload interval >= 0.
        """
        if not isinstance(reload_interval, int):
            raise ParamValueError("The value of reload interval should be integer.")

        if reload_interval < 0:
            raise ParamValueError("The value of reload interval should be >= 0.")

    @staticmethod
    def check_max_threads_count(max_threads_count):
        """
        Threads count should be a integer, and should > 0.

        Args:
            max_threads_count (int), should > 0.
        """
        if not isinstance(max_threads_count, int):
            raise ParamValueError("The value of max threads count should be integer.")
        if max_threads_count <= 0:
            raise ParamValueError("The value of max threads count should be > 0.")
        with ComputingResourceManager(executors_cnt=1,
                                      max_processes_cnt=settings.MAX_PROCESSES_COUNT) as computing_resource_mgr:
            with computing_resource_mgr.get_executor() as executor:
                self._brief_cache.update_cache(executor)
                for _ in self._detail_cache.update_cache(executor):
                    self._brief_cache.update_cache(executor)
                executor.wait_all_tasks_finish()
            with self._status_mutex:
                if not self._brief_cache.has_content() and not self._detail_cache.has_content():
                    self.status = DataManagerStatus.INVALID.value
                else:
                    self.status = DataManagerStatus.DONE.value

                logger.info("Load brief data end, and loader pool size is %r.", self._detail_cache.loader_pool_size())

    def get_train_job_by_plugin(self, train_id, plugin_name):
        """
@@ -1093,7 +995,7 @@ class DataManager:
        brief_need_reload = self._brief_cache.cache_train_job(train_id)
        detail_need_reload = self._detail_cache.cache_train_job(train_id)
        if brief_need_reload or detail_need_reload:
            self.reload_data()
            self.start_load_data()

    def register_brief_cache_item_updater(self, updater: BaseCacheItemUpdater):
        """Register brief cache item updater for brief cache manager."""
@@ -1107,9 +1009,5 @@ class DataManager:
        """Get brief train job."""
        return self._brief_cache.get_train_job(train_id)

    def get_detail_cache_status(self):
        """Get detail status, just for ut/st."""
        return self._detail_cache.status


 DATA_MANAGER = DataManager(settings.SUMMARY_BASE_DIR)
--- a/mindinsight/datavisual/data_transform/ms_data_loader.py
+++ b/mindinsight/datavisual/data_transform/ms_data_loader.py
@@ -39,6 +39,7 @@ from mindinsight.datavisual.data_transform.tensor_container import TensorContain
 from mindinsight.datavisual.proto_files import mindinsight_anf_ir_pb2 as anf_ir_pb2
 from mindinsight.datavisual.proto_files import mindinsight_summary_pb2 as summary_pb2
 from mindinsight.datavisual.utils import crc32
 from mindinsight.utils.computing_resource_mgr import ComputingResourceManager, Executor
 from mindinsight.utils.exceptions import UnknownError

 HEADER_SIZE = 8
@@ -81,16 +82,44 @@ class MSDataLoader:
                           "we will reload all files in path %s.", self._summary_dir)
            self.__init__(self._summary_dir)

    def load(self, computing_resource_mgr):
    def load(self, executor=None):
        """
        Load all log valid files.

        When the file is reloaded, it will continue to load from where it left off.

        Args:
            computing_resource_mgr (ComputingResourceManager): The ComputingResourceManager instance.
            executor (Optional[executor]): The Executor instance.

        Returns:
            bool, True if the train job is finished loading.
        """
        logger.debug("Start to load data in ms data loader.")
        if isinstance(executor, Executor):
            return self._load(executor)

        if executor is not None:
            raise TypeError("'executor' should be an Executor instance or None.")

        with ComputingResourceManager() as mgr:
            with mgr.get_executor() as new_executor:
                while not self._load(new_executor):
                    pass
                new_executor.wait_all_tasks_finish()
                return True

    def _load(self, executor):
        """
        Load all log valid files.

        When the file is reloaded, it will continue to load from where it left off.

        Args:
            executor (executor): The Executor instance.

        Returns:
            bool, True if the train job is finished loading.
        """
        filenames = self.filter_valid_files()
        if not filenames:
            logger.warning("No valid files can be loaded, summary_dir: %s.", self._summary_dir)
@@ -99,9 +128,10 @@ class MSDataLoader:
        self._valid_filenames = filenames
        self._check_files_deleted(filenames, old_filenames)

        with computing_resource_mgr.get_executor() as executor:
            for parser in self._parser_list:
                parser.parse_files(executor, filenames, events_data=self._events_data)
        finished = True
        for parser in self._parser_list:
            finished = parser.parse_files(executor, filenames, events_data=self._events_data) and finished
        return finished

    def filter_valid_files(self):
        """
@@ -127,9 +157,8 @@ class _Parser:
    """Parsed base class."""

    def __init__(self, summary_dir):
        self._latest_filename = ''
        self._latest_mtime = 0
        self._summary_dir = summary_dir
        self._latest_filename = ''

    def parse_files(self, executor, filenames, events_data):
        """
@@ -142,12 +171,6 @@ class _Parser:
        """
        raise NotImplementedError

    def sort_files(self, filenames):
        """Sort by modify time increments and filenames increments."""
        filenames = sorted(filenames, key=lambda file: (
            FileHandler.file_stat(FileHandler.join(self._summary_dir, file)).mtime, file))
        return filenames

    def filter_files(self, filenames):
        """
        Gets a list of files that this parsing class can parse.
@@ -160,30 +183,14 @@ class _Parser:
        """
        raise NotImplementedError

    def _set_latest_file(self, filename):
        """
        Check if the file's modification time is newer than the last time it was loaded, and if so, set the time.

        Args:
            filename (str): The file name that needs to be checked and set.

        Returns:
            bool, Returns True if the file was modified earlier than the last time it was loaded, or False.
        """
        mtime = FileHandler.file_stat(FileHandler.join(self._summary_dir, filename)).mtime
        if mtime < self._latest_mtime or \
                (mtime == self._latest_mtime and filename <= self._latest_filename):
            return False

        self._latest_mtime = mtime
        self._latest_filename = filename

        return True


 class _PbParser(_Parser):
    """This class is used to parse pb file."""

    def __init__(self, summary_dir):
        super(_PbParser, self).__init__(summary_dir)
        self._latest_mtime = 0

    def parse_files(self, executor, filenames, events_data):
        pb_filenames = self.filter_files(filenames)
        pb_filenames = self.sort_files(pb_filenames)
@@ -198,6 +205,8 @@ class _PbParser(_Parser):
                continue

            events_data.add_tensor_event(tensor_event)
            return False
        return True

    def filter_files(self, filenames):
        """
@@ -208,9 +217,38 @@ class _PbParser(_Parser):

        Returns:
            list[str], filename list.

        Returns:
            bool, True if all the pb files are finished loading.
        """
        return list(filter(lambda filename: re.search(r'\.pb$', filename), filenames))

    def sort_files(self, filenames):
        """Sort by modify time increments and filenames increments."""
        filenames = sorted(filenames, key=lambda file: (
            FileHandler.file_stat(FileHandler.join(self._summary_dir, file)).mtime, file))
        return filenames

    def _set_latest_file(self, filename):
        """
        Check if the file's modification time is newer than the last time it was loaded, and if so, set the time.

        Args:
            filename (str): The file name that needs to be checked and set.

        Returns:
            bool, Returns True if the file was modified earlier than the last time it was loaded, or False.
        """
        mtime = FileHandler.file_stat(FileHandler.join(self._summary_dir, filename)).mtime
        if mtime < self._latest_mtime or \
                (mtime == self._latest_mtime and filename <= self._latest_filename):
            return False

        self._latest_mtime = mtime
        self._latest_filename = filename

        return True

    def _parse_pb_file(self, filename):
        """
        Parse pb file and write content to `EventsData`.
@@ -270,16 +308,18 @@ class _SummaryParser(_Parser):
            executor (Executor): The executor instance.
            filenames (list[str]): File name list.
            events_data (EventsData): The container of event data.

        Returns:
            bool, True if all the summary files are finished loading.
        """
        self._events_data = events_data
        summary_files = self.filter_files(filenames)
        summary_files = self.sort_files(summary_files)
        if self._latest_filename in summary_files:
            index = summary_files.index(self._latest_filename)
            summary_files = summary_files[index:]

        for filename in summary_files:
            if self._latest_filename and \
                    (self._compare_summary_file(self._latest_filename, filename)):
                continue

            file_path = FileHandler.join(self._summary_dir, filename)

            if filename != self._latest_filename:
@@ -291,15 +331,18 @@ class _SummaryParser(_Parser):
            if new_size == self._latest_file_size:
                continue

            self._latest_file_size = new_size
            try:
                self._load_single_file(self._summary_file_handler, executor)
                if not self._load_single_file(self._summary_file_handler, executor):
                    self._latest_file_size = self._summary_file_handler.offset
                else:
                    self._latest_file_size = new_size
                # Wait for data in this file to be processed to avoid loading multiple files at the same time.
                executor.wait_all_tasks_finish()
                logger.info("Parse summary file finished, file path: %s.", file_path)
                logger.info("Parse summary file offset %d, file path: %s.", self._latest_file_size, file_path)
                return False
            except UnknownError as ex:
                logger.warning("Parse summary file failed, detail: %r,"
                               "file path: %s.", str(ex), file_path)
        return True

    def filter_files(self, filenames):
        """
@@ -322,6 +365,9 @@ class _SummaryParser(_Parser):
        Args:
            file_handler (FileHandler): A file handler.
            executor (Executor): The executor instance.

        Returns:
            bool, True if the summary file is finished loading.
        """
        while True:
            start_offset = file_handler.offset
@@ -329,7 +375,7 @@ class _SummaryParser(_Parser):
                event_str = self._event_load(file_handler)
                if event_str is None:
                    file_handler.reset_offset(start_offset)
                    break
                    return True
                if len(event_str) > MAX_EVENT_STRING:
                    logger.warning("file_path: %s, event string: %d exceeds %d and drop it.",
                                   file_handler.file_path, len(event_str), MAX_EVENT_STRING)
@@ -358,15 +404,16 @@ class _SummaryParser(_Parser):
                        raise

                future.add_done_callback(_add_tensor_event_callback)
                return False
            except exceptions.CRCFailedError:
                file_handler.reset_offset(start_offset)
                logger.warning("Check crc faild and ignore this file, file_path=%s, "
                               "offset=%s.", file_handler.file_path, file_handler.offset)
                break
                return True
            except (OSError, DecodeError, exceptions.MindInsightException) as ex:
                logger.warning("Parse log file fail, and ignore this file, detail: %r,"
                               "file path: %s.", str(ex), file_handler.file_path)
                break
                return True
            except Exception as ex:
                logger.exception(ex)
                raise UnknownError(str(ex))
@@ -509,24 +556,6 @@ class _SummaryParser(_Parser):

        return ret_tensor_events

    @staticmethod
    def _compare_summary_file(current_file, dst_file):
        """
        Compare the creation times of the two summary log files.

        Args:
            current_file (str): Must be the summary log file path.
            dst_file (str): Must be the summary log file path.

        Returns:
            bool, returns True if the current file is new, or False if not.
        """
        current_time = int(re.search(r'summary\.(\d+)', current_file)[1])
        dst_time = int(re.search(r'summary\.(\d+)', dst_file)[1])
        if current_time > dst_time or (current_time == dst_time and current_file > dst_file):
            return True
        return False

    def sort_files(self, filenames):
        """Sort by creating time increments and filenames decrement."""
        filenames = sorted(filenames,
--- a/mindinsight/datavisual/processors/train_task_manager.py
+++ b/mindinsight/datavisual/processors/train_task_manager.py
@@ -189,10 +189,7 @@ class TrainTaskManager(BaseProcessor):
                logger.warning('Train job %s not existed', train_id)
                continue

            if train_job.cache_status == CacheStatus.NOT_IN_CACHE:
                self._data_manager.cache_train_job(train_id)
                # Update loader cache status to CACHING for consistency in response.
                train_job.cache_status = CacheStatus.CACHING
            self._data_manager.cache_train_job(train_id)

            cache_result.append(dict(
                train_id=train_id,
--- a/mindinsight/datavisual/utils/crc32/init.pyi
+++ b/mindinsight/datavisual/utils/crc32/init.pyi
@@ -13,11 +13,14 @@
 # limitations under the License.
 # ============================================================================
 """crc32 type stub module."""
 from typing import Union

 ByteStr = Union[bytes, str]

 def CheckValueAgainstData(crc_value: bytes, data: bytes, size: int) -> bool:

 def CheckValueAgainstData(crc_value: ByteStr, data: ByteStr, size: int) -> bool:
    """Check crc_value against new crc value from data to see if data is currupted."""


 def GetMaskCrc32cValue(data: bytes, n: int) -> int:
 def GetMaskCrc32cValue(data: ByteStr, n: int) -> int:
    """Get masked crc value from data."""
--- a/mindinsight/datavisual/utils/tools.py
+++ b/mindinsight/datavisual/utils/tools.py
@@ -240,7 +240,7 @@ def if_nan_inf_to_none(name, value):
 def exception_wrapper(func):
    def wrapper(*args, **kwargs):
        try:
            func(*args, **kwargs)
            return func(*args, **kwargs)
        except Exception as exc:
            logger.exception(exc)
            raise UnknownError(str(exc))
--- a/mindinsight/utils/computing_resource_mgr.py
+++ b/mindinsight/utils/computing_resource_mgr.py
@@ -37,7 +37,7 @@ class ComputingResourceManager:
        executors_cnt (int): Number of executors to be provided by this class.
        max_processes_cnt (int): Max number of processes to be used for computing.
    """
    def __init__(self, executors_cnt, max_processes_cnt):
    def __init__(self, executors_cnt=1, max_processes_cnt=4):
        self._max_processes_cnt = max_processes_cnt
        self._executors_cnt = executors_cnt
        self._lock = threading.Lock()
--- a/tests/st/func/datavisual/conftest.py
+++ b/tests/st/func/datavisual/conftest.py
@@ -29,7 +29,6 @@ from mindinsight.datavisual.data_transform.loader_generators.loader_generator im
 from mindinsight.datavisual.utils import tools

 from ....utils.log_operations import LogOperations
 from ....utils.tools import check_loading_done
 from . import constants
 from . import globals as gbl

@@ -59,8 +58,7 @@ def init_summary_logs():
        summaries_metadata = log_operations.create_summary_logs(summary_base_dir, constants.SUMMARY_DIR_NUM_FIRST,
                                                                constants.SUMMARY_DIR_PREFIX)
        mock_data_manager = DataManager(summary_base_dir)
        mock_data_manager.start_load_data(reload_interval=0)
        check_loading_done(mock_data_manager)
        mock_data_manager.start_load_data().join()

        summaries_metadata.update(
            log_operations.create_summary_logs(summary_base_dir, constants.SUMMARY_DIR_NUM_SECOND,
@@ -72,10 +70,7 @@ def init_summary_logs():
        summaries_metadata.update(
            log_operations.create_reservoir_log(summary_base_dir, constants.RESERVOIR_DIR_NAME,
                                                constants.RESERVOIR_STEP_NUM))
        mock_data_manager.start_load_data(reload_interval=0)

        # Sleep 1 sec to make sure the status of mock_data_manager changed to LOADING.
        check_loading_done(mock_data_manager, first_sleep_time=1)
        mock_data_manager.start_load_data().join()

        # Maximum number of loads is `MAX_DATA_LOADER_SIZE`.
        for i in range(len(summaries_metadata) - MAX_DATA_LOADER_SIZE):
@@ -98,8 +93,7 @@ def populate_globals():
 def client():
    """This fixture is flask client."""

    gbl.mock_data_manager.start_load_data(reload_interval=0)
    check_loading_done(gbl.mock_data_manager)
    gbl.mock_data_manager.start_load_data().join()

    data_manager.DATA_MANAGER = gbl.mock_data_manager

--- a/tests/st/func/lineagemgr/cache/test_lineage_cache.py
+++ b/tests/st/func/lineagemgr/cache/test_lineage_cache.py
@@ -32,7 +32,7 @@ from ..test_model import LINEAGE_INFO_RUN1, LINEAGE_FILTRATION_EXCEPT_RUN, \
    LINEAGE_FILTRATION_RUN1, LINEAGE_FILTRATION_RUN2
 from ..conftest import BASE_SUMMARY_DIR
 from .....ut.lineagemgr.querier import event_data
 from .....utils.tools import check_loading_done, assert_equal_lineages
 from .....utils.tools import assert_equal_lineages


@pytest.mark.usefixtures("create_summary_dir")
@@ -42,8 +42,7 @@ class TestModelApi(TestCase):
    def setup_class(cls):
        data_manager = DataManager(BASE_SUMMARY_DIR)
        data_manager.register_brief_cache_item_updater(LineageCacheItemUpdater())
        data_manager.start_load_data(reload_interval=0)
        check_loading_done(data_manager)
        data_manager.start_load_data().join()

        cls._data_manger = data_manager

--- a/tests/ut/datavisual/data_transform/test_data_loader.py
+++ b/tests/ut/datavisual/data_transform/test_data_loader.py
@@ -27,7 +27,6 @@ import pytest
 from mindinsight.datavisual.common.exceptions import SummaryLogPathInvalid
 from mindinsight.datavisual.data_transform import data_loader
 from mindinsight.datavisual.data_transform.data_loader import DataLoader
 from mindinsight.utils.computing_resource_mgr import ComputingResourceManager

 from ..mock import MockLogger

@@ -58,7 +57,7 @@ class TestDataLoader:
        """Test loading method with empty file list."""
        loader = DataLoader(self._summary_dir)
        with pytest.raises(SummaryLogPathInvalid):
            loader.load(ComputingResourceManager(1, 1))
            loader.load()
        assert 'No valid files can be loaded' in str(MockLogger.log_msg['warning'])

    def test_load_with_invalid_file_list(self):
@@ -67,7 +66,7 @@ class TestDataLoader:
        self._generate_files(self._summary_dir, file_list)
        loader = DataLoader(self._summary_dir)
        with pytest.raises(SummaryLogPathInvalid):
            loader.load(ComputingResourceManager(1, 1))
            loader.load()
        assert 'No valid files can be loaded' in str(MockLogger.log_msg['warning'])

    def test_load_success(self):
@@ -78,6 +77,6 @@ class TestDataLoader:
        file_list = ['summary.001', 'summary.002']
        self._generate_files(dir_path, file_list)
        dataloader = DataLoader(dir_path)
        dataloader.load(ComputingResourceManager(1, 1))
        dataloader.load()
        assert dataloader._loader is not None
        shutil.rmtree(dir_path)
--- a/tests/ut/datavisual/data_transform/test_data_manager.py
+++ b/tests/ut/datavisual/data_transform/test_data_manager.py
@@ -38,7 +38,6 @@ from mindinsight.datavisual.data_transform.loader_generators.loader_struct impor
 from mindinsight.datavisual.data_transform.ms_data_loader import MSDataLoader
 from mindinsight.utils.exceptions import ParamValueError

 from ....utils.tools import check_loading_done
 from ..mock import MockLogger


@@ -90,31 +89,9 @@ class TestDataManager:

        data_manager.logger = MockLogger
        mock_manager = data_manager.DataManager(summary_base_dir)
        mock_manager.start_load_data(reload_interval=0)
        mock_manager.start_load_data().join()

        check_loading_done(mock_manager)

        assert MockLogger.log_msg['info'] == "Load event data end, status: 'DONE', " \
                                             "and loader pool size is '3'."
        shutil.rmtree(summary_base_dir)

    @pytest.mark.parametrize('params', [{
        'reload_interval': '30'
    }, {
        'reload_interval': -1
    }, {
        'reload_interval': 30,
        'max_threads_count': '20'
    }, {
        'reload_interval': 30,
        'max_threads_count': 0
    }])
    def test_start_load_data_with_invalid_params(self, params):
        """Test start_load_data with invalid reload_interval or invalid max_threads_count."""
        summary_base_dir = tempfile.mkdtemp()
        d_manager = DataManager(summary_base_dir)
        with pytest.raises(ParamValueError):
            d_manager.start_load_data(**params)
        assert MockLogger.log_msg['info'] == "Load brief data end, and loader pool size is '3'."
        shutil.rmtree(summary_base_dir)

    def test_list_tensors_success(self):
@@ -201,10 +178,9 @@ class TestDataManager:

        mock_generate_loaders.return_value = loader_dict
        mock_data_manager = data_manager.DataManager(summary_base_dir)
        mock_data_manager._detail_cache._execute_load_data = Mock()
        mock_data_manager._detail_cache._execute_loader = Mock()

        mock_data_manager.start_load_data(reload_interval=0)
        check_loading_done(mock_data_manager, 3)
        mock_data_manager.start_load_data().join()
        current_loader_ids = mock_data_manager._detail_cache._loader_pool.keys()

        assert sorted(current_loader_ids) == sorted(expected_loader_ids)
@@ -215,11 +191,8 @@ class TestDataManager:
        expected_loader_ids.extend(list(loader_dict.keys()))
        expected_loader_ids = expected_loader_ids[-MAX_DATA_LOADER_SIZE:]

        # Make sure to finish loading, make it init.
        mock_data_manager._detail_cache._status = DataManagerStatus.INIT.value
        mock_generate_loaders.return_value = loader_dict
        mock_data_manager.start_load_data(reload_interval=0)
        check_loading_done(mock_data_manager)
        mock_data_manager.start_load_data().join()
        current_loader_ids = mock_data_manager._detail_cache._loader_pool.keys()

        assert sorted(current_loader_ids) == sorted(expected_loader_ids)
--- a/tests/ut/datavisual/data_transform/test_ms_data_loader.py
+++ b/tests/ut/datavisual/data_transform/test_ms_data_loader.py
@@ -30,7 +30,6 @@ from mindinsight.datavisual.data_transform.ms_data_loader import MSDataLoader
 from mindinsight.datavisual.data_transform.ms_data_loader import _PbParser
 from mindinsight.datavisual.data_transform.events_data import TensorEvent
 from mindinsight.datavisual.common.enums import PluginNameEnum
 from mindinsight.utils.computing_resource_mgr import ComputingResourceManager

 from ..mock import MockLogger
 from ....utils.log_generators.graph_pb_generator import create_graph_pb_file
@@ -86,7 +85,7 @@ class TestMsDataLoader:
        write_file(file1, SCALAR_RECORD)
        ms_loader = MSDataLoader(summary_dir)
        ms_loader._latest_summary_filename = 'summary.00'
        ms_loader.load(ComputingResourceManager(1, 1))
        ms_loader.load()
        shutil.rmtree(summary_dir)
        tag = ms_loader.get_events_data().list_tags_by_plugin('scalar')
        tensors = ms_loader.get_events_data().tensors(tag[0])
@@ -99,7 +98,7 @@ class TestMsDataLoader:
        file2 = os.path.join(summary_dir, 'summary.02')
        write_file(file2, SCALAR_RECORD)
        ms_loader = MSDataLoader(summary_dir)
        ms_loader.load(ComputingResourceManager(1, 1))
        ms_loader.load()
        shutil.rmtree(summary_dir)
        assert 'Check crc faild and ignore this file' in str(MockLogger.log_msg['warning'])

@@ -125,7 +124,7 @@ class TestMsDataLoader:
        summary_dir = tempfile.mkdtemp()
        create_graph_pb_file(output_dir=summary_dir, filename=filename)
        ms_loader = MSDataLoader(summary_dir)
        ms_loader.load(ComputingResourceManager(1, 1))
        ms_loader.load()
        events_data = ms_loader.get_events_data()
        plugins = events_data.list_tags_by_plugin(PluginNameEnum.GRAPH.value)
        shutil.rmtree(summary_dir)
--- a/tests/ut/datavisual/processors/test_graph_processor.py
+++ b/tests/ut/datavisual/processors/test_graph_processor.py
@@ -35,7 +35,7 @@ from mindinsight.datavisual.utils import crc32
 from mindinsight.utils.exceptions import ParamValueError

 from ....utils.log_operations import LogOperations
 from ....utils.tools import check_loading_done, compare_result_with_file, delete_files_or_dirs
 from ....utils.tools import compare_result_with_file, delete_files_or_dirs
 from ..mock import MockLogger


@@ -74,10 +74,7 @@ class TestGraphProcessor:
        self._generated_path.append(summary_base_dir)

        self._mock_data_manager = data_manager.DataManager(summary_base_dir)
        self._mock_data_manager.start_load_data(reload_interval=0)

        # wait for loading done
        check_loading_done(self._mock_data_manager, time_limit=5)
        self._mock_data_manager.start_load_data().join()

    @pytest.fixture(scope='function')
    def load_no_graph_record(self):
@@ -93,10 +90,7 @@ class TestGraphProcessor:
        self._generated_path.append(summary_base_dir)

        self._mock_data_manager = data_manager.DataManager(summary_base_dir)
        self._mock_data_manager.start_load_data(reload_interval=0)

        # wait for loading done
        check_loading_done(self._mock_data_manager, time_limit=5)
        self._mock_data_manager.start_load_data().join()

    @pytest.mark.usefixtures('load_graph_record')
    def test_get_nodes_with_not_exist_train_id(self):
--- a/tests/ut/datavisual/processors/test_histogram_processor.py
+++ b/tests/ut/datavisual/processors/test_histogram_processor.py
@@ -31,7 +31,7 @@ from mindinsight.datavisual.processors.histogram_processor import HistogramProce
 from mindinsight.datavisual.utils import crc32

 from ....utils.log_operations import LogOperations
 from ....utils.tools import check_loading_done, delete_files_or_dirs
 from ....utils.tools import delete_files_or_dirs
 from ..mock import MockLogger


@@ -72,10 +72,7 @@ class TestHistogramProcessor:
        self._generated_path.append(summary_base_dir)

        self._mock_data_manager = data_manager.DataManager(summary_base_dir)
        self._mock_data_manager.start_load_data(reload_interval=0)

        # wait for loading done
        check_loading_done(self._mock_data_manager, time_limit=5)
        self._mock_data_manager.start_load_data().join()

    @pytest.mark.usefixtures('load_histogram_record')
    def test_get_histograms_with_not_exist_id(self):
--- a/tests/ut/datavisual/processors/test_images_processor.py
+++ b/tests/ut/datavisual/processors/test_images_processor.py
@@ -31,7 +31,7 @@ from mindinsight.datavisual.processors.images_processor import ImageProcessor
 from mindinsight.datavisual.utils import crc32

 from ....utils.log_operations import LogOperations
 from ....utils.tools import check_loading_done, delete_files_or_dirs, get_image_tensor_from_bytes
 from ....utils.tools import delete_files_or_dirs, get_image_tensor_from_bytes
 from ..mock import MockLogger


@@ -81,10 +81,7 @@ class TestImagesProcessor:
        self._generated_path.append(summary_base_dir)

        self._mock_data_manager = data_manager.DataManager(summary_base_dir)
        self._mock_data_manager.start_load_data(reload_interval=0)

        # wait for loading done
        check_loading_done(self._mock_data_manager, time_limit=5)
        self._mock_data_manager.start_load_data().join()

    @pytest.fixture(scope='function')
    def load_image_record(self):
--- a/tests/ut/datavisual/processors/test_scalars_processor.py
+++ b/tests/ut/datavisual/processors/test_scalars_processor.py
@@ -31,7 +31,7 @@ from mindinsight.datavisual.processors.scalars_processor import ScalarsProcessor
 from mindinsight.datavisual.utils import crc32

 from ....utils.log_operations import LogOperations
 from ....utils.tools import check_loading_done, delete_files_or_dirs
 from ....utils.tools import delete_files_or_dirs
 from ..mock import MockLogger


@@ -73,10 +73,7 @@ class TestScalarsProcessor:
        self._generated_path.append(summary_base_dir)

        self._mock_data_manager = data_manager.DataManager(summary_base_dir)
        self._mock_data_manager.start_load_data(reload_interval=0)

        # wait for loading done
        check_loading_done(self._mock_data_manager, time_limit=5)
        self._mock_data_manager.start_load_data().join()

    @pytest.mark.usefixtures('load_scalar_record')
    def test_get_metadata_list_with_not_exist_id(self):
--- a/tests/ut/datavisual/processors/test_tensor_processor.py
+++ b/tests/ut/datavisual/processors/test_tensor_processor.py
@@ -36,7 +36,7 @@ from mindinsight.utils.exceptions import ParamValueError
 from mindinsight.utils.exceptions import ParamMissError

 from ....utils.log_operations import LogOperations
 from ....utils.tools import check_loading_done, delete_files_or_dirs
 from ....utils.tools import delete_files_or_dirs
 from ..mock import MockLogger


@@ -77,10 +77,7 @@ class TestTensorProcessor:
        self._generated_path.append(summary_base_dir)

        self._mock_data_manager = data_manager.DataManager(summary_base_dir)
        self._mock_data_manager.start_load_data(reload_interval=0)

        # wait for loading done
        check_loading_done(self._mock_data_manager, time_limit=3)
        self._mock_data_manager.start_load_data().join()

    @pytest.mark.usefixtures('load_tensor_record')
    def test_get_tensors_with_not_exist_id(self):
--- a/tests/ut/datavisual/processors/test_train_task_manager.py
+++ b/tests/ut/datavisual/processors/test_train_task_manager.py
@@ -31,7 +31,7 @@ from mindinsight.datavisual.processors.train_task_manager import TrainTaskManage
 from mindinsight.datavisual.utils import crc32

 from ....utils.log_operations import LogOperations
 from ....utils.tools import check_loading_done, delete_files_or_dirs
 from ....utils.tools import delete_files_or_dirs
 from ..mock import MockLogger


@@ -97,9 +97,7 @@ class TestTrainTaskManager:
        self._generated_path.append(self._root_dir)

        self._mock_data_manager = data_manager.DataManager(self._root_dir)
        self._mock_data_manager.start_load_data(reload_interval=0)

        check_loading_done(self._mock_data_manager, time_limit=30)
        self._mock_data_manager.start_load_data().join()

    @pytest.mark.usefixtures('load_data')
    def test_get_single_train_task_with_not_exists_train_id(self):
--- a/tests/utils/tools.py
+++ b/tests/utils/tools.py
@@ -18,7 +18,6 @@ Description: This file is used for some common util.
 import io
 import os
 import shutil
 import time
 import json

 from urllib.parse import urlencode
@@ -26,8 +25,6 @@ from urllib.parse import urlencode
 import numpy as np
 from PIL import Image

 from mindinsight.datavisual.common.enums import DetailCacheManagerStatus


 def get_url(url, params):
    """
@@ -54,20 +51,6 @@ def delete_files_or_dirs(path_list):
            os.remove(path)


 def check_loading_done(data_manager, time_limit=15, first_sleep_time=0):
    """If loading data for more than `time_limit` seconds, exit."""
    if first_sleep_time > 0:
        time.sleep(first_sleep_time)
    start_time = time.time()
    while data_manager.get_detail_cache_status() != DetailCacheManagerStatus.DONE.value:
        time_used = time.time() - start_time
        if time_used > time_limit:
            break
        time.sleep(0.1)
        continue
    return bool(data_manager.get_detail_cache_status == DetailCacheManagerStatus.DONE.value)


 def get_image_tensor_from_bytes(image_string):
    """Get image tensor from bytes."""
    img = Image.open(io.BytesIO(image_string))