Are you sure you want to delete this task? Once this task is deleted, it cannot be recovered.
wjtest001 4d579cf1e0 | 2 years ago | |
---|---|---|
.. | ||
README.md | 2 years ago | |
config.py | 2 years ago | |
dataset.py | 2 years ago | |
dataset_distributed.py | 2 years ago | |
inference.py | 2 years ago | |
inference_for_multidataset.py | 2 years ago | |
lenet.py | 2 years ago | |
train.py | 2 years ago | |
train_for_c2net.py | 2 years ago | |
train_for_multidataset.py | 2 years ago |
MNISTData数据集是由10类28∗28的灰度图片组成,训练数据集包含60000张图片,测试数据集包含10000张图片。
数据集压缩包的目录结构如下:
MNIST_Data.zip ├── test │ ├── t10k-images-idx3-ubyte │ └── t10k-labels-idx1-ubyte └── train ├── train-images-idx3-ubyte └── train-labels-idx1-ubyte
checkpoint_lenet-1_1875.zip ├── checkpoint_lenet-1_1875.ckpt
train.py,启智集群单数据集训练的脚本文件,包括将数据集从obs拷贝到训练镜像中、指定迭代次数、把训练后的模型数据拷贝回obs等。具体说明请参考train.py的代码注释
train_for_c2net.py,智算网络训练的脚本文件,包括指定迭代次数等。具体说明请参考train_for_c2net.py的代码注释
train_for_multidataset.py,启智集群包括多数据集训练的脚本文件,将多数据集从obs拷贝到训练镜像中、指定迭代次数、把训练后的模型数据拷贝回obs等。具体说明请参考train_for_multidataset.py的代码注释
inference.py,启智集群用于推理的脚本文件,包括将数据集从obs拷贝到训练镜像中、指定迭代次数、把训练后的模型数据拷贝回obs等。具体说明请参考inference.py的代码注释
config.py,网络配置信息,在单数据集训练,多数据集训练,智算网络训练等训练脚本中会使用到。
dataset.py,对原始数据集进行预处理,产生可用于网络训练的数据集,在单数据集的训练,多数据集的训练,智算网络的训练等训练脚本中会使用到。
lenet.py,使用的训练网络,在单数据集训练,多数据集训练,智算网络训练等训练脚本中会使用到。
dataset_distributes.py,对原始数据集进行预处理,产生可用于单机多卡训练的数据集。
表1 创建训练作业界面参数说明
参数名称 | 说明 |
---|---|
代码分支 | 选择仓库代码中要使用的代码分支,默认可选择master分支。 |
AI引擎 | AI引擎选择[Ascend-Powered-Engine]和所需的MindSpore版本(本示例图片为 [Mindspore-1.3.0-python3.7-aarch64],请注意使用与所选版本对应的脚本)。 |
启动文件 | 启动文件选择代码目录下的启动脚本。 |
数据集 | 数据集选择已上传到启智平台的数据集。 |
运行参数 | 单数据集数据存储位置和训练输出位置分别对应运行参数data_url和train_url,注意多数据集需要增加参数multi_data_url并在代码中声明,选择增加运行参数可以向脚本中其他参数传值,如epoch_size。在这里只需填入其他参数传值,data_url和train_url已默认加入运行参数,用户无需重复指定,只需在代码中指定。 |
资源池 | 规格选择[Ascend: 1 * Ascend 910 CPU:24 核 256GiB],表示单机单卡 |
No Description
Python Jupyter Notebook Text other