Are you sure you want to delete this task? Once this task is deleted, it cannot be recovered.
enlin 6c534ad7d3 | 2 years ago | |
---|---|---|
.. | ||
docs | 2 years ago | |
src/main | 3 years ago | |
.gitignore | 3 years ago | |
README.md | 3 years ago | |
pom.xml | 4 years ago |
该模块是分布式训练CRD的控制器,管理分布式训练容器生命周期,为分布式训练容器注入其他容器ip。
安装如下软件环境。
git clone https://codeup.teambition.com/zhejianglab/distribute-train-operator.git
# 进入项目根目录
cd distribute-train-operator
# 构建,生成的 jar 包位于 ./target/distribute-train-operator-1.0.jar
mvn clean compile package
部署过程参看文档:部署 分布式训练operator
一站式算法开发平台、高性能分布式深度学习框架、先进算法模型库、视觉模型炼知平台、数据可视化分析平台等一系列平台及工具,在模型高效分布式训练、数据处理和可视分析、模型炼知和轻量化等技术上形成独特优势,目前已在产学研等各领域近千家单位及个人提供AI应用赋能
Java Vue Python Text JavaScript other