From fc2712d748577c98cb2c7e34afd30bd82eb2d724 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?=E4=B9=8B=E6=B1=9F=E5=AE=9E=E9=AA=8C=E5=AE=A4?= Date: Mon, 26 Oct 2020 17:05:15 +0800 Subject: [PATCH] update CHANGELOG --- dubhe-server/CHANGELOG.md | 28 ++++++++++++++++++++++++++++ webapp/CHANGELOG.md | 4 ++-- 2 files changed, 30 insertions(+), 2 deletions(-) create mode 100644 dubhe-server/CHANGELOG.md diff --git a/dubhe-server/CHANGELOG.md b/dubhe-server/CHANGELOG.md new file mode 100644 index 0000000..5995bd7 --- /dev/null +++ b/dubhe-server/CHANGELOG.md @@ -0,0 +1,28 @@ +## 0.2.0 (2020-10-26) +### Breaking Changes + +1. 支持 OneFlow、TensorFlow、PyTorch 等主流框架的多机多卡模式分布式训练 +2. 基于状态机的数据集状态重构,将业务代码和状态变更完全解耦,实现零延时的状态变更响应能力 +3. 添加分布式算法调度。引入任务调度,将算法和应用解耦,支持多算法程序节点并行处理任务,并基于 k8s 实现算法节点自动伸缩 +4. 将标签和数据集拆分,引入「标签组」统一管理标签,实现标签可复用、可重组 +5. 训练时支持将已有模型作为训练入参 +6. 训练时支持区分训练数据集与验证数据集 +7. 平台后端日志分流,区分用户请求日志、平台日志、定时任务日志;精简日志信息 +8. 增加定时任务,异步清理垃圾数据(用户上传文件、训练/模型删除文件、大批量数据集文件) + +### Features + +1. 数据集图片手动标注优化。支持对标注像素级位置、大小调整,支持常见缩放、拖拽、平移等操作 +2. 通用数据权限方案改造。对业务代码零侵入性的权限方案,实现基于用户,角色,资源的权限数据管理 +3. 超大数据集操作流程优化。实现超大数据集( 10w+ 文件)的前端、后端、存储全流程平滑操作 +4. 支持本地已有数据集兼容。系统提供标准数据集模板,用户按照规范导入数据集文件,实现数据集全功能兼容 +5. 模型开发Notebook 超时(默认 4h )自动关闭并回收资源 +6. 断点续训功能、模型下载功能、模型保存功能支持通过目录树选择模型文件/文件夹 +7. 文件上传增加进度条展示 +8. 训练创建页,增加运行命令预览功能;训练详情页,增加算法在线编辑跳转功能 +9. 训练支持延时启动、定时停止功能 +10. 训练日志、运行日志下载功能优化,避免大文件导致的浏览器卡死 +11. 镜像管理功能,镜像名称支持自定义;支持镜像的删除、修改等操作;镜像上传后自动清除 docker load 镜像 +12. 上传算法功能、训练创建功能、训练终止功能性能优化 +13. CPU/GPU 规格类配置支持管理员控制台管理 +14. 增加训练失败异常信息反馈 diff --git a/webapp/CHANGELOG.md b/webapp/CHANGELOG.md index c8cbda0..01c5561 100644 --- a/webapp/CHANGELOG.md +++ b/webapp/CHANGELOG.md @@ -1,6 +1,6 @@ -## 1.1.0 (2020-10-26) +## 0.2.0 (2020-10-26) -### Breaking Change +### Breaking Changes - [数据管理] 导入数据集功能重构。系统提供标准数据集模板,用户按照规范导入数据集文件,实现数据集全功能兼容 - [训练管理] 支持OneFlow、TensorFlow、Pytorch等主流框架的多机多卡模式分布式训练