History

之江实验室 e2743c1873 init		5 years ago
..
backend	init	5 years ago

parser_service	init	5 years ago

service_utils	init	5 years ago

.gitignore	init	5 years ago

README.md	init	5 years ago

dubhe_visual.yaml	init	5 years ago

services	init	5 years ago

start_dubhe_visual_server.sh	init	5 years ago

README.md

以下数据格式仅供参考，以实际返回为准
- 类目信息
- Scalar
- Image
- Histogram
- Distribution
- Text
- Audio
- Embedding
- Graph
- exception
- Hyperparam

依赖

依赖 Python3.7 环境，建议使用 Anaconda 创建虚拟环境

# 创建虚拟环境
conda create --file dubhe_visual.yaml
# 激活 dubhe_visual
conda activate dubhe_visual

依赖 Redis 作为中间件

启动

启动及部署过程参看文档：部署可视化服务

初始请求

在用户初始请求时，先请求等待页面api/init?id=test&trainJobName=test其中参数id与参数trainJobName必须指定。这里请求的是用户为test，train为test的日志。

待后端载入完成指定用后的日志后，若成功则返回：

{"code": 200, "msg": "ok", "data": {"msg": "success", "session_id": "avzppbc6e2jo3t5bbhpokh96gp1vrgju"}}

以下数据格式仅供参考，以实际返回为准

类目信息

在初始化完成后，需请求类目信息。

请求apiapi/getCategory返回所有类目的标签，若日志中不存在某一类目信息，则返回空数组。

其中图graphtag信息，固定为s_graph与c_graph；超参数没有tag，若日志中含有超参数则返回tag为true

格式如下：

返回数据格式如下：

{
	.:    {
            scalar: {}, 
            media: {image: [], audio: [], text: []}, 
            statistic: {histogram: []}, 
            graph: [],
        	...
    	}
	train: {
            scalar: {epoch_loss: ["epoch_loss"], epoch_accuracy: ["epoch_accuracy"]}
            media: {image: [],…}
            statistic: {histogram: []}
            graph: ["c_graph"]
            embedding: ["layer1/weights/Variable:0", "layer1/biases/Variable:0", …]
        	hparams: ["true"]
            custom: ["true"]
            }
	vgg: {
            scalar: {,…}
            media: {,…}
            statistic: {,…}
            graph: ["s_graph"]
            embedding: []
        	hparams: []
            custom: ["true"]
		 }
}

Scalar

根据tag，请求api：api/scalar?run=.&tag=layer1/weights/summaries/mean得到tag为layer1/weights/summaries/mean的数据

其中run与tag缺一不可

返回数据格式

{
    "layer1/weights/summaries/mean": 
    [
    	{"wall_time": 1587176310.3070214, "step": 0, "value": -6.488610961241648e-05}, 
    						..., 
    	{"wall_time": 1587176425.348953, "step": 190, "value": -0.002039810409769416}
	]
}

随后随着数据量的增大，可能直接返回数组形式

[
    [1587176310.3070214, 0, 0.12780000269412994],
 					...
 	[1587176425.348953, 190, 0.9401999711990356]
]

第一列是wall_time，第二列是step，第三列是value

Image

由于前端不能处理图片，所以图片请求分为两个地址

图片的信息，请求api：api/image?run=.&tag=input_reshape/input/image/0可获得tag为input_reshape/input/image/0的图片信息

其中run与tag缺一不可

返回数据格式

{
	"input_reshape/input/image/0": 
    [
	 	{"wall_time": 1587176317.1721938, "step": 10, "width": 28, "height": 28},
							...
	 	{"wall_time": 1587176425.348953, "step": 190, "width": 28, "height": 28}
    ]
}

拿到图片信息之后，再向后台请求图片

请求api：api/image_raw?step=0&run=.&tag=input_reshape/input/image/0可获得tag为input_reshape/input/image/0在第0代时候的图片

其中step、run与tag缺一不可

返回数据为图像本身

Histogram

请求api：api/histogram?run=.&tag=layer1/weights/summaries/histogram/histogram_summary可获得tag为layer1/weights/summaries/histogram/histogram_summary的数据

其中run与tag缺一不可

返回数据格式

{
   "layer1/activations/histogram_summary": 
	[
        [1587176317.1721938, 10, 0.0, 5.297224044799805, 
 			[[0.0, 0.17657413482666015, 2801825.0], 
  							...
  			 [5.120649909973144, 5.297224044799805, 2.0]]
         ],
							...
         [1587176425.348953, 190, 0.0, 6.3502936363220215, 
  			[[0.0, 0.2116764545440674, 3229943.0],
   							...
   			 [6.1386171817779545, 6.3502936363220215, 8.0]]
         ]
   	 ]
}

格式为

[
    wall_time, step, min, max, 
	[[left, right, num],
			...
	 [left, right, num]]
]

Distribution

请求api：api/distribution?run=.&tag=layer1/weights/summaries/histogram/histogram_summary可获得tag为layer1/weights/summaries/histogram/histogram_summary的数据

其中run与tag缺一不可

返回数据格式

{"layer1/activations/histogram_summary":
 	[
    	[1587176310.3070214, 0, 
  			[[0, 0.0], [668, 0.020253705367086237],..., [10000, 4.971314430236816]]], 	
								...,
		[1587176419.1604998, 180, 
			[[0, 0.0], [668, 0.021192153914175192],..., [10000, 6.3502936363220215]]]
	]
}

格式为

[
    wall_time, step,
		[[precentage, value],...,[precentage, value]]
]

precentage取值分别为0, 668, 1587, 3085, 5000, 6915, 8413, 9332, 10000 对应标准正态分布的百分位数。

Text

请求api：api/text?run=.&tag=custom_tag可获得tag为custom_tag的数据

其中run与tag缺一不可（目前只有一个数据集，run可随意给，不进行校验）

返回数据格式

{
    "custom_tag": 
 	[
 		{"wall_time": 1585807655.373738, "step": 0, 
 		 "value": "\u8fd9\u662f\u7b2c0\u53e5\u8bdd"},
 						..., 
		{"wall_time": 1585807656.327519, "step": 99, 
          "value": "\u8fd9\u662f\u7b2c99\u53e5\u8bdd"}
	]
}

Audio

与图片类似，由于前端不能处理音频，所以音频请求分为两个地址

音频的信息，请求api：api/audio?run=.&tag=waveform/audio_summary可获得tag为waveform/audio_summary的音频信息

其中run与tag缺一不可（目前只有一个数据集，run可随意给，不进行校验）

返回数据格式

{
    "waveform/audio_summary":
 	[
        {"wall_time": 1587475006.5022004, "step": 1, "label": "<p><em>Wave type:</em> <code>sine_wave</code>. <em>Frequency:</em> 448.98 Hz. <em>Sample:</em> 1 of 1.</p>", "contentType": "audio/wav"}, 
									...
	    {"wall_time": 1587475006.7304769, "step": 49, "label": "<p><em>Wave type:</em> <code>sine_wave</code>. <em>Frequency:</em> 880.00 Hz. <em>Sample:</em> 1 of 1.</p>", "contentType": "audio/wav"}
    ]
}

拿到音频信息之后，再向后台请求音频

请求api：api/audio_raw?step=0&run=.&tag=waveform/audio_summary和得到音频

其中step、run与tag缺一不可（目前只有一个数据集，run可随意给，不进行校验）

返回数据为音频本身

Embedding

高维数据，由于降维过程较为费时，数据首先在后端进行处理，然后返回降维后的数据。

具体请求也是分为两步，第一步根据run和tag得到数据对应的step信息。

请求指定训练集和标签，返回对应标签的所有step和shape

请求api ：/api/projector?run=train&tag=outputs 其中 run 、tag 缺一不可返回数据格式如下：
```
{
    "outputs": [0, 1, 2, ... ,n],
    "shape": [n,m]
}
```

请求指定训练集，标签，step,method,dims 返回降维后的数据和原始标签

请求api ：api/projector_data?run=train&tag=outputs&step=0&method=pca&dims=3 ，其中 run 、tag、step、method 缺一不可，dims默认为3。返回数据格式如下：

{
		"0": [
            	# 降维后的数据
    			[[-1.5627723114617857, -3.9668523435955056, -0.18872563897943656],
				[-1.5627723114617857, -3.9668523435955056, -0.18872563897943656],
				[-1.5627723114617857, -3.9668523435955056, -0.18872563897943656],
				              				.....
				[-1.5627723114617857, -3.9668523435955056, -0.18872563897943656]],
            	# label信息
            	 [7,0,5,6,7,1,...,9,6,4]
            ]
}

请求指定训练集，标签，序号返回原始训练数据

请求api ：api/projector_sample?run=.&tag=outputs&index=0 ，其中 run 、tag、index 缺一不可。返回原始数据：图片，音频，文本

Graph

由于计算图graph每个网络中只包含一个，所以请求时只需给定run参数即可

请求api ：/api/graph?run=train

返回run为train的计算图，数据格式为

{
    "net": "[{...}]",  //graph计算图数据
 	"operator": "[...]" //操作结点分类数据
}

exception

异常信息目前以projector的方式进行存取，标签信息请查看embedding（tag以 "Variable:0" 结尾）。

具体请求分为两步:

请求指定训练集和标签，返回对应标签的所有step

请求api ：/api/exception?run=train&tag=layer1/weights/Variable:0 其中 run 、tag 缺一不可返回数据格式如下：
```
{
    "layer1/weights/Variable:0": [0, 1, 2, ... ,n]
}
```

请求指定训练集，标签，step 返回平铺后的异常数据

请求api ：api/exception_data?run=train&tag=layer1/weights/Variable:0&step=0 ，其中 run 、tag、step缺一不可，返回数据格式如下：

{
    	"0":[ 
            	[c1,c2],  # 平铺前的数据维度大小(长度不定)
            	min,
            	max,
            	mean,
            	[[-1.5627723114617857, -3.9668523435955056, -0.18872563897943656],
				[-1.5627723114617857, -3.9668523435955056, -0.18872563897943656],
				[-1.5627723114617857, -3.9668523435955056, -0.18872563897943656],
				              				.....
				[-1.5627723114617857, -3.9668523435955056, -0.18872563897943656]]
        	]
}

请求指定训练集，标签，step 返回异常数据的直方图信息

请求api ：api/exception_hist?run=train&tag=layer1/weights/Variable:0&step=0 ，其中 run 、tag、step缺一不可，返回数据格式如下

{
    	"0":[ 
            	min,
            	max,
            	[[left, right, count],
                 [left, right, count],
					.....
				[left, right, count]]
        	]
}

Hyperparam

请求api: api/hyperparm?run=hparams，可获得（如果有数据的话）run为hparams的超参数数据

返回数据格式：

{"hparamsInfo": [{groupid_1: 
                    {"hparams": [{"name": 超参数1, "data": 数据1}, ..., {"name": 超参数2, "data": 数据2}], 
				    "start_time_secs": 开始时间}
				 }
				,..., 
                 {groupid_n: 
                    {"hparams": [{"name": 超参数1, "data": 数据1}, ..., {"name": 超参数2, "data": 数据2}], // 多个超参数的名字与值
				    "start_time_secs": 开始时间}
				}], // 超参数信息，可能有多个
 "metrics": [{"tag": 量度1, "value": [值1, 值2, ...., 值n]},..., {"tag": 量度n, "value": [值1, 值2, ...., 值n]}]}
 //超参数的量度，可能有多个。适用于所有的超参数信息

例如train中的超参数数据为：

{"hparamsInfo": [{"3df0d7cf35bec5a33c9fe551db732c24df204d7886b226c5a41cce285d0d4fd5": 
                    {"hparams": [{"name": "num_units", "data": 32.0}, 
                                 {"name": "optimizer", "data": "sgd"}, 
                                 {"name": "dropout", "data": 0.2}], 
                    "start_time_secs": 1589421877.1109092}
                }], // 超参数信息，可能有多个
 "metrics": [{"tag": "accuracy", "value": [0.8216999769210815, 0.8241999745368958, 0.7746999859809875, 0.765999972820282, 0.8411999940872192, 0.8307999968528748, 0.7940999865531921, 0.7904999852180481]}]} //超参数的量度，可能有多个。适用于所有的超参数信息

一站式算法开发平台、高性能分布式深度学习框架、先进算法模型库、视觉模型炼知平台、数据可视化分析平台等一系列平台及工具，在模型高效分布式训练、数据处理和可视分析、模型炼知和轻量化等技术上形成独特优势，目前已在产学研等各领域近千家单位及个人提供AI应用赋能

深度学习大数据处理数据可视化模型分布式训练

Java Vue Python Text JavaScript other

tianshu@zhejianglab.com

README.md

依赖

启动

初始请求

以下数据格式仅供参考，以实际返回为准

类目信息

Scalar

Image

Histogram

Distribution

Text

Audio

Embedding

Graph

exception

Hyperparam

Contributors (1) All

Contributors (1)
All