产品特点

高性能

高性能计算技术赋能人工智能系统与算法,分布式训练的速度和规模明显优于开源产品。

高效率

以云原生容器化方式管理资源,并提供分布式处理机制,提升资源利用率,降低运维开销。

易使用

向导式自动学习实现图形化、免编程、免调参的模型训练。预置算法模型库提供经典模型开箱即用。

一站式

提供深度学习全生命周期所需能力,以完整的解决方案实现业务智能化。

产品功能

算法开发

提供Jupyter Notebook等在线IDE,用于开发或修改算法代码及执行交互式调试。

模型训练

以批处理作业方式执行单进程或分布式的深度学习训练,生成神经网络模型。

推理服务

基于模型,部署REST风格的在线推理服务,以便应用业务集成人工智能能力。

可视化工具

提供TensorBoard等工具,以图形化方式呈现神经网络训练过程与模型结构。

向导式自动学习

通过图形化交互方式完成高效训练及上线服务,用户无须编程和调参。

多类作业镜像

支持用户构建包含自定义引擎、开发库与算法的容器镜像,从而扩展平台能力。

多类AI引擎

支持TensorFlow、PyTorch、MXNet、MindSpore等多种业界主流的深度学习引擎。

多种调度类型

支持单进程以及Allreduce、PS-Worker、Horovod MPI等多种分布式执行模式。

镜像仓库

提供Jupyter Notebook等在线IDE,用于开发或修改算法代码及执行交互式调试。

集群管理

为运营、运维等后台人员提供集群软硬件资源及数据资产的图形化管理功能。

资源监控

提供CPU、GPU、网络等硬件资源的实时监控,帮助用户分析算法、优化成本。

多租户管理

紧密结合企业多租户应用场景,确保租户内的权限控制及租户间的资源隔离。

产品展示

开发环境

01

用户可以使用Jupyter Notebook等工具编写算法程序、调试训练代码、测试推理服务,并无缝访问存储资源。

训练作业

02

基于用户提供或系统预置的算法,输入数据集,以批处理方式执行深度学习训练作业,生成模型与汇总文件。

向导式自动学习

03

用户无须编程和调参,只需要通过图形化交互进行数据标注和简单配置,平台即可自动完成模型高效训练及上线部署。