产品特点
高性能计算技术赋能人工智能系统与算法,分布式训练的速度和规模明显优于开源产品。
以云原生容器化方式管理资源,并提供分布式处理机制,提升资源利用率,降低运维开销。
向导式自动学习实现图形化、免编程、免调参的模型训练。预置算法模型库提供经典模型开箱即用。
提供深度学习全生命周期所需能力,以完整的解决方案实现业务智能化。
产品功能
提供Jupyter Notebook等在线IDE,用于开发或修改算法代码及执行交互式调试。
以批处理作业方式执行单进程或分布式的深度学习训练,生成神经网络模型。
基于模型,部署REST风格的在线推理服务,以便应用业务集成人工智能能力。
提供TensorBoard等工具,以图形化方式呈现神经网络训练过程与模型结构。
通过图形化交互方式完成高效训练及上线服务,用户无须编程和调参。
支持用户构建包含自定义引擎、开发库与算法的容器镜像,从而扩展平台能力。
支持TensorFlow、PyTorch、MXNet、MindSpore等多种业界主流的深度学习引擎。
支持单进程以及Allreduce、PS-Worker、Horovod MPI等多种分布式执行模式。
提供Jupyter Notebook等在线IDE,用于开发或修改算法代码及执行交互式调试。
为运营、运维等后台人员提供集群软硬件资源及数据资产的图形化管理功能。
提供CPU、GPU、网络等硬件资源的实时监控,帮助用户分析算法、优化成本。
紧密结合企业多租户应用场景,确保租户内的权限控制及租户间的资源隔离。
产品展示
开发环境
01用户可以使用Jupyter Notebook等工具编写算法程序、调试训练代码、测试推理服务,并无缝访问存储资源。
训练作业
02基于用户提供或系统预置的算法,输入数据集,以批处理方式执行深度学习训练作业,生成模型与汇总文件。
向导式自动学习
03用户无须编程和调参,只需要通过图形化交互进行数据标注和简单配置,平台即可自动完成模型高效训练及上线部署。