特点与性能
大数据平台和人工智能集群计算环境
包括Spark、Flink、Hadoop、TensorFlow、PyTorch集群计算环境
计算资源管理系统
基于Docker虚拟化容器技术,提供独立的用户工作空间,以及对CPU、GPU、内存等系统计算资源隔离独占的管理机制
数据资源管理系统
包括对数据的分类、引用、存储、共享等基础模块,以及数据跨平台流转的管控机制
多类型IDE开发环境
基于noVNC Web桌面加载技术,实现“零配置”、“开箱即用”的编程开发体验,支持包括Eclipse、PyCharm、IDEA等常用IDE开发环境,开发环境默认集成了Matplotlib、Pandas、Numpy等常用科学计算基础类库,以及TensorFlow、PyTorch等常用人工智能基础类库
多语言核心Web工作台
支持包括Python、R、Java、Scala等常用大数据开发编程语言
ETL数据治理工作台
支持基于Kettle环境对多种类型数据和数据库进行数据抽取、数据转换和数据加载等治理操作
数据可视化系统
包括基于Matplotlib构建的Python可视化组件库,以及基于Echarts构建的HTML可视化组件库
项目协作管理系统
支持以项目的形式管理开发过程,包括项目成员、项目数据、项目文档,以及对开发代码的拉取、推送、克隆、同步等代码资源版本管理