Amazon EMR Containers logo

Amazon EMR Containers

Amazon EMR Containers

正常开源cloudAmazon Web Services62· JavaScript· MIT

EMR on EKS API 在 Kubernetes(EKS)集群上跑 Spark/Hive/Presto 大数据作业,统一容器化 EMR 体验。

访问站点 ↗源码 ↗健康巡检 9 小时前
适合什么时候用

共享 EKS 集群资源提高利用率

先注意什么

必须先有 EKS 集群

第一步先查

CreateVirtualCluster 在 EKS namespace 注册为 EMR virtual cluster。StartJobRun 提交 Spark 作业。

认证
CORS
不支持
HTTPS
注册
?
延迟
15 ms
协议
REST
计费
Stars
62

可用率 · 30 天窗口

巡检: 1可用率: 100%平均延迟: 15ms

GitHub 活跃度

62JavaScriptMIT17 未关闭 issue上次提交 110 天前
01

关于这个 API

EMR on EKS 是 2020 年推出的 EMR 变体,让你在 K8s 集群(EKS)上跑 EMR 兼容的 Spark/Hive/Presto 作业。它解决的问题是:传统 EMR 是给每个集群单独开 EC2,资源利用率低(作业跑完资源也得保留一段);如果公司已经用 EKS 跑应用,又想跑大数据,开两套集群浪费。EMR on EKS 让你「我有一个 EKS 集群,里面起一个 namespace 给数据团队,他们用 EMR API 提交 Spark 作业,作业以 pod 形式跑」。资源池统一,按需 scale,多团队共享。适合「已经深度 K8s 化的公司」做大数据。如果不用 K8s,传统 EMR(on EC2)或 EMR Serverless 更省心。

02

你可以做什么

  • 1用现有 EKS 集群跑 Spark 作业(不开单独 EMR 集群)
  • 2统一 K8s 资源管理(数据处理和应用同集群)
  • 3多租户大数据平台
03

优劣对比

优点

  • 共享 EKS 集群资源提高利用率
  • 统一 K8s 工具链(kubectl、Argo)管理 Spark 作业
  • 细粒度资源隔离(namespace)

注意事项

  • 必须先有 EKS 集群
  • K8s 学习曲线(不像传统 EMR 简单)
  • 某些 EMR 高级特性(Notebook)受限
04

示例请求

通用模板 — 实际 endpoint 请查阅文档替换 <endpoint>。
curl https://github.com/mermade/aws2openapi/<endpoint>
05

快速开始

CreateVirtualCluster 在 EKS namespace 注册为 EMR virtual cluster。StartJobRun 提交 Spark 作业。

06

常见问题

EMR on EKS vs EMR Serverless 怎么选?+

已有 K8s 平台 + 想统一管理:EMR on EKS。完全不想管基础设施:EMR Serverless。

07

技术细节

CORS: NoHTTPS: Yes注册: ?开源: Yes
认证方式
unknown
计费
unknown
协议
REST
SDK
python, javascript, go, java
响应时间
15 ms
上次巡检
2026/5/12 07:36:33
08

标签

09

更多来自 Amazon Web Services 的 API