
Amazon EMR Containers
Amazon EMR Containers
EMR on EKS API 在 Kubernetes(EKS)集群上跑 Spark/Hive/Presto 大数据作业,统一容器化 EMR 体验。
共享 EKS 集群资源提高利用率
必须先有 EKS 集群
CreateVirtualCluster 在 EKS namespace 注册为 EMR virtual cluster。StartJobRun 提交 Spark 作业。
可用率 · 30 天窗口
GitHub 活跃度
关于这个 API
EMR on EKS 是 2020 年推出的 EMR 变体,让你在 K8s 集群(EKS)上跑 EMR 兼容的 Spark/Hive/Presto 作业。它解决的问题是:传统 EMR 是给每个集群单独开 EC2,资源利用率低(作业跑完资源也得保留一段);如果公司已经用 EKS 跑应用,又想跑大数据,开两套集群浪费。EMR on EKS 让你「我有一个 EKS 集群,里面起一个 namespace 给数据团队,他们用 EMR API 提交 Spark 作业,作业以 pod 形式跑」。资源池统一,按需 scale,多团队共享。适合「已经深度 K8s 化的公司」做大数据。如果不用 K8s,传统 EMR(on EC2)或 EMR Serverless 更省心。
你可以做什么
- 1用现有 EKS 集群跑 Spark 作业(不开单独 EMR 集群)
- 2统一 K8s 资源管理(数据处理和应用同集群)
- 3多租户大数据平台
优劣对比
优点
- 共享 EKS 集群资源提高利用率
- 统一 K8s 工具链(kubectl、Argo)管理 Spark 作业
- 细粒度资源隔离(namespace)
注意事项
- 必须先有 EKS 集群
- K8s 学习曲线(不像传统 EMR 简单)
- 某些 EMR 高级特性(Notebook)受限
示例请求
curl https://github.com/mermade/aws2openapi/<endpoint>快速开始
CreateVirtualCluster 在 EKS namespace 注册为 EMR virtual cluster。StartJobRun 提交 Spark 作业。
常见问题
EMR on EKS vs EMR Serverless 怎么选?+
已有 K8s 平台 + 想统一管理:EMR on EKS。完全不想管基础设施:EMR Serverless。
技术细节
- 认证方式
- unknown
- 计费
- unknown
- 协议
- REST
- SDK
- python, javascript, go, java
- 响应时间
- 15 ms
- 上次巡检
- 2026/5/12 07:36:33
更多来自 Amazon Web Services 的 API
AWS IAM Access Analyzer API 分析 IAM 资源策略找潜在的过度授权或外部访问,主动识别安全风险。
Amazon Chime SDK API 给应用嵌入实时音视频通话和聊天能力(meeting、消息、PSTN 通话)。
Amazon CloudFront 是 AWS 的 CDN 与 edge 服务,加速静态/动态内容分发,是网站性能优化的标准方案。
Amazon CloudSearch 是 AWS 的搜索引擎托管服务(已逐渐被 OpenSearch Service 取代)。
CloudWatch Application Insights API 自动监测应用问题:智能识别异常(如 SQL 慢查询、内存泄漏),减少人工配 alarm。
AWS Cognito Identity Pools API 给前端应用临时 AWS 凭证:身份联邦、guest 用户、AWS 资源直接访问。
Amazon Cognito 用户池提供托管的用户注册、登录、密码重置、MFA 等身份认证能力。
Amazon Connect Contact Lens API 用 AI 实时分析 Amazon Connect 通话:情感、关键词、合规检测、自动摘要。