AWS Glue DataBrew logo

AWS Glue DataBrew

AWS Glue DataBrew

正常开源cloudAmazon Web Services62· JavaScript· MIT

AWS Glue DataBrew API 是可视化数据准备工具:清洗、转换、enrich 数据,不写代码完成 ETL 准备工作。

访问站点 ↗源码 ↗健康巡检 9 小时前
适合什么时候用

完全 no-code(点选式配置 200+ 数据转换)

先注意什么

处理 TB+ 大数据成本高(按 DPU 计费)

第一步先查

AWS Console DataBrew 项目里加载数据(从 S3),点选转换步骤构建 recipe,CreateRecipeJob 调度执行。

认证
CORS
不支持
HTTPS
注册
?
延迟
15 ms
协议
REST
计费
Stars
62

可用率 · 30 天窗口

巡检: 1可用率: 100%平均延迟: 15ms

GitHub 活跃度

62JavaScriptMIT17 未关闭 issue上次提交 110 天前
01

关于这个 API

DataBrew 是 AWS 给数据分析师/科学家的 no-code ETL 工具。传统 ETL 要写 SQL 或 Python(pandas),数据分析师/业务人员可能不熟练。DataBrew 用可视化界面:导入 S3 数据 → UI 显示数据预览 → 点"我要 join 这两个表"、"去除 null"、"转换日期格式"等 → 自动 generate 转换 recipe → 一键 schedule 跑 job。覆盖 200+ 内置 transformation。结果可以输出到 S3 或 Glue Catalog 供下游 Athena/Redshift 用。和 Glue/Spark 比定位互补——DataBrew 适合交互式探索和准备,Glue 适合生产化大规模 ETL。

02

你可以做什么

  • 1数据分析师不写代码做 ETL
  • 2ML 数据集预处理
  • 3探索性数据分析+数据清洗
  • 4BI 报表前的数据准备
03

优劣对比

优点

  • 完全 no-code(点选式配置 200+ 数据转换)
  • 和 S3 / Glue Catalog / Redshift 等 AWS 数据源集成
  • 能 generate Glue/Spark 代码做生产化部署

注意事项

  • 处理 TB+ 大数据成本高(按 DPU 计费)
  • 面向交互式准备,不适合高频生产 ETL
04

示例请求

通用模板 — 实际 endpoint 请查阅文档替换 <endpoint>。
curl https://github.com/mermade/aws2openapi/<endpoint>
05

快速开始

AWS Console DataBrew 项目里加载数据(从 S3),点选转换步骤构建 recipe,CreateRecipeJob 调度执行。

06

常见问题

DataBrew vs Glue ETL 怎么选?+

交互式数据准备 + 想 no-code:DataBrew。生产化 schedule ETL:Glue ETL。两者数据可互通。

07

技术细节

CORS: NoHTTPS: Yes注册: ?开源: Yes
认证方式
unknown
计费
unknown
协议
REST
SDK
python, javascript, go, java
响应时间
15 ms
上次巡检
2026/5/12 07:36:33
08

标签

09

更多来自 Amazon Web Services 的 API