
AWS Glue DataBrew
AWS Glue DataBrew
AWS Glue DataBrew API 是可视化数据准备工具:清洗、转换、enrich 数据,不写代码完成 ETL 准备工作。
完全 no-code(点选式配置 200+ 数据转换)
处理 TB+ 大数据成本高(按 DPU 计费)
AWS Console DataBrew 项目里加载数据(从 S3),点选转换步骤构建 recipe,CreateRecipeJob 调度执行。
可用率 · 30 天窗口
GitHub 活跃度
关于这个 API
DataBrew 是 AWS 给数据分析师/科学家的 no-code ETL 工具。传统 ETL 要写 SQL 或 Python(pandas),数据分析师/业务人员可能不熟练。DataBrew 用可视化界面:导入 S3 数据 → UI 显示数据预览 → 点"我要 join 这两个表"、"去除 null"、"转换日期格式"等 → 自动 generate 转换 recipe → 一键 schedule 跑 job。覆盖 200+ 内置 transformation。结果可以输出到 S3 或 Glue Catalog 供下游 Athena/Redshift 用。和 Glue/Spark 比定位互补——DataBrew 适合交互式探索和准备,Glue 适合生产化大规模 ETL。
你可以做什么
- 1数据分析师不写代码做 ETL
- 2ML 数据集预处理
- 3探索性数据分析+数据清洗
- 4BI 报表前的数据准备
优劣对比
优点
- 完全 no-code(点选式配置 200+ 数据转换)
- 和 S3 / Glue Catalog / Redshift 等 AWS 数据源集成
- 能 generate Glue/Spark 代码做生产化部署
注意事项
- 处理 TB+ 大数据成本高(按 DPU 计费)
- 面向交互式准备,不适合高频生产 ETL
快速开始
AWS Console DataBrew 项目里加载数据(从 S3),点选转换步骤构建 recipe,CreateRecipeJob 调度执行。
常见问题
DataBrew vs Glue ETL 怎么选?+
交互式数据准备 + 想 no-code:DataBrew。生产化 schedule ETL:Glue ETL。两者数据可互通。
技术细节
- 认证方式
- unknown
- 计费
- unknown
- 协议
- REST
- SDK
- python, javascript, go, java
- 响应时间
- 48 ms
- 上次巡检
- 2026/6/26 06:22:15
更多来自 Amazon Web Services 的 API
AWS IAM Access Analyzer API 分析 IAM 资源策略找潜在的过度授权或外部访问,主动识别安全风险。
Alexa for Business帮助企业在组织内使用Alexa设备和服务。
Amazon API Gateway帮助开发者构建安全且可扩展的移动和网页应用后端。
用于创建、管理和快速部署应用配置的服务。
Amazon AppFlow 提供云端数据流管理和集成服务。支持不同云服务间的数据传输和同步。
Amazon AppIntegrations 服务用于配置和重用与外部应用的连接。
Amazon AppStream 2.0 提供云端应用程序流式传输服务,支持远程访问和管理。
Amazon Athena 是一种交互式查询服务,允许使用标准 SQL 直接分析存储在 Amazon S3 中的数据。