
AWS Glue DataBrew
AWS Glue DataBrew
AWS Glue DataBrew API 是可视化数据准备工具:清洗、转换、enrich 数据,不写代码完成 ETL 准备工作。
完全 no-code(点选式配置 200+ 数据转换)
处理 TB+ 大数据成本高(按 DPU 计费)
AWS Console DataBrew 项目里加载数据(从 S3),点选转换步骤构建 recipe,CreateRecipeJob 调度执行。
可用率 · 30 天窗口
GitHub 活跃度
关于这个 API
DataBrew 是 AWS 给数据分析师/科学家的 no-code ETL 工具。传统 ETL 要写 SQL 或 Python(pandas),数据分析师/业务人员可能不熟练。DataBrew 用可视化界面:导入 S3 数据 → UI 显示数据预览 → 点"我要 join 这两个表"、"去除 null"、"转换日期格式"等 → 自动 generate 转换 recipe → 一键 schedule 跑 job。覆盖 200+ 内置 transformation。结果可以输出到 S3 或 Glue Catalog 供下游 Athena/Redshift 用。和 Glue/Spark 比定位互补——DataBrew 适合交互式探索和准备,Glue 适合生产化大规模 ETL。
你可以做什么
- 1数据分析师不写代码做 ETL
- 2ML 数据集预处理
- 3探索性数据分析+数据清洗
- 4BI 报表前的数据准备
优劣对比
优点
- 完全 no-code(点选式配置 200+ 数据转换)
- 和 S3 / Glue Catalog / Redshift 等 AWS 数据源集成
- 能 generate Glue/Spark 代码做生产化部署
注意事项
- 处理 TB+ 大数据成本高(按 DPU 计费)
- 面向交互式准备,不适合高频生产 ETL
示例请求
curl https://github.com/mermade/aws2openapi/<endpoint>快速开始
AWS Console DataBrew 项目里加载数据(从 S3),点选转换步骤构建 recipe,CreateRecipeJob 调度执行。
常见问题
DataBrew vs Glue ETL 怎么选?+
交互式数据准备 + 想 no-code:DataBrew。生产化 schedule ETL:Glue ETL。两者数据可互通。
技术细节
- 认证方式
- unknown
- 计费
- unknown
- 协议
- REST
- SDK
- python, javascript, go, java
- 响应时间
- 15 ms
- 上次巡检
- 2026/5/12 07:36:33
更多来自 Amazon Web Services 的 API
AWS IAM Access Analyzer API 分析 IAM 资源策略找潜在的过度授权或外部访问,主动识别安全风险。
Amazon Chime SDK API 给应用嵌入实时音视频通话和聊天能力(meeting、消息、PSTN 通话)。
Amazon CloudFront 是 AWS 的 CDN 与 edge 服务,加速静态/动态内容分发,是网站性能优化的标准方案。
Amazon CloudSearch 是 AWS 的搜索引擎托管服务(已逐渐被 OpenSearch Service 取代)。
CloudWatch Application Insights API 自动监测应用问题:智能识别异常(如 SQL 慢查询、内存泄漏),减少人工配 alarm。
AWS Cognito Identity Pools API 给前端应用临时 AWS 凭证:身份联邦、guest 用户、AWS 资源直接访问。
Amazon Cognito 用户池提供托管的用户注册、登录、密码重置、MFA 等身份认证能力。
Amazon Connect Contact Lens API 用 AI 实时分析 Amazon Connect 通话:情感、关键词、合规检测、自动摘要。