
AWS Fault Injection Simulator
AWS Fault Injection Simulator
AWS Fault Injection Simulator (FIS) API 主动给 AWS 资源注入故障做混沌工程:终止实例、增加延迟、模拟 AZ 失败。
内置 20+ 故障 action(EC2 终止、网络延迟、CPU 压测、API 限速等)
只能注入 AWS 服务范围内的故障
CreateExperimentTemplate 定义实验(target + action + stop condition)。StartExperiment 执行。
可用率 · 30 天窗口
GitHub 活跃度
关于这个 API
FIS 是 AWS 的官方混沌工程工具。混沌工程的理念是「主动给生产系统注入故障,看应用如何应对,找出脆弱点修复」。在 FIS 之前,团队要做这种演练需要自己写脚本(kill -9 EC2 实例、修改 security group 阻断网络等)——危险且不规范。FIS 把这些标准化:通过 experiment template 定义「target 是 X、action 是 Y、安全条件是 Z」,运行 experiment 时 AWS 受控地注入故障,超出 stop condition(如错误率 > 5%)自动终止。提供的 action 很丰富——EC2 实例终止/停止、API 错误注入、网络延迟、CPU/内存压测、模拟 AZ 不可用等。对严肃运维生产 AWS 工作负载的团队,定期 chaos test 是发现潜在故障的有效手段。
你可以做什么
- 1Game day 演练(团队定期测应用韧性)
- 2在 CI 测试中模拟故障
- 3验证 disaster recovery 机制
- 4验证 auto-scaling 触发正常
优劣对比
优点
- 内置 20+ 故障 action(EC2 终止、网络延迟、CPU 压测、API 限速等)
- 安全机制(自动停止条件 stop condition)
- 和 CloudWatch 集成做实时监控
注意事项
- 只能注入 AWS 服务范围内的故障
- 复杂故障场景(如部分网络分区)支持有限
示例请求
curl https://github.com/mermade/aws2openapi/<endpoint>快速开始
CreateExperimentTemplate 定义实验(target + action + stop condition)。StartExperiment 执行。
常见问题
怎么保证 FIS 不会真的搞挂生产?+
严格用 stop condition(CloudWatch alarm)+ blast radius 控制(一次只动一小部分实例)+ 先在 staging 跑通。
技术细节
- 认证方式
- unknown
- 计费
- unknown
- 协议
- REST
- SDK
- python, javascript, go, java
- 响应时间
- 11 ms
- 上次巡检
- 2026/5/12 07:36:33
更多来自 Amazon Web Services 的 API
AWS IAM Access Analyzer API 分析 IAM 资源策略找潜在的过度授权或外部访问,主动识别安全风险。
Amazon Chime SDK API 给应用嵌入实时音视频通话和聊天能力(meeting、消息、PSTN 通话)。
Amazon CloudFront 是 AWS 的 CDN 与 edge 服务,加速静态/动态内容分发,是网站性能优化的标准方案。
Amazon CloudSearch 是 AWS 的搜索引擎托管服务(已逐渐被 OpenSearch Service 取代)。
CloudWatch Application Insights API 自动监测应用问题:智能识别异常(如 SQL 慢查询、内存泄漏),减少人工配 alarm。
AWS Cognito Identity Pools API 给前端应用临时 AWS 凭证:身份联邦、guest 用户、AWS 资源直接访问。
Amazon Cognito 用户池提供托管的用户注册、登录、密码重置、MFA 等身份认证能力。
Amazon Connect Contact Lens API 用 AI 实时分析 Amazon Connect 通话:情感、关键词、合规检测、自动摘要。