
AWS Fault Injection Simulator
AWS Fault Injection Simulator
AWS Fault Injection Simulator (FIS) API 主动给 AWS 资源注入故障做混沌工程:终止实例、增加延迟、模拟 AZ 失败。
内置 20+ 故障 action(EC2 终止、网络延迟、CPU 压测、API 限速等)
只能注入 AWS 服务范围内的故障
CreateExperimentTemplate 定义实验(target + action + stop condition)。StartExperiment 执行。
可用率 · 30 天窗口
GitHub 活跃度
关于这个 API
FIS 是 AWS 的官方混沌工程工具。混沌工程的理念是「主动给生产系统注入故障,看应用如何应对,找出脆弱点修复」。在 FIS 之前,团队要做这种演练需要自己写脚本(kill -9 EC2 实例、修改 security group 阻断网络等)——危险且不规范。FIS 把这些标准化:通过 experiment template 定义「target 是 X、action 是 Y、安全条件是 Z」,运行 experiment 时 AWS 受控地注入故障,超出 stop condition(如错误率 > 5%)自动终止。提供的 action 很丰富——EC2 实例终止/停止、API 错误注入、网络延迟、CPU/内存压测、模拟 AZ 不可用等。对严肃运维生产 AWS 工作负载的团队,定期 chaos test 是发现潜在故障的有效手段。
你可以做什么
- 1Game day 演练(团队定期测应用韧性)
- 2在 CI 测试中模拟故障
- 3验证 disaster recovery 机制
- 4验证 auto-scaling 触发正常
优劣对比
优点
- 内置 20+ 故障 action(EC2 终止、网络延迟、CPU 压测、API 限速等)
- 安全机制(自动停止条件 stop condition)
- 和 CloudWatch 集成做实时监控
注意事项
- 只能注入 AWS 服务范围内的故障
- 复杂故障场景(如部分网络分区)支持有限
快速开始
CreateExperimentTemplate 定义实验(target + action + stop condition)。StartExperiment 执行。
常见问题
怎么保证 FIS 不会真的搞挂生产?+
严格用 stop condition(CloudWatch alarm)+ blast radius 控制(一次只动一小部分实例)+ 先在 staging 跑通。
技术细节
- 认证方式
- unknown
- 计费
- unknown
- 协议
- REST
- SDK
- python, javascript, go, java
- 响应时间
- 44 ms
- 上次巡检
- 2026/6/26 06:22:16
更多来自 Amazon Web Services 的 API
AWS IAM Access Analyzer API 分析 IAM 资源策略找潜在的过度授权或外部访问,主动识别安全风险。
Alexa for Business帮助企业在组织内使用Alexa设备和服务。
Amazon API Gateway帮助开发者构建安全且可扩展的移动和网页应用后端。
用于创建、管理和快速部署应用配置的服务。
Amazon AppFlow 提供云端数据流管理和集成服务。支持不同云服务间的数据传输和同步。
Amazon AppIntegrations 服务用于配置和重用与外部应用的连接。
Amazon AppStream 2.0 提供云端应用程序流式传输服务,支持远程访问和管理。
Amazon Athena 是一种交互式查询服务,允许使用标准 SQL 直接分析存储在 Amazon S3 中的数据。