Work Report

AWS EC2 reboot調査

AWSを利用するサービスにて、サーバ(EC2/Instance)のリブートが発生したため調査しました。

調査したところ、Elastic Network Adapter (ENA) に対する Keep alive watchdog がタイムアウトしたことによるリブートのようで、ENAドライバーに起因する事由のようです。今回は、サービスに直接影響のあるサーバではなかったため不幸中の幸いでしたが、対策として(頻繁に発生する事象ではないものの)、ENAドライバーのバージョンアップ(カーネルモジュールのアップデート)をしておくと良いかもしれません(サーバの再起動が必要となりますので、その点は注意が必要です)。

  • 動作環境

AWS/Linux