AWSを利用するサービスにて、サーバ(EC2/Instance)のリブートが発生したため調査しました。
調査したところ、Elastic Network Adapter (ENA) に対する Keep alive watchdog がタイムアウトしたことによるリブートのようで、ENAドライバーに起因する事由のようです。今回は、サービスに直接影響のあるサーバではなかったため不幸中の幸いでしたが、対策として(頻繁に発生する事象ではないものの)、ENAドライバーのバージョンアップ(カーネルモジュールのアップデート)をしておくと良いかもしれません(サーバの再起動が必要となりますので、その点は注意が必要です)。
- 動作環境
AWS/Linux