第14回 障害対応 SSD故障
2025.07.08
今回は、SSD故障によるサーバー切替えです。

パソコンから公開WEBサーバにコンテンツをアップロードしている最中に突然回線が切断されました。
結果から言うとシステムがはいっているSSDが壊れてしまいました。
障害発生時に故障の解析は行わず、サーバーの切り替えを優先し、そのあとで故障の原因を究明しました。
ここでは故障した公開WEBサーバーのローカルIPアドレスを192.168.11.21、予備機のアドレスを192.168.11.31として説明します。
構成図にあるように無停電電源を設置していて、停電しても1日程度は公開WEBサーバーは稼働し続けます。
予備機には定期的にコンテンツとデータベースの更新を行っていて、更新時以外はシャットダウンしています。
サーバの切り替えは簡単です。まずは予備サーバを立ち上げます。
パソコンのWEBブラウザからブロードバンドルータの設定画面にアクセスしてポート変換ページで設定しているローカルIPアドレスを変更するだけです。
Buffalo のAirstation の場合、詳細設定→セキュリティー→ポート変換を開きます。

左側のIPアドレスは実際には固定IPアドレスサービスから付与されたグローバルアドレスになります。
右側の192..168.11.21を192.168.11.31に変更します。これは一例なので必要なポートに対して再設定します。
ブロードバンドルーターを再起動しなくても設定が反映されます。
予備サーバに最新のコンテンツを追加して、データベースも更新して完了です。
公開サーバと予備サーバの違いは、ラズベリーパイのMACアドレスとそれに関連付けるローカルIPアドレスのみです。
$ sudo vi /etc/netplan/50-cloud-init.yaml
network:
version: 2
ethernets:
eth0:
dhcp4: no
dhcp6: no
match:
macaddress: xx:xx:xx:xx:xx:xx
set-name: eth0
# access-points: ************
# password: *************
addresses: [192.168.11.21/24]
gateway4: 192.168.11.1
nameservers:
addresses: [192.168.11.21,192.168.11.1]
optional: true
また、bindの設定では公開サーバと予備サーバの両方の逆引き設定ファイルを作成しておきます。
$ ls -l /etc/bind
total 64
-rw-r--r-- 1 root root 2403 4月 13 2023 bind.keys
-rw-r--r-- 1 root root 237 4月 13 2023 db.0
-rw-r--r-- 1 root root 271 4月 13 2023 db.127
-rw-r--r-- 1 root bind 345 4月 13 2023 db.192.168.11.21
-rw-r--r-- 1 root bind 345 4月 13 2023 db.192.168.11.31
-rw-r--r-- 1 root root 237 4月 13 2023 db.255
-rw-r--r-- 1 root bind 718 4月 13 2023 db.example.jp
-rw-r--r-- 1 root root 353 4月 13 2023 db.empty
-rw-r--r-- 1 root root 270 4月 13 2023 db.local
-rw-r--r-- 1 root bind 1116 4月 13 2023 named.conf
-rw-r--r-- 1 root bind 498 4月 13 2023 named.conf.default-zones
-rw-r--r-- 1 root bind 165 4月 13 2023 named.conf.local
-rw-r--r-- 1 root bind 844 4月 13 2023 named.conf.options
-rw-r----- 1 bind bind 100 4月 13 2023 rndc.key
-rw-r--r-- 1 root root 1317 4月 13 2023 zones.rfc1918
db.example.jpファイルは実際には取得済みのドメインに関する設定です
逆引き設定ファイルの所在をnamed.confに記載しています。
$ sudo vi /etc/bind/named.conf
zone "21.11.168.192.in-addr.arpa" {
type master;
file "/etc/bind/db.192.168.11.21";
};
zone "31.11.168.192.in-addr.arpa" {
type master;
file "/etc/bind/db.192.168.11.31";
};
postfixのmynetworkにも、公開サーバと予備サーバのIPアドレスを列記しています
$ sudo vi /etc/postfix/main.cf
mynetworks = 192.168.11.21, 192.168.11.31, 127.0.0.1
公開WEBサーバをディスク複製して、MACアドレスとローカルIPアドレスを書き換えて予備機を作成しておけば、障害時に速やかに対応できると思います。
SSDは何の予兆もなく突然壊れます。

トランセンド 256GBのSSDは4年以上稼働していました。
ちなみに前回障害が発生したときはSSDではなくコントローラ側でした。
|