auの通信障害「データ通信を中心として」徐々に復旧しました(NetwingsJ)

そもそも、どうしてこうなったかというと、お休みの日に、業務用ルーターという、インターネットのパケットに、あっち行け、こっち行け、と命じる役割の箱状の装置を、古い物から、新しい物に取り替えました。しかも、ルーティングテーブル(経路情報)まで異なるものに書き換えました。ルーターを取り替えたのはいいものの、ルーターの中身の設定を間違えたんでしょうね。そして、しばらくしたら、サーバーがなんかエラーを吐いた、ということに、休日出勤の職員さんがちょっと遅れて気づきました。それならばと、もう一度、古いルーターに切り戻そう、とした頃には、顧客用データベースサーバー(お客さんの誰が電話をかけて来たの? ということを問い合わせる顧客台帳)へ異状信号を余計に発信したために、メインのVoLTE(ボルテ)サーバーまでこけかけたので、フロー制御(通信パケットの流量制限)を行ってもダメだったのです。繋がりにくい、あるいは、全く繋がらなかったのは、このためです。そして、根本原因の完全な究明や、完全な復旧作業には、エンジニアみんなが出勤する、月曜日を待たなきゃいけなくなった、それまで、auを使って電話が出来なくなった、ということです。つまり、ザックリ言えば、ルーターを新品に替えたら、設定を間違えていたので、auの電話が出来なくなった、ということです。

au(KDDI)プレスリリース (2022年7月3日 午前11時00分現在の状況)

どうやら、沖縄県(沖縄セルラー電話)をはじめとする西日本エリアから順次復旧しました、とのことです。

どの携帯電話会社でも、LTE回線の中でも、データ用と音声用に優先順位的に区別していますが、LTE回線の中でも、特別に通信帯域を割り当てられたVoIP(ボイプ)電話機能(ここの場合、VoLTE(ボルテ))という、道で例えると「音声専用レーン」は、まだあまり回復していなかったと見ました。また、東日本エリアでの回復は、予定より遅れていたようです。

どうやら、台風4号迫る西日本中心に、アメダス観測地点からのデータ収集のために、そちらを優先したものと思われます。(どうやら、総務省あたりが、そのようにKDDIに指示したとか指示しないだとか、小耳に挟んだんです?)

ともあれ、見通しが立たないよりは、復旧の見通しが立ってまだしも良かったです。

【追記】

復旧した現在、根本原因が、ある程度分かって来ました。全国の、auのVoLTEのセンターの中心は、東京か神奈川の多摩地区にあり、そこの職員さんが、サーバーではなく、ルーターのリプレイス作業を行った結果、設定が間違っており、急遽もとに戻しましたが、auのシステムって、呼(こ:呼び出しや通話のこと)が発生していなくても、センターと通信するために、センターに電話をかけて呼び出すのと同じ状態になりました。そこで、センターに40分間隔で再接続をしようとした端末からの呼び出しによって、まず最初の輻輳(混雑)が起き、それから立て続けに輻輳が広がり、全国規模になったというあらましでした。もともと、ちゃんと設定されたルーターを置いていれば、繋ぎ変えてもこういうことは起きず、ルーターの設定ミスで影響が全国に波及したそうですよ。

また、その後に分かったのですが、どうやら、いらないデータ通信は、管理用データベースへも幾度となく信号が送られており、これは、想定外な事態でして、余計にVoLTE(ボルテ)サーバーに負荷がかかるなどしたため、復旧と原因究明により時間を要したようですね。

ITmedia NEWS 「au通信障害で起きた“負のスパイラル”」

……ちゃんと、ルーターが設定できる人にやってもらってください。全国的な大迷惑です。

ではでは(・∀・)ノ

【追記の追記】

日経クロステックさんの記事の方が、より詳しいです(下記リンク先)

パソコンのお医者さん 他社携帯で良かったです ネットウイングス 代表 田所憲雄 拝

ネットウイングス Netwings.JP

どうも(・∀・)ノ 兵庫県尼崎市のネットウイングスです。パソコンのお医者さんとして、「インターネットで愉しむ」と同時に「情報技術者同士の緩やかな連帯感の醸成」にもこだわっています。

このページに掲載された記事の名称や内容は、各社の商標または登録商標です。また、ページ内でご紹介しているソフトウェア、バージョン、URL等は、各ページの発行時点のものであり、その後、変更されている場合があります。なお、画像や文章の著作権は、ベルヌ条約・万国著作権条約・著作権法で定めのある通り、原著作者に帰属します。