PostgreSQL/解析/sorry, too many clients already

Counter: 3162, today: 1, yesterday: 1

ページ内検索

はじめに †

PostgreSQLを動かしていると「sorry, too many clients already」のようなメッセージを見ることがあるかもしれない。これは、接続するクライアント数がPostgreSQLの制限を超えてしまった場合に表示される。ソースコードから、メッセージの出力箇所を探して見ると、メッセージが記述されている箇所が複数存在することに気づく。では、一体どういった時にこのメッセージが出力されるのだろうか？

ここでは、ソースコードを参照しながら動作内容を確認する。

↑

メッセージの出力箇所 †

postmasterプロセスは、クライアントの接続のaccept後にバックエンドプロセスの最大数をチェックしてforkしているかと思うが、実際にはそうではない。postmasterプロセスは、クライアント接続を受けるとバックエンドプロセスをforkする。その後、forkで生成されたバックエンドプロセスは、自身の初期化プロセスの中で資源の割り当てが可能かを確認し、空きがない場合は、エラーレベルFATALで「sorry, too many clients already」をを出力して終了する流れとなっている。

メッセージが出力されうる箇所は、バックエンドプロセスの処理フローで示すと下図の赤色箇所に該当する。

↑

メッセージが出る状況 †

↑

ProcessStartupPacket †

この関数は、クライアントからのStartupPacketを読む。キャンセルリクエストであった場合は、当該バックエンドプロセスのキャンセル（SIGINTシグナル）を行なう。この時点では、エラー（ERRCODE_TOO_MANY_CONNECTIONS）の制限には引っかからない（つまりacceptが成功すれば、キャンセルリクエストは正常に処理されると言える）。そして、クライアント接続数の制限チェックは、この関数の末尾で実行されている。

参考 postmaster/postmaster.c#ProcessStartupPacket

なお、このport->canAcceptConnectionsに、CAC_TOOMANYフラグが設定されているのは、以下の箇所のようである。

参考 postmaster/postmaster.c#canAcceptConnections

ここでは、CountChildrenとMaxLivePostmasterChildrenという二つの関数による返り値の比較が実行されている。これらの関数の内部を見てみる。

参考 postmaster/postmaster.c#MaxLivePostmasterChildren

ここでは、MaxBackendsの2倍の値を返すようになっている。

参考 postmaster/postmaster.c#CountChildren

関数の引数は、BACKEND_TYPE_ALLなので、Backendでdead_endフラグがたっていない場合にカウントされる。

dead_endがtrueになるのは、調べる限り以下の箇所しか見当たらなかった。canAcceptConnectionsが、CAC_OKでもCAC_WAITBACKUPでもない時である。postmasterの状態がPM_RUNの時は、通常CAC_OKとなるので、forkで生成されたバックエンドプロセスはカウント対象であろう。

実験

InitProcessの途中にsleepで停止させ、psqlでクライアント接続を行なった。以下のような感じである。

結果、接続数がMaxLivePostmasterChildren()で返される値に達した時、以下のメッセージを確認することができた。

psql: FATAL:  sorry, too many clients already

参考

↑

InitProcess †

通常、エラーERRCODE_TOO_MANY_CONNECTIONSに引っかかるのはこの箇所であろう。バックエンドプロセスは、PGPROCという構造体で表現される。このPGPROC構造体は、max_connectionsやautovacuum_max_workers、max_worker_processesなどのパラメータで指定されたサイズ分、共有メモリ上に確保され配置される（詳しくは下図およびソースリンクを参照のこと）。バックエンドプロセスのPGPROCのフリーリストは、ProcGlobal構造体で管理されており、通常のバックエンドプロセスのフリーリストの先頭はfreeProcsメンバ変数が指している。バックエンドプロセスが起動する度に、フリーリストからPGPROC構造体が割り当てられ、クライアント接続数がmax_connectionsに達すると、割り当てられるPGPROCがないため、「sorry, too many clients already」でエラーとなる。

参考

storage/lmgr/proc.c - https://git.postgresql.org/gitweb/?p=postgresql.git;a=shortlog;h=refs/heads/REL_10_STABLE

↑

ProcArrayAdd †

この関数は、PGPROC構造体を引数で受け取り、共有メモリ上のProc配列にprocnoを追加する。バックエンドプロセスは、アクティブなバックエンドとして管理される。

ProcArrayAddのエラーになる箇所を参照すると、「ここでERRCODE_TOO_MANY_CONNECTIONSエラーことはないはずである」と書かれている。通常は、先のPGPROC構造体の割り当て時にfreeProcsがないためにエラーになるはずである。

↑

SharedInvalBackendInit †

Shared Invalidation Cacheとは、バックエンドプロセス間でシステムカタログなどのキャッシュが無効化されたことを通知する仕組みの事である。

バックエンドごとにProcState構造体が割り当てられる。SharedInvalBackendInit関数では、その初期化が行われているが、このProcState構造体がMaxBackendsを超えた場合にエラーERRCODE_TOO_MANY_CONNECTIONSとなる（ただし、maxBackendsは、MaxBackendsで設定されており、通常この値を超えることはない？と思われる）。

参考

storage/ipc/sinvaladt.c - https://git.postgresql.org/gitweb/?p=postgresql.git;a=shortlog;h=refs/heads/REL_10_STABLE

↑