バス停の名称で多い名前

全国には「市役所前」など、同じ名前のバス停が多いバス停の名前があります。
政府が公開する統計データに基づき、バス停留所名の頻度分布を調べた結果を掲載します。

スポンサーリンク

下にバス停留所名の頻度をランキング形式で上位25位まで示します。

「国土数値情報(バス停留所データ)」(国土交通省国土政策局・平成22年度)を加工して作成

スポンサーリンク

全国で最も件数が多いバス停名は「中村」でした。郡や荘園の中心や中心村落が「中村」と呼ばれたことに由来し、全国に中村という地名の場所は存在し、「中村」バス停は200件存在します。
2位が「市役所前」(198件)、3位が「公民館前」(170件)でした。
4位が「新町」(159件)、5位が「農協前」(151件)となっています。
上記ランキングは、国土交通省の国土数値情報ダウンロードサービスにて公開されているデータに基づいていますが、データ作成時点が2010年(平成22年)と古く、その後現在までに名称変更や 新規に設けられたバス停はデータに入っていません。

バス停名の頻度の統計則

バス停名の頻度(=件数)を縦軸に、その頻度のランクを横軸に取り両対数グラフでプロットすると下図のような散布図が得られます。
日本人の姓の頻度分布がZipf-Mandelbrot分布によく合うと報告がありますが、バス停名においてもZipf-Mandelbrot分布に合うのかもしれません。

バス停留所名の頻度とランクの分布

「国土数値情報(バス停留所データ)」(国土交通省国土政策局・平成22年度)を加工して作成

Zipf-Mandelbrot分布の最尤推定によるパラメータ推定を行いたかったのですが、最尤推定をしようとすると、パラメータを固定した時の推定値と 観測された各順位rの頻度の差をどう評価するべきかを知っておく必要がありますが、それがわからなかったため、パラメータ推定は行えませんでした。
パラメータ推定を乱暴に行おうと思えば実行できます。例えば、両対数グラフで順位-頻度の散布図を描いて単純に推定値と標本点との差を最小二乗法で最小化させるという方法や、対数軸ではなく デカルト座標の下に最小二乗法によりパラメータ推定するという単純な方法は考えられますが、座標を設定して幾何的な距離により分布をフィッテイングした結果を最尤推定結果とする根拠が ここでは見出せません。
パラメータを固定した時の推定値と観測された各順位rの頻度の差が発生する確率は、rと差の大きさを変数とする理論値があるはずです。 その理論値を得る方法を知らないため、パラメータを最尤推定することはしませんでした。

  1. 関連リンク
    1. 名前が長い日本のバス停ランキング
スポンサーリンク