タウンページデータベースを導入したことで、これまでの データではできなかった「質的な分析」が実現
東北大学大学院 情報科学研究科
https://www.is.tohoku.ac.jp/
交通制御学分野 原研究室 准教授
原 祐輔氏
導入の背景
「街の変遷」に関する研究を進めるため、過去数十年分の「業種と所在地が紐づいたデータベース」を必要としていました。
導入の決め手
紙の住宅地図にはない利便性、メッシュデータにはない詳細情報と網羅性、建物の体裁に紐づいたデータベースにはない業種情報など、NTT東日本・NTT西日本が発行する「職業別電話帳」を出自とするタウンページデータベースならではのデータが決め手になりました。
導入後の効果
交通システムや都市の研究に適したデータを得て、従来利用していたデータだけではできなかった「質的な変化を追っていく」分析を行うことができています。
サービス導入:2023年11月
導入の背景
原氏:私が現在所属する研究科「情報科学研究」は大変広範な学問分野であり、一般にイメージされやすいIT系の研究から、人間によるコミュニケーションなども情報の一種として取り扱う、社会科学や哲学に近い研究まで含まれています。
私は情報科学の中でも、より工学寄りの分野に在籍しております。交通システムが成熟している現代において「都市の中で人々がどう移動するのか」、「交通システムをどのように制御することによって、渋滞が発生しない街ができるのか」、「賑わいが失われつつある町の中心部に、どうやって賑わいを生み出すか」といったことが、大きな研究テーマです。そのために、日々膨大な量のデータを分析しています。
例えば、多くの人が持っているスマートフォンに搭載のGPSデータから「どういった町のどういったお店に、どういう目的で人が来るのか」を分析し、「どういう集客施策を打つと、狙い通りに人が集まるか」を見出していく……といったことから、街づくりに寄与するような研究を進めています。
今回「タウンページデータベース」を利用したきっかけは「過去、それもビッグデータ時代以前のデータをどうしても分析したい」と考えたことでした。
2024年現在、ほぼすべての人がスマートフォンを持っているため、GPSによる移動データを収集できます。さらに、多くの自家用車にはカーナビゲーションが搭載され、その移動軌跡データも収集できるようになっています。これは2010年ごろからのビッグデータ技術の飛躍的な進歩によって実現しました。しかし「この数十年で街はどのように変化してきたのか」や「この数十年で人の交通行動はどのように変化してきたのか」ということを分析しようとしても、過去のデータを今からデジタルで収集することはできません。
導入の決め手
原氏:例えば「1980年にはどこにどんなお店があったのか」を調べようとしても、地図アプリではある程度以上の過去のことは知ることができません。もちろん、国立国会図書館などへ行けば、非常に古い時代からの住宅地図なども収蔵されています。ただ「紙の書籍」のため、まずデジタル化するために途方もない量のリソースが必要になります。手作業でのデジタル化も、研究予算を使い、さまざまな企業に外注してデジタル化することも検討しましたが、どの方法も現実的ではありませんでした。
統計的なデータ、例えば地図を「1km×1km」や「500m×500m」のように分割し、その1マス中に「飲食店が合計で何平米分ありました」というメッシュデータのようなものは、省庁などさまざまな場所にオープンデータとして公開されています。もちろんそのようなデータでも「○○駅周辺がどういうエリアか」といった大まかな情報は確認できます。ただ「飲食店」であっても、ファストフードと会員制レストランでは、隣にどのような店舗があると良いか、といった「街における意味合い」が変わってくるでしょう。店側はそういった地域性を考慮しながら出店していることも多いため、そのような「質的なもの」も分析したいと考えた時に、メッシュデータでは抜け落ちてしまうだろうと考えました。
「元々は住宅地だったあるエリアに、隠れ家的なレストランが1軒できて評判になり、周辺にさまざまな店ができて、やがて人が集まる飲食店街になった」といった変遷を分析したい場合は、「そこにどういうお店があったのか」が重要になります。そこで、いくつかの論文において「タウンページデータベース」という資料を使った分析があることを発見しました。調査すると、我々にとってまさに探していたデータベースでした。まず「この住所にどういう店舗があった」といった情報が非常に正確で、それが数十年分網羅的に収集されていたのです。まさに我々が分析したい内容にマッチしていました。
最初は、我々が研究目的で購入できるデータベースなのかすら確認できていませんでしたが、Webサイトから問い合わせをしたところ、打ち合わせの機会を設けていただき丁寧に説明してくださいました。
データの様子が分かるサンプルデータや、業種の分類が分かるリストをいただき、さらに「首都圏」、「東京都」といったようなエリアを切り分けながらデータベースの規模感も説明していただいて、「過去から分析していくのに十分な量のデータがある」と認識できたため、早急に購入を検討しはじめました。
導入後の効果
原氏:タウンページデータベースのデータは、私たちのように交通や都市の分析をする分野であれば「使いたい」と考える人が非常に多い、「質的にいい」データだと認識しています。
理由としては以下のような点があります。
例えば、研究機関では生データのデータベースを渡されて分析することも多々あります。いわば「人に見せるつもりがなかった」データベースのため、複雑で整理されていない状態も珍しくありません。その点、タウンページデータベースは販売することを前提に整備されているため、扱いが容易でした。
また、例えば「業種分類がユーザ目線」な点が挙げられます。省庁が公表しているデータは、監督官庁の視点で業種分類されており、それはユーザが使いやすい分類ではないこともあります。タウンページデータベースはそもそも職業別電話帳のデータが基のため、ユーザ側の視点で分類がなされていて、必要なデータを探しやすいです。これは面白い特徴だと感じています。
まだ研究を始めたばかりで、単純な分析しかできていないため、タウンページデータベースによる成果も目に見える形では出ていません。ただ、「省庁が『統計資料』として作っているメッシュデータ」ではできなかった分析は飛躍的に進んでいます。同程度の人口密度であれば、そこにある飲食店の数や延べ床面積は、時代によってそれほど変わらないのではないでしょうか。ただ飲食店はこの数十年で頻繁に入れ替わっており、「どういう業態がどれぐらいのシェアを持っているか」も大きく変わってきています。インターネットがなく、仕事の手法も今とまったく異なるような時代に行く飲食店と、現代の、仕事とライフスタイルが繋がっている生活の中で行く飲食店の違い・変化とはなにか。それは「ランチや夕食を食べに行く場所」が変わることよりも、「お店のフォーマットそのもの」が大きく変わってきていると感じます。こうした「質的な変化」が、詳細なデータを分析することによって、明らかになりつつあります。
今後期待すること
原氏:東北大学は2024年4月以降に入学する学生全員に、学部や理系・文系といった属性に関わらず、データサイエンスの素養を身につけさせる方針を打ち出しています。東北大学に限らず、多くの大学でこのような動きが見られるため、いずれデータ分析は専門職の領域ではなくなり「誰でもデータ分析ができる社会」になっていくのではないでしょうか。
その中で、今「良いデータがあるから研究が進む」、つまりよく整備されている扱いやすいデータが“取っかかり”になり、その分野の研究が進んでいく事象が非常に多くなっています。例えば言語処理の分野では、ウィキペディアなどの文字情報がオープンデータになっていることで、研究が進む流れが起きているのです。
我々のテーマである都市空間や交通の分野は、プライバシーに関わる情報も多いため進めることが困難なことがありますが、「良いデータ」を持っているNTTタウンページさまがうまく関わって「研究を進めて」くださればうれしいです。