コラム

公的機関の公表データの「形」問題―その形式は大学のIR活動にとって望ましいか?―

日本の各大学のIR担当者の中には、公的機関の公表データ(以下「公表データ」)を用いて彼我比較やベンチマーキングに取り組んでいる方も多いのではないでしょうか。あるいは、IR担当者でなくとも、入試や学生支援など担当業務に関するテーマについて、公的機関の公表データを比較分析に利用している教職員も少なくないと思います。

「公表データ」の利活用には様々な課題があります。今回は、多くのIR担当者が一度は経験したことがあろう共通の悩みの一つ「公表データ」の「形」について1つ例をあげながら問題提起をしたいと思います。

図1は、日本学術振興会のWEBサイトで公開されている、「スーパーグローバル大学創成支援事業」のフォローアップ調査結果の一部です。

画像1 元々の公表形式の一部(PDF)

出典:https://www.jsps.go.jp/j-sgu/data/follow-up/h29/sgu_h29FU_kekka.pdf (2019年6月13日閲覧)

このデータを何かしらの比較分析に利用しようとしたとき、IR担当者は次の3つの「困難」に直面するでしょう。第一の「困難」はPDF問題です。WEBサイト上の表がPDFファイルとして公表されているため、PDFを表計算・統計ソフト等で使えるようにExcelやCSVファイルに変換しなくてはいけません。第二の「困難」はページ分割問題です。紙資料としての活用を前提としているためか、WEBサイト上のデータが約40ページに分割されています。これでは、約40ページ分の表頭をすべて削除して繋がなければ表計算・統計ソフト等で使えるデータになりません。第三の「困難」は表列不規則問題です。項目によって表頭や列数が異なるといった不規則性があるため、ExcelやCSVファイルに変換した後の整形・準備作業も一筋縄ではいきません。

続いて、図2は、先述の3つの「困難」を乗り越えて、統計ソフトやBIツールで比較分析に使えるよう、ロング型[i]に整えたデータの一部です。

[i] 端的にいえば、ワイド型とは同一サンプルやケースの各値がヨコ方向に並ぶ形式、ロング型とはそれらがタテ方向に並ぶ形式です。2つの型は集計・分析によって使い分けるので、どちらかが絶対的に優れているとはいえません。しかし、近年大学業界でも普及してきたPower BIやTableauなどのBIツールではロング型を主に使用しますし、個人や個別大学を複数時点で観測したパネルデータの分析では、ロング型のほうが便利な手法が多くあります。そのため、もしワイド型で公開するのであっても、リシェイプ(ロング型⇔ワイド型の変換)が容易な形状が望ましいと思います。

図 2 整形・加工後のデータ形式(Excel)(図1のデータを加工して筆者が作成した)

私も一度このような作業をしたことがあるのですが、便利なツールを活用しながらも図1の状態からここまで整えるのに10~20時間程度ほど要したと記憶しています。加えて、同様のデータを扱ったことのある他大学のIR担当者からも、数十時間は要したという話を聞きました。もちろん、もっと効率的な方法はあったかもしれませんが、これらの事実を踏まえると、同じような「困難」を経験した、あるいはこれから経験するかもしれないIR担当者が全国各地に潜在することは非常に大きな問題だととらえています。

このように、「公表データ」を統計ソフトやBIツールで使えるようにする膨大な準備作業が各大学のIR担当者によって同時進行的に行われているケースがあります。担当者間での作業スピードにこそ差はあれど、どの大学の誰がやっても結果はほぼ同じになると思いますので、作業結果の質は大学間で大差はないと思います。

「初めから各大学のIR担当者がすぐに使える形で公表されていれば、この時間は不要になのに!!」と、何度思ったことでしょうか。残念ながら、このような現状は非効率的であるといえます。全国のIR担当者がそれぞれ多くの時間を割いてこのような「困難」解消に取り組んでいるのです。いわば、「公表データ」の「形」に問題があるために、「全国のIR担当者n人×数十時間」という労働時間が奪われているのです。

※画像3は、画像2のデータ形式を参照してBIツールで出力した結果のイメージです

図 3 Power BIによる可視化イメージ(図2のデータ形式を参照して筆者が作成したBIツールで出力した結果のイメージ)

「成果物が同じならば、各大学のIR担当者間で共有すればよいではないか」という意見があるかもしれません。しかし、業務上作成した成果物は、組織の機密保持上、そう簡単に共有できないIR担当者が多いのが現状です。

何よりも、上記例のようにどの大学にも共通してニーズが存在するであろう、比較分析に活用し得る「公表データ」の活用基盤の整備こそ、もととなるデータの収集・公表機関の役割ではないでしょうか・さらに言えば、高等教育機関を支援する役割を担う行政機関が、責任をもって取り組むべきことではないでしょうか。

現在は、組織の戦略策定や改善検討など様々な面において、情報が大きな価値を持つ時代です。その情報のもととなるデータの活用基盤を整備することは、大学、そして、大学業界全体に対する重要な経営支援政策の一つであると私は考えます。

「公表データ」がIR担当者や大学関係者が比較分析に使いやすい形状でデータが公表されていれば、準備作業のための非創造的業務の時間を大幅に削減できます。そして、それによって得た時間を、創造的業務、たとえば、競争戦略や改善施策を考えるための時間に費やすこともできるでしょう。また、「公表データ」の「形」の改善により、データ活用に対するアクセシビリティが少しでも高められれば、大学関係者の間で「公表データ」活用の輪が広がっていく可能性も高められることでしょう。

「大学改革」を支援・促進するといった謳い文句の機関競争的政策を最近はよく目にします。それらの政策の中には、IR担当者の配置や具体的な活動を要件とする補助金制度もあります。もし、政策を通して大学におけるIR活動をさらに支援するのであれば、各種政府機関は、優先して「公表データ」活用の基盤・環境整備にも取り組むべきではないでしょうか。マスメディアだけでなく、公的機関による大学に関するデータの収集・管理・公表業務についても、真に意味のある改善に期待します。

(法政大学 井芹俊太郎)