第V部第15章「可視化メディア」の三つ目の subtype として、本話ではデータジャーナリズムを取り上げます。前話までに扱った報道写真や映像が「現場を切り取る」可視化だとすれば、データジャーナリズムは「数字を読み解く」可視化です。両者は対照的ですが、社会の不可視を可視化するという点で、同じ系譜に立ちます。
歴史の出発点は、米国の社会学者・ジャーナリストフィリップ・マイヤー(Philip Meyer、1930-)が1973年に刊行した『Precision Journalism: A Reporter's Introduction to Social Science Methods』(Indiana University Press 1973/第4版 Rowman & Littlefield 2002)です。マイヤーは1967年のデトロイト暴動を、噂や印象ではなく社会調査の手法で報道しました。サンプリング、回帰分析、統計検定を記者の道具にする――この発想が、後年のデータジャーナリズムの源流になりました。
それから35年後の2008年、米国でProPublicaが設立されます。非営利の調査報道機関として、ハーバート&メアリー・サンドラー夫妻の寄付で出発したProPublicaは、新聞経営の崩壊に対抗する新しい報道モデルを提示しました。2010年に商業ニュース機関以外で初めてピュリッツァー賞を受賞して以降、医療・刑事司法・アルゴリズム監査の領域で複数受賞を重ねています。なかでも2016年の「Machine Bias」連載は、再犯予測アルゴリズムCOMPASの人種バイアスを暴き、アルゴリズム監査ジャーナリズムの古典になりました。
英国では2009年、The Guardian が Data Blog を開設します。立ち上げを担った編集者サイモン・ロジャース(Simon Rogers)は、英国のMP経費スキャンダル、ウィキリークスのイラク戦争ログ、英国暴動のソーシャルメディア分析などを、生データを公開し、読者と協働で分析するスタイルで報道しました。「Data is the new oil(データは新しい石油)」という時代の合言葉を実装した最初期の報道現場でした。
そして2016年、データジャーナリズムは前例のない国際規模を実現します。国際調査報道ジャーナリスト連合(ICIJ、International Consortium of Investigative Journalists) が公開した パナマ文書(Panama Papers) です。パナマの法律事務所モサック・フォンセカから流出した1,150万件・2.6テラバイトの文書を、80カ国380人以上の記者が1年以上協働で分析しました。アイスランド首相の辞任、世界各国の租税回避ネットワーク、ICIJは2017年にピュリッツァー賞(Explanatory Reporting)を受賞します。翌2017年にはパラダイス文書(Paradise Papers) が続き、国際協働調査報道は新しい標準になりました。
データジャーナリズムを支えるもう一つの柱が、データビジュアライゼーションの理論です。米国の統計学者エドワード・タフティ(Edward Tufte、1942-)が1983年に刊行した『The Visual Display of Quantitative Information』(Graphics Press 1983/第2版 2001、邦訳『定量的情報の視覚表現』丸善 2008)は、グラフ表現の倫理と美学を確立した古典です。データインク比、チャート・ジャンクの排除、スモールマルチプル――タフティが定式化した原則は、現在の報道図表の標準になりました。
そしてタフティに先立つこと80年、1900年のパリ万博で、米国の社会学者W.E.B. デュボイス(William Edward Burghardt Du Bois、1868-1963)は、ジョージア州の黒人社会の生活を手描きの統計図60点で展示しました。識字率、土地所有、職業構成、人口動態を、円グラフ、棒グラフ、独自の螺旋図で可視化したこの作品は、統計図によるアドボカシーの先駆として近年再評価されています。
数字は中立ではなく、何を数え、どう見せるかは政治的判断です。可視化メディアは、その判断を社会に開く新しい門になりました。
FOR MANAGEMENT 経営学的に読み解きたいあなたへ ▾
データジャーナリズムの系譜は、現代経営に三つの実践的示唆を与えます。
第一に、自社データの「説明可能性(accountability)」設計。ProPublicaの「Machine Bias」がCOMPASを暴いたのと同じ手法で、第三者は今、企業の採用アルゴリズム、価格設定アルゴリズム、人事評価アルゴリズムを監査できるようになりました。差別的なバイアスが事後に暴露された企業は、Amazon の採用AI(2018年廃止)、Apple Card の与信差別疑惑(2019年)、各種人事評価AIの集団訴訟など、深刻な経営損失を被ってきました。監査される前提でアルゴリズムを設計し、判断ロジックの説明資料を用意し、外部監査を能動的に受け入れる姿勢――これが新時代の信頼資産です。
第二に、「データで語る」社内文化の構築。マイヤーの精密ジャーナリズム、ガーディアンのData Blogが示したのは、生データを公開し、読者と協働することが説得力を圧倒的に高めるという事実です。社内の経営会議でも、印象論や階層的権威ではなく、データセットを共有し、誰でも検証できる状態で議論する文化は、意思決定の質を底上げします。Bridgewaterの "radical transparency"、Netflixの "Keeper Test"、サイボウズの「公開議論」は、いずれもこの系譜にあります。
第三に、ICIJ型「協働調査」のビジネス応用。パナマ文書は、80カ国380人の記者が1年協働して達成しました。競合企業や異業種との協働――サプライチェーン透明性、ESG情報、産業安全データの共同開示――は、単独で成し遂げられない情報資産を生みます。Sustainable Apparel Coalition(衣料業界)、RE100(再生可能エネルギー)、Open Banking(金融)は、すでに業界横断の協働可視化として機能しています。
データを開くことは、信頼を開くことです。
FOR ACADEMIA 学術的に読み解きたいあなたへ ▾
2. 異分野からの発展的視点 ― クリーブランドが計測した「人間の目はどの図を最も正確に読むか」
データジャーナリズムの根幹は、複雑な統計を読み取り可能な図に翻訳することにあります。棒グラフと円グラフ、長さと色 ―― どれが正確に読まれるのか。1984年、米国ベル研究所のウィリアム・クリーブランド(William Cleveland)とロバート・マクギルは、この実務的な問いに実験的な答えを与えました(*Journal of the American Statistical Association* 79巻, 531-554頁)。100名以上の被験者に同じデータを異なる図形要素で表現したグラフを見せ、量的差を読み取る誤差率を計測したのです。
結果は視覚化のヒエラルキーを明らかにしました。最も正確に読まれたのは共通基準線上の「位置」で誤差約5%、次に「長さ」(約8%)、「角度・傾き」(約12%)、「面積」(約20%)、最も誤差が大きいのは「体積」と「色の濃淡」(30%超)。棒グラフが円グラフに勝るのは、長さが角度より2倍正確に読めるからであり、バブルチャートが過小評価されるのは、人間が2乗以上の量を直感では把握できないからでした。
ProPublicaがCOMPASアルゴリズムの人種差別を可視化したときの位置ベース棒グラフ、W.E.B. Du Boisの1900年パリ万博インフォグラフィック、ICIJのパナマ文書ネットワーク図 ―― 報道図表が世論を動かす力は感性ではなく、被験者100人の認知実験が導いた知覚誤差曲線の上に冷徹に立っているのです。
次回は「アクティビストとしての映像」をお届けします。
