やってみたデータジャーナリズム

コメントする

03/05/2012 by kaztaira

土曜日は、日本ジャーナリスト教育センターが東海大学湘南キャンパスで開いたイベント「ジャーナリスト・エデュケーション・フォーラム2012」

 午前中の全体セッションと、午後は「データジャーナリズム」「コミュニケーションデザイン」「イノベーション」の三つの分科会、という構成。私は主に「データジャーナリズム」の分科会に参加した。
 データジャーナリズムにはっきりした定義があるのかどうか知らないが、様々なデータの加工によって、そのデータの持つ文脈を一目でわかるようにする、という取り組みと私は理解している。
 分科会はいずれも中身の濃いものだった。ただ、こればっかりは自分でやってみないとわからない。
 ここでは二つのサービスを見てみる。一つは「メニー・アイズ」というIBMが試験的に提供している無料サービスだ。
 かなりいろいろな表現ができるが、まずはシンプルなものから。
 「ワード・クラウド・ジェネレーター」という機能がある。文章を読み込ませると、使用頻度の高い言葉はより大きなフォントで表示し、デザイン化するプログラムだ。

 フェイスブックの最高経営責任者(CEO)マーク・ザッカーバーグ氏が、2月1日に米証券取引委員会(SEC)に新規株式公開(IPO)のための書類を提出した際、添付した「手紙」の文面を使ってみる。

 

約2200語のこの手紙の中で、一番使用頻度が高かったのは? 「ソーシャル」? 「フレンド」?

 このプログラムによると、それは「ピープル」だった。まあ、なるほど、という結果だ。
 デザインの調整も可能で、記事につけるビジュアルとしては使えそうだ。
 ただ、試験的サービスということもあってか、ブラウザーが固まってしまうこともある。
 もう少し手のかかるビジュアル化も紹介しておく。
 使うのは位置情報を含むデータをグーグルマップ上に表示できるサービス「グーグル・フュージョン・テーブル」。
 カンマやタブで区切られたCSVなどのファイルを読み込ませると、割と簡単に地図にデータが組み合われていく。
 ここでは、原発事故による放射線量の測定に取り組んでいる「セーフキャスト」が、パブリックドメイン(著作権無し)で公開しているCSV形式の測定データを使ってみる。
 最新のデータは重すぎてうまくいかないため、昨年9月に公開された、少し古いデータを使っている。それでも測定データは138万件にのぼる。
 地図上に表示される測定ポイントをクリックすると、測定の日時と放射線量が表示される。測定ポイントの色は、放射線量の数値に応じて5段階で変えている。
 これは測定ポイントが膨大なので、やはり表示には時間がかかるかもしれない。
 一度やってみれば、ほとんど専門的な知識がなくても、結構応用がきくことがわかるものだ。
 ◇  ◇
 ここからは宣伝。本日(5日)午後7時半から、東京・お台場のイベントスペース「カルチャーカルチャー」で、こんな手法の紹介も含めたトークをします。テーマは「ソーシャルメディア時代、マスメディアはどうなる? 海外事例に見る進化の形」。メディア・コミュニケーション研究会のイベントです。
 来週13日に発売になる著書『朝日新聞記者のネット情報活用術』(朝日新書)や昨年7月に出した訳書『あなたがメディア! ソーシャル新時代の情報術』で紹介したメディアの生態系の変化と、マスメディアの取り組み事例などについて取り上げる予定です。
 有料(参加費1500円+飲食チケット2000円)ですが、ご興味ある方は是非どうぞ。
広告

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中

アーカイブ

ブログ統計情報

  • 515,567 ヒット
%d人のブロガーが「いいね」をつけました。