デジタル教材の紹介

 このブログでは、
  ・株式会社エスミの事業内容
  ・株式会社エスミが開発、販売するソフトの紹介
  ・事例の紹介
などをおこないます。

 今回は株式会社エスミの事業内容を紹介します。
 6年ほど前になりますが、小学生・中学生・高校生向けのデジタル教材『科学の道具箱』を作成しました。下記のURLをクリックすると、別ウィンドウでページが開きます。
http://rikanet2.jst.go.jp/contents/cp0530/start.html

 「理科ねっとわーく」というサイトの中の一つで、他にも理科に関するデジタル教材がたくさんあります。トップページに記載されている言葉は「統計学」ではなく「データ分析」となっています。さらに、理科のサイトなのに、堂々と「算数・数学」と記載されており、厳密に理科の科目だけを扱っているわけではないようです。
 上記ページ内の「クレジット」を開くと、弊社だけでなくたくさんの方々によって作られたことがわかります。
 「コンテンツ」を開くと、いろいろな題材へのリンクがあり、データ分析について学ぶことができます。子供向けの内容だとバカにしてはいけません。小学生~高校生の時代に統計学を履修していない方だと、戸惑うことも多いのではないでしょうか。

 ところで、小学生~高校生向けの教材なのに、「コンテンツ」「サムネール」「クレジット」といった英語のカタカナ表記に違和感を持たれた方も多いと思います。作成当時、筆者も疑問に思い、「この表現で良いのですか?」と質問しましたが、このように表記することが決まっているのだそうです。他の教材も開くと同じようになっています。

 弊社が関わったのは「統計グラフソフトを使おう」からリンクしている下記のページです。URLをクリックすると、別ウィンドウでページが開きます。
http://rikanet2.jst.go.jp/contents/cp0530/contents/05.html

 Excelで動作するグラフ描画ソフトで、左下の「グラフソフトダウンロード」からダウンロードすることができます。利用についての申し込みや登録などは必要なく、誰でもダウンロードできるようになっています。「小学生向け」と「中・高生向け」の2つに分けられており、Zip形式で圧縮されています。
 ただし、この教材の公開が2009年末のため、Windows版のExcel2003とExcel2007でしか動作しないのでご注意ください。Excel2010以降だと、動作させるたびにエラーメッセージが出ます。エラーは出ても動作(描画)はしているようですが、全ては確認しておりません。また、学校の授業で使うことを想定していたため、Macintosh版のExcelでは動作しません。
 なお、「このエラーメッセージは何ですか?」「操作方法を教えてほしい」「最新のExcelでも動作するようにしてほしい」といったサポートはおこなっておりませんのでご了承ください。

 『統計グラフソフト』にあるグラフ機能の多くは『EXCEL統計Ver.6.0』から流用したものですが、監修になっている大学の先生の方々からの要望により、手が加えられたグラフや新たに作成したグラフもあります。その中の一つが異なる階級幅が混在するヒストグラムです。
 『統計グラフソフト』では予めソフト内で用意されたデータだけでなく、皆様がお持ちのデータを読み込ませて描画することができますので、前回までで紹介した2014年のプロ野球選手の年俸を使用します。ただし、全員のデータを使うと階級の個数が多くて見づらくなりますので、5000万円未満の選手(597人)に絞って説明します。
 前回までは1000万円未満を1つの階級にしていましたが、下表のように100万円刻みにしました。

 まず、400万円以上1000万円未満を100万円ごとに階級を作り、度数を求めます。
 続いて、1000万円以上2000万円未満は200万円ごとに階級を作り、度数を求めます。
 さらに、2000万円以上3000万円未満は500万円ごとに階級を作り、度数を求めます。
 最後に、3000万円以上5000万円未満を1つの階級にして、度数を求めます。
 通常であれば、A(度数)かA÷597(割合)を使って、以下のようなグラフを描くと思います。画像をクリックすると、別ウィンドウで拡大画像が開きます。

 前回までは割合で描画していましたが、今回は度数で描画しています。14個の階級がありますので、14本の棒によって度数を表現しています。
 人数を見ると、最も多いのは「3000~5000」の92人、次に多いのは「1000~1200」の58人です。3000万円未満では前回よりも細かく分けていますので、各階級の度数の違いがわかりやすくなっています。
 しかし、棒の間隔を空けて棒グラフとして描画するならこれで問題ありませんが、ヒストグラムとして描画するなら正しくありません。階級幅の違いが表現されていないからです。
 そこで、階級幅の違いを表現するために、先ほどの度数分布表に戻って新たに表を作成します。画像をクリックすると、別ウィンドウで拡大画像が開きます。

 まず、各階級の階級幅を求めます。それがBです。
 次に、棒の広さをB÷100で求めます。それがCです。100というのは階級幅の最小値のことです。
 続いて、棒の高さをA÷Cで求めます。それがDで、階級幅が100のところはそのまま、200のところは高さが半分に、2000のところは高さが0.05倍にします。つまり、棒の広さを広げた分、高さを縮めるわけです。
 このDをグラフ化したのが以下のグラフです。画像をクリックすると、別ウィンドウで拡大画像が開きます。

 通常のExcelの操作では描画できませんので、かなり強引に表現しています。ヒストグラムの表現方法としては正しいのかもしれませんが、一見しただけでは人数が把握できないので、実際に使ってみようと思われた方は少ないのではないでしょうか。初めての方は、こういう描き方があるというのを知っておくだけで充分です。
 これを初めて見て、階級ごとに 広さ×高さ=度数 の関係になっていることに気づいた方は鋭いです。面積=度数ということになります。普通の棒グラフしか知らないと、このグラフを見ても、「3000~5000」の度数(人数)が一番多いことを読み取ることはできるかもしれませんが、それが92人であることはなかなかわからないのではないでしょうか。

 この例では上限(最大値)が5000万円未満であることがわかっています。もし、最大値が遥かに大きいデータではどのように描画すれば良いでしょうか。
 総務省統計局のページに貯蓄額をヒストグラムにしたものがありました。下記の1つ目のURLで示したページの中に、2つ目のURLで示した画像があります。それぞれのURLをクリックすると、別ウィンドウでページが開きます。
http://www.stat.go.jp/teacher/c2kakei.htm
http://www.stat.go.jp/teacher/img/c2/c2kaikei/img_02i.jpg

 貯蓄額の文字サイズが小さいのでわかりづらいですが、階級幅が異なっていることはわかると思います。ポイントは一番右にある「4000万円以上」で、省略を示す斜めの線が引かれています。億単位以上の貯蓄額の人がいたとしてもごく少数ですので、「4000万円以上」としてまとめているのだと思います。階級幅を正確に表現しようとすると、横幅をどんどん広げなければいけないので、省略線が引かれています。
 これをExcelで表現するためには、図形を挿入してオブジェクトを作り、それをグラフの上にコピーする必要があります。1枚のグラフを作るのに、そこまで時間を掛けようという気は起こらないのではないでしょうか。

 他にも様々なグラフ機能がありますので、皆様がお持ちのデータでいろいろ試してみてください。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

*

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>