EXCEL統計Ver.7.0の紹介(18)

 このブログでは、
  ・株式会社エスミの事業内容
  ・株式会社エスミが開発、販売するソフトの紹介
  ・事例の紹介
などをおこないます。

 今回は事例とソフトの紹介で、『EXCEL統計Ver.7.0』からいくつかピックアップします。
 今回は引き続き箱ひげ図を紹介します。データは2014年のプロ野球選手の年俸です。今年ではなく、昨年のデータですのでご注意ください。
 前回でも述べたように、ベースボールタイムズの選手名鑑から外国人選手と育成選手を除外した726人を、以下のようにExcelのC列に入力していきます。

 まずは「データ加工」の「生データからカテゴリーベースへ」のダイアログボックスを開き、以下のようにA列とC列をそれぞれ指定します。

 OKボタンを押すと、以下の数表が出力されます。画像をクリックすると、別ウィンドウで拡大画像が開きます。

 E~P列に球団ごとに縦にまとめられたデータ(年俸)が出力されますので、箱ひげ図のダイアログボックスを開き、以下のように指定します。

 OKボタンを押すと、以下のグラフが出力されます。画像をクリックすると、別ウィンドウで拡大画像が開きます。

 『EXCEL統計Ver.7.0』で出力されるグラフを見やすく編集しましたので、実際の出力とは異なっています。
 紺色の点が外れ値で、球団ごとに外れ値が違っていることがわかります。
 また、以下のような数表も出力され、球団ごとの平均値と中央値などがわかります。画像をクリックすると、別ウィンドウで拡大画像が開きます。

 平均値を見ると、1位は巨人の6866.36万円、2位はソフトバンクの4949.65万円で、中央値は両球団とも2000万円です。ヤクルトは平均値だと10位ですが、中央値だと3位になっています。
 外れ値を見ると、巨人は1.6億円以上なのに対して、広島は6000万円以上、DeNAと西武が6500万円以上で、大きな外れ値の存在が平均値に影響を与えています。
 この数表ではわかりませんが、各球団の外れ値の人数は、日本ハムが12人、巨人が9人、広島が8人、中日・楽天・西武・ソフトバンク・オリックスが7人、阪神・ロッテが6人、DeNAとヤクルトが4人でした。日本ハムは平均値が6位、中央値が8位、外れ値の最小値が6800万円で小さい方から数えて4位であることを考えると、外れ値の人数が12人というのは意外です。

  今回も選手名の情報は使いませんでしたが、選手名があればローデータに戻って年俸と選手の紐付けが簡単にできます。例えば、巨人には6億円、5億円、4億円の選手がいますが、選手名が入力されていなければ、いちいち選手名鑑を開いて探さなければいけません。選手名が入力されていればすぐにわかりますし、入力した数値に間違いがないかどうかの確認もしやすいので、年俸と一緒に選手名も入力しておくことをお勧めします。

 なお、Excel2016からExcelのグラフ機能に箱ひげ図が追加されました。
 A列の選手名とC列の年俸の2列を指定すれば、箱ひげ図を描画することができます。

 次回は階級幅の異なる場合のヒストグラムを紹介します。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

*

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>