R studioを用いた箱ひげ線図の描画
ばらつきのあるデータの可視化技法として、箱ひげ線図は非常に魅力的なんだけども、
Excelでぱっと書けるかと言われるとそうでもない。
お手軽なのはR stduioであろう。忘備録としてコマンドとreferenceをまとめておく。
別にexcel等でまとめられたデータ群があるとして、それをコピペする。
//データの確保
x1=scan()
//データのコピペ
ctr+v
これをx1,x2,...に対して行う。面倒だったら全部選択してコピーして
X=read.delim("clipboard")
でもよい。
//箱ひげ線図の書き方
//boxplot(x1,x2,...)
デフォルトで表示されるのは四分位点でまとめたものらしい。wikipediaに書いてあるやつそのまま。
考案者はFFTの開発者らしい。意外。
これで正直十分だけど、まあ、y軸をいじりたければ
boxplot(x1,x2,...,ylim=c(min,max))
として明示すれば一発。
大概の用途だとこれでよいが、実際のデータを同時に記入したほうが
実際のばらつきが一目でわかるので直観的にわかりやすい。
これはRの標準装備だと難しいので、パッケージのインストールを行う。
R studio右下の枠にpackagesのコーナーがあるので、こちらを選択して、installをクリック。
インストールしたいライブラリ名としてbeeswarmと記入し、インストールする。
インストール後、consoleで
library(beeswarm)
とすればbeeswarm関数が使えるようになる。
beeswarm(list(x1,x2,...),add=TRUE)
と入力すると、箱ひげ線図に実際のデータの散布図がいい感じに書き込まれる。わかりやすい。
reference
ボックスプロット | Rのboxplot関数の使い方
ビースウォーム | ビースウォームはデータを実際の点として表現
色々と考えてみる: 文系のための「数の可視化」(7)