読者です 読者をやめる 読者になる 読者になる

R studioを用いた箱ひげ線図の描画

ばらつきのあるデータの可視化技法として、箱ひげ線図は非常に魅力的なんだけども、
Excelでぱっと書けるかと言われるとそうでもない。
お手軽なのはR stduioであろう。忘備録としてコマンドとreferenceをまとめておく。

別にexcel等でまとめられたデータ群があるとして、それをコピペする。

//データの確保
x1=scan()
//データのコピペ
ctr+v

これをx1,x2,...に対して行う。面倒だったら全部選択してコピーして
X=read.delim("clipboard")
でもよい。

//箱ひげ線図の書き方
//boxplot(x1,x2,...)

デフォルトで表示されるのは四分位点でまとめたものらしい。wikipediaに書いてあるやつそのまま。
考案者はFFTの開発者らしい。意外。

これで正直十分だけど、まあ、y軸をいじりたければ

boxplot(x1,x2,...,ylim=c(min,max))

として明示すれば一発。

大概の用途だとこれでよいが、実際のデータを同時に記入したほうが
実際のばらつきが一目でわかるので直観的にわかりやすい。

これはRの標準装備だと難しいので、パッケージのインストールを行う。
R studio右下の枠にpackagesのコーナーがあるので、こちらを選択して、installをクリック。
インストールしたいライブラリ名としてbeeswarmと記入し、インストールする。
インストール後、consoleで

library(beeswarm)

とすればbeeswarm関数が使えるようになる。

beeswarm(list(x1,x2,...),add=TRUE)

と入力すると、箱ひげ線図に実際のデータの散布図がいい感じに書き込まれる。わかりやすい。


reference
ボックスプロット | Rのboxplot関数の使い方
ビースウォーム | ビースウォームはデータを実際の点として表現
色々と考えてみる: 文系のための「数の可視化」(7)