『みんなのR:データ分析と統計解析の新しい教科書』

Jared P. Lander[高柳慎一・牧山幸史・簑田高志訳|Tokyo.R 協力]

(2015年6月22日刊行,マイナビ,東京,447 pp., 本体価格3,800円, ISBN:9784839955212版元ページ

必死で通読した.まずは前半13章までチェック終了.第14章以降は統計データ解析なのである程度は使いこなせるが,前半のデータ操作の方がワタクシにとっては手薄になっていたことがよくわかった.第13〜18章までは統計データ解析のうちGLMまで解説されている.続く第19〜22章はリッジ回帰やGAMCART,ランダム・フォレスト,時系列,クラスター分析など発展的内容.ggplot2 で描画するのはヴィジュアルに効果的.第23章は knitr による LaTeXMarkdown からのレポート出力,最後の第24章はパッケージの作り方.うん,これで全体をだいたいつかめた.

ミス一箇所:p. 109「ggplot(data = diamonds) + geom_density(aes(x = carat), fill = grey50)」の「grey50」は「"grey50"」のまちがい.サポートサイトには載っていなかったので備忘メモ.

今までは R の基本グラフィクスだけをPC実習で描いてきたのだが,これからは ggplot2 漬けにしてしまおうかというワルダクミを練っている.いたいけな学部生ではなく,世の中を知りつつある大学院生が相手だったら漬けてしまっても実害ないだろうし.

みんなのR』は「Rプログラミング」を勉強するにはとてもいい参考書だと思うが,「R統計学」の教材という点ではイマイチかもしれない(統計学の説明がほとんどされていないので).最近は本書のような「Rプログラミング」のための参考書が多々出版されているが,ワタクシ的には「R統計学」本もお座敷で必要になるので,そのバランスが難しい.理想的には,いま首都大学東京がやられているように,「R統計学」と「Rプログラミング」とは別の講義にするのがいいのだろう.