データ分析で1番重要な「データ」の整理
データ分析では、大量のデータ群を全て分析するわけではありません。
必要な要所要所を取りだすことも、データマイングでは欠かせない技術になります。
今回は、データを取り出す方法を紹介します。
データを取り出す「subset」関数
subset(元のデータ、抜き出す条件)
抜きだす条件によって、さまざまな条件のデータを取り出すことができます。
①:変数を指定して取り出す
subset(dat, select=c("kokugo","sugaku"))
※変数を選択する場合は、selectを使用する
②:A組のデータだけ抜き出す
subset(dat,dat$class=="A")
※$で変数指定、==は=と同義
③:欠損値のないデータを抜き出す
subset(dat, complete.case(dat))
※欠損値のないデータは、complete.case
次回は、R のソフトを使う前提として統計学を勉強します。
0 件のコメント:
コメントを投稿