ラベル データの整理 の投稿を表示しています。 すべての投稿を表示
ラベル データの整理 の投稿を表示しています。 すべての投稿を表示

2016年1月5日火曜日

データマイングで初めにやるべき「データの整形」

データ分析で1番重要な「データ」の整理


 データ分析では、大量のデータ群を全て分析するわけではありません

 必要な要所要所を取りだすことも、データマイングでは欠かせない技術になります。

 今回は、データを取り出す方法を紹介します。

データを取り出す「subset」関数


subset(元のデータ、抜き出す条件)

抜きだす条件によって、さまざまな条件のデータを取り出すことができます。

①:変数を指定して取り出す


subset(dat, select=c("kokugo","sugaku"))

※変数を選択する場合は、selectを使用する

②:A組のデータだけ抜き出す


subset(dat,dat$class=="A")

※$で変数指定、==は=と同義

③:欠損値のないデータを抜き出す


subset(dat, complete.case(dat))

※欠損値のないデータは、complete.case


次回は、R のソフトを使う前提として統計学を勉強します。