2016年1月4日月曜日

分析するデータの種類とデータ構造を知ろう

数字だけを分析するわけではないデータマイング


 データ解析と言われると、数字だけを分析すると思われるかもしません。

 しかし、分析する対象には、「Yes or No」 のアンケート調査や、

 データが集められなかった場合の空データも存在します。

 R で扱うデータの種類、そしてデータ構造を紹介します。

<データの種類>


整数


実数


複素数


実数 a, b と虚数単位 i を用いて a + bi と表せる数のこと

文字列


数値データ以外を指します。

論理値


論理値は、「正しいか、正しくないか」という意味で、

表現としては、「TRUE or FALSE」を使います。

空値


空値とは、何もないことをを表す。決して「ゼロ」という意味ではありません。

ちなみに空値は、「NULL」と表現されます。

<データ構造>


①ベクトル


複数の数値を合わせたデータ構造

例1:x <- c(1,2,3)

※cは関数「conbine」、結合するという意味

この場合、x は、1でも2でも3でもなく、3つの数字のセットと考えます。

R では、データ集合をベクトルとしてよく利用します。

②行列


 数値を長方形に並べたもので、matrix関数で作成する

 matrix(ベクトル,行または列の数)

例3:matrix(c(1,2,3,4,5,6), ncol=3) ncol は行を、nrowは列の数を指定できる

行列







次回はRでよく使われる関数に焦点を当てます。

ここまでで質問がありましたら気軽にメールを下さい。データ解析の相談でも構いません。




0 件のコメント:

コメントを投稿