Statistics | Mukai

変数の変換

変数の処理

連続変量を離散変量として扱いたい場合には、変数のカテゴリー化を行う必要があります。エクセルのifelse関数を使うこともできますが、ここではHADを使ったやり方をご説明します。

まず変換したい変数をコピーして、「id」の横に貼り付けてください。

「変数の作成」を左クリックしてください。

表示されたポップアップ画面で、「値の再割り当て」のタブを左クリックしてください。

この画面での基本的な動作は、①「範囲を指定」の下のボックスに変換したい変換前のデータの範囲を入力し、②下の「値を指定」に変換後の値を指定し、③右のある「追加」で確定する、です。

ここでは、「年齢」を使って回答者を若年層（20代・30代）、中年層（40代・50代）、年配層（60代以上）に分けるという想定で説明します。

まず「範囲を指定」を左クリックしてチェックを入れてください。

「範囲を指定」の下にある2つのボックスに変換前のデータの下限と上限を指定します。ここではまず「若年層」の処理をしたいので、下限には「最小値」を、上限には「39」を入れてください。「最小値」はボックスの横の「▼」を左クリックすると選択できます。

次は変換後の値を指定します。ここでは上で指定した値を「若年層」に変えたいのですが、半角数字以外は使えませんので「1」に変換します。「値を指定」をチェックし、横のボックスに「1」と入力してください。

ここまでで変換前（0から39）と変換後の値（1）が指定できましたので、右の方にある「追加」を左クリックしてください。

右上のボックスに「min~39 → 1」と表示されたら成功です（矢印の左側が変換前の値、右側が変換後の値です）。

続いて、「中年層」と「年配層」も変換します。「中年層」は、変換前は「40から59」、変換後は「2」と入力して、「追加」を左クリックしてください。

「年配層」は、変換前は「60から最大値」、変換後は「3」と入力し、「追加」を左クリックしてください。

最終的に下のような形になれば完成です。

最後に「OK」を左クリックして処理を確定させてください。

処理がうまく行われると、「Tran」というシートが作成されます。

新しく作成された列には変換後の値が入っています。

列名は「○○_t」という形式（ここでは「年齢_t」）になりますが、分かりにくいので「年代」に変えておきます。

この列をコピーします。

コピーした列を「データ」のシートに貼り付けます。どこでも大丈夫ですが、ここでは「年齢」の左横に貼り付けます。「年齢」の列（ここではF列）を右クリックし、「コピーしたセルの挿入」を左クリックしてください。

以下のように新しい列が追加されれば完成です。

データの確認

一応データがどのような形になっているのかを確認してみます。「データ読み込み」でデータを読み込みます。

「年代」を「id」横にコピーし、「分析」を左クリックします。

「Freq」というシートが作成されたら成功です。

右側にはそれぞれの変数の度数（出現回数）が図示されています。これに対応する数値は左側の赤字で書かれた部分に書かれています。これを見ると、「出現値」の「1」は183名いるようです。ここで「1」が何になるかはデータをどのようにコーディングするかによります。ここでは先ほど「若年層」（20代・30代）を「1」としていましたので、183名なのは若年層の回答者です。このように後々必要になることがありますので、変数をどのようにコーディングしたかは常にメモにとるようにしてください（分からなくなると後々困ったことになります）。

※「確率（%）」は出現確率（全体に占める特定のカテゴリーの割合）です。

ページ上部に戻る

本講内のセクション
1．変数の処理
2．データの確認