
統計解析のやり方が分かりません.
誰でもできる簡単な方法を教えてください…
本記事は,このような「なぜ?どうして?」にお答えします.

こんにちは.
博士号を取得後,派遣社員として基礎研究に従事しているフールです.
実験データの解析には解析ソフトが必須です(紙とペンまたはエクセルを使って計算する玄人もいるかもしれませんが 笑).
皆さんは,どのような統計解析ソフトを利用していますか?

私は “R” を使っています.
なぜなら,無料で利用できるから!

でも “R” は,R言語の勉強が必要だし…

そうそう.

ちょっと勉強してみたけど…
R言語などのプログラミング言語って意味不明で混乱するんだよね~

“R” をクリック形式で利用できるソフト “EZR” を知っていますか?

“EZR” ?

“EZR” は,ボタンを押すようにクリックするだけで操作できるので,R言語の習得は必要ありませんよ!

そういう情報はもっと早く教えてよ~
ってことで,この記事では無料統計ソフトEZRの使い方をまとめました.
ソフトのインストールからデータ解析までの一連の操作を写真を交えながら説明していきます.
ぜひ最後までお付き合いください!
本記事を読み終えると,明日から実験中でも統計解析をやりたく堪らなくなりますよ!
サマリー・EZRは,R言語に基づくスクリプトを入力する必要はありません.
・EZRは,マウス操作だけで解析を行うことができます.
・基本的な統計解析は,EZRだけで完結します.
EZRのダウンロードとインストール
EZRは,自治医科大学附属さいたま医療センターのHPよりダウンロードできます.
検索サイトで “EZR” って検索しても,一番上に出てくると思います.
HPに入ると,以下のような画面になります.
ダウンロード (Windows標準版)*をクリックすると次のような画面になります.
*私が Windows を利用しているので,”Windows標準版” にしています.その他のOSの方は,そのOSに準じたものをクリックしてください.ただし,Mac ではインストールが少々面倒だと聞きました.
『ダウンロードしてください』をクリックして,インストールパッケージ(EZRsetup.exe)をダウンロードしてください.
ダウンロードが完了したら,EZRsetup.exeをダブルクリックで起動してください!
ダブルクリックすると以下のような画面になります.
『次へ』をクリックして,インストールを開始してください.
次に以下のような画面になりますので,『次へ』をクリックしてください.
最後に『完了』をクリックしてインストールは完了します.
EZRの起動
デスクトップ画面には,2つのアイコンが作成されていると思います.
32ビットWindowsの人はEZR (32-bit)を,64ビットWindowsの人はEZR (64-bit)をダブルクリックして起動してください.
ちなみに,32ビットWindowsでは64ビット版を使用することができません.
次のような2つの画面( “R Console” と “Rコマンダー” )が出てくれば,起動ができたことになります.
↓R Console↓
↓Rコマンダー↓
データセットの用意
インストールと起動の確認が無事にできたら,すぐにでもデータを解析したくなりますよね!
でも,その前にやることがあります.
それはデータセットの用意です.
データセットの用意はちょっと特殊で,やり方を間違えると EZR で読み込むことができません!
ココではマウスの体重データを具体例として,データセットの用意の仕方をまとめます.
私が用意したデータセットは以下の通りです.
1行目は各データの変数名
1行目は各データの変数名にしましょう.
そして,変数名には日本語(全角)を使わない方が無難です.
私はアルファベットの小文字と数字を使うようにしています.
また,最初の文字を数字にするのは止めましょう!
カテゴリー変数はコード化
性別やケージ名などのカテゴリー変数は,コード化しましょう!
コード化とは, “0” または “1” のように表現する方法です.
ただ,それだけでは後々見返すときに分からなくなるので,データセットとは別のファイルで対応表を作成しておきます.
スペースを入れない
変数名およびデータにスペースを入れないようにしましょう!
どうしても必要な場合は “-” や “_” を使用します.
単位を付けない
データに単位を付けるのは止めましょう!
単位を付けるとカテゴリーデータとして認識されてしまいます.
その他
その他の注意点は以下の通りです.
- 1つのセルに1つのデータ(1つのセルに複数のデータを入れない.)
- 1行にまとめるデータは1サンプルのみ(経時的に複数のデータを取得する場合は,データごとに行を作成し,”id” で他の個体と区別し,”date” でデータ取得日を区別する.)
- 保存形式はCSV形式にする.
EZRでの解析例
データセットの用意はできたら,いよいよ解析です.
今回は,先ほどお示ししたマウスの体重データで解析を進めてみます.
データの読み込み
Rコマンダーで以下の画面のように操作します.
すると次のような画面になります.
- データセットの名前を入力します(デフォルトは “Dataset”)
- データファイルの場所は『ローカルファイルシステム』
OKをクリックすると,以下のようなファイルの選択画面になります.
データファイルの保存フォルダ
余談ですが,Excelファイルのファイル名にも日本語(全角文字)を含めないようにしましょう!
また,ファイルの保存フォルダ名にも日本語(全角文字)を含めないようにしましょう!
これは厄介で,保存フォルダの上位フォルダに日本語(全角文字)を含む場合もエラーの原因になります.
日頃から日本語(全角文字)を使う人は保存場所に困るでしょうね(笑).
参考までに,私はCドライブ(C:\)にフォルダを作り,そこへデータファイルを保存しています.
データの読み込み完了
ファイルを選択後に『開く』をクリックしてデータの読み込みが完了すると,次のような画面になります.
画面が出てこない場合は,真ん中の『表示』をクリックしてください!
平均値と標準偏差を求める
Rコマンダーで以下の画面のように操作します.
すると次のような画面になります.
今回は体重の平均値と標準偏差を求めるので,”weight” を選択します.
デフォルトでは『分位点』にチェックが入っていますが,今回は外します.
OKをクリックすると「出力」の部分で次のように表示されます.
データセット全体の平均は24.17で,その標準偏差は2.81だと分かりました.
群ごとに平均値と標準偏差を求める
『層別して要約』をクリックして,群である “group” を選択してOKをクリックします.
先ほどと同じように『分位点』のチェック外して,OKをクリックすると「出力」の部分で次のように表示されます.
- “0” (Cage A)の平均は27.64で,その標準偏差が1.73
- “1” (Cage B)の平均は23.10で,その標準偏差が0.71
- “2” (Cage C)の平均は21.76で,その標準偏差が0.92
だと分かりました.
One-way ANOVA
Rコマンダーで以下の画面のように操作します.
すると次の画面が出てきます.
- 今回は体重の比較なので,『目的変数』は “weight” です.
- 群は処置ごと(ケージごと)に分けているので,『比較する群』は “treatment” または ” group” を選択します.
- 今回,グラフは箱ひげ図にしました.
OKをクリックすると「出力」の部分で次のように表示されます.
また,グラフは以下の通りです.
Dunnetの多重比較法
先ほどの one-way ANOVAで,p値が0.05より小さかったので群間に差があることが分かりました.
そこで次にDunnetの方法で多重比較を行います.
Rコマンダーで以下の画面のように操作します.
OKをクリックすると「出力」の部分で次のように表示されます.
群間(Cage A vs. Cage B または Cage A vs. Cage C)の差は,統計学的に有意な差であることが分かりました.
もっと勉強したい方へ
・初心者でもすぐにできるフリー統計ソフトEZR(Easy R)で誰でも簡単統計解析
>少し古い本ですが,初心者でも分かるEZRの説明書になります.
・EZRでやさしく学ぶ統計学 改訂3版 〜EBMの実践から臨床研究まで〜
>データセットの用意など基本的なことは書かれていませんので,上級者向けかもしれません.
EZRは,簡単に統計解析ができることが分かってもらえたと思います.
基本的な統計操作はEZRで済むので,ぜひ皆さんもお使いくださいませ~
最後までお付き合いいただきありがとうございました.
次回もよろしくお願いいたします.
2020年11月8日 フール