統計学 PR

散布図で相関を見る!【0から始める統計検定2級講座㊲】

記事内に商品プロモーションを含む場合があります

この講座の対象者は以下の方を想定しています。

  • 数学は中学レベルしか分からないけど統計検定2級に合格したい
  • どの参考書を見ても数式だらけで理解できない
  • 散布図ってなに?
  • 相関と因果関係ってどう違うの?

この講座では特に、0の状態から統計検定2級に合格したいって方のために、分かりやすさをモットーに解説していきます。

今回は、散布図と相関についてです。
散布図がイマイチ分からないって方でも理解できる内容になっています。

 

散布図とは何か?

まず、散布図とは以下のような図の事です。

なんとなく見た事がある人も多いと思います。

 

散布図の説明

散布図とは、2つの変数の関係を視覚的に表すグラフです。
横軸に1つの変数、縦軸にもう1つの変数をとり、データの点(散布点)をプロットします。

散布図の形状から、2つの変数の間にどのような関係があるかを判断することができます。

 

えいせい
えいせい
2つの変数の相関を、視覚的に分かりやすく表現したのが散布図です。

 

散布図の作り方

まだイマイチ散布図が良く理解出来ない人も多いと思います。
ですので、どのようにして散布図を作るのか?を見ていきましょう!

たとえば、以下のA君の結果を散布図にプロットします。

高校生のA君は数学と英語のテストを受けた。
その結果、数学は72点、英語は64であった。

横軸(X軸)に数学の結果、縦軸(Y軸)英語の結果をとっています。
座標(72, 64)に青い点がついているのがA君の数学と英語の結果です。

 

10人分の結果をプロット

では続いて10人分結果をプロットしてみましょう。

このようにして、合計10個の散らばった点ができました。
これが散布図の基本です。

 

 

散布図には正の相関と負の相関がある

散布図の基本が分かったところで、10の散らばった散布図を見て何が嬉しいのでしょうか?
ただ点がプロットされていても何も嬉しくないですよね?

ここで大事になってくるのが相関です。

 

相関とは何か?

相関とは、2つの変数の間にある関係の強さを表す数値です。
相関係数は-1から1までの範囲で表され、-1に近いほど負の相関、1に近いほど正の相関、0に近いほど相関がありません(無相関)。

例えば、身長と体重の間には正の相関があります。
身長が高い人ほど体重が重い傾向があるのは容易に想像できるでしょう。

このように、元から相関があると予想できる場合もありますが、相関があるのか分からない場合もあります。
むしろ分からない場合の方が多いでしょう。

例えば、前のセクションでやったように、数学と英語の結果に相関があるかどうかは分からないですよね?

そんな時に、散布図を見て相関を見る事ができるのです。

 

正の相関

正の相関とは、2つの変数のうち1方が増加すると、もう一方の値も増加する傾向があります。
それを散布図から簡単に見分けるには、「データが右上がりになっているか?」を見ます。

上の図を見てみると、全体的に右上に上がっているのが分かるでしょうか?
つまり、数学の点数があがると、英語の点数も上がっている事が分かります。

 

強い正の相関

続いて、こちらの図を見てください。

1つ目のものよりも、点のバラつきが少なく、より右肩上がりなのが分かると思います。
実は正の相関にも強弱があり、強い相関であるほど、このように細い帯状にまとまっています。

逆に相関が弱いほど、点のバラつきがひろがります。

 

負の相関

続いて負の相関について解説します。
正の相関の逆で、1方の値が上がると、もう一方の値が下がることを負の相関と言います。
今回の例で言うと、数学の点数が上がると、英語の点数が下がるといった場合です。

図で表すと↓になります。

特徴としては、右肩下がりになっていることです。
負の相関にも強弱があります。

強い負の相関は、強い正の相関と同じく、バラつきが少ないです。

 

無相関

最後に無相関について説明します。
これは読んで字のごとく、相関が無い事を表しています。

このように、値が規則性なく散らばっており、傾向を読み取る事ができません。
このような散布図を無相関と言います。

 

 

相関関係と因果関係とは?

相関関係を理会する上で、絶対に覚えて欲しい事として因果関係があります。
この言葉の意味がどういう意味かを理解しましょう。

 

相関関係のおさらい

いったん相関関係のおさらいをしましょう。

相関関係とは、2つの変数の間にある関係の強さを表す数値です。
たとえば夏になると、クーラーの売上とアイスの売上が伸びます。
この2つは相関関係にあります。

 

 

因果関係とは何か?

続いて因果関係の説明です。

因果関係とは、ある変数が別の変数に影響を与える関係です。
例えば、気温が上がるとクーラーの売上が上がります。
この2つは因果関係にあります。

 

相関関係と因果関係の関係

似ている概念ですが、相関関係は、因果関係を示すものではありません。
相関関係が強い場合でも、必ずしも因果関係があるとは限りません。

例えば、クーラーの売上とアイスの売上は相関関係にありますが、クーラーの売上が伸びるからアイスの売上も伸びるわけではありません。
ですので、この2つに因果関係はありません。

しかし、気温が上がるとクーラーの売上が上がるのは、直接的な要因になっているため因果関係にあります。

このように、相関関係があるから因果関係もあるわけでは無いという点に注意しましょう!

 

 

 

Work illustrations by Storyset

あなたにおススメの記事
統計学

記述統計・推測統計とは?違いを簡単に解説します。データ分析を学ぶにはまずはこれから!

2023年4月15日
えいせい@データサイエンスブログ
ビックデータが当たり前になった現在社会では、いかにデータを分析するのか? いかに数字をベースに課題解決を行うのか? そのようなスキルが非 …