R 散布図
散布図
プロットの章で、plot()
関数は数値同士をプロットするために使われることを学んだだでしょう。
散布図 "は、2つの数値変数の間の関係を表示するために使用されるプロットの一種であり、各観測に対して1つの点をプロットします。
同じ長さの2つのベクトルが必要で、1つはX軸(水平方向)、もう1つはY軸(垂直方向)です。
例
x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)
plot(x, y)
結果:
上記の例の観測結果は、12台の車が通過した結果を示しているはずです。
グラフを初めて見た人にはわかりにくいかもしれません。そのため、ヘッダーとさまざまなラベルを追加して、散布図をより適切に説明しましょう。
例
x <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y <- c(99,86,87,88,111,103,87,94,78,77,85,86)
plot(x, y, main="Observation of Cars", xlab="Car age", ylab="Car speed")
結果:
要約すると、上記の例の観測結果は、12台の車が通過した結果です。
x軸車がどのくらい古いかを示します。
Y軸車が通過するときの速度を表示します。
観測間に何らかの関係はありますか?
新車ほど速く走れるらしいのですが、たまたま12台しか登録していないので偶然かもしれません。
プロットの比較
上記の例では、車の速度と年齢の間に関係があるように見えますが、別の日の観測もプロットするとどうなるでしょうか。散布図は何か他のことを教えてくれますか?
プロットを別のプロットと比較するには、points()
関数:
例
同じ図に2つのプロットを描画します。
# day one, the age and speed of 12 cars:
x1 <- c(5,7,8,7,2,2,9,4,11,12,9,6)
y1 <- c(99,86,87,88,111,103,87,94,78,77,85,86)
# day two, the age and speed of 15 cars:
x2 <- c(2,2,8,1,15,8,12,9,7,3,11,4,7,14,12)
y2 <- c(100,105,84,105,90,99,90,95,94,100,79,112,91,80,85)
plot(x1, y1, main="Observation of Cars", xlab="Car age", ylab="Car speed", col="red", cex=2)
points(x2, y2, col="blue", cex=2)
結果:
注:比較の違いを確認できるようにするには、プロットに異なる色を割り当てる必要があります (col
パラメータ)。赤は1日目の値を表し、青は2日目を表します。cex
ドットのサイズを大きくするパラメーター。
観察の結論:2つのプロットを比較すると、どちらも同じ結論を出していると言っても過言ではありません。新しい車ほど速く走るということです。
プログラミング学習を加速させる
プログラミングをプロの講師に教えてもらいませんか。