機械学習 - 平均中央値モード
Mean、Median、Mode
数の集まりから何を学ぶことができるでしょうか。
機械学習(および数学)では多くの場合、私たちが関心を持つ3つの値があります。
- Mean- 平均値
- Median- 中間値
- Mode- 最も一般的な値
例: 13台の車の速度を登録しました。
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
平均、中間、または最も一般的な速度値は?
Mean
Meanは平均値です。
Meanを計算するには、すべての値の合計を求め、その合計を値の数で割ります。
(99+86+87+88+111+86+103+87+94+78+77+85+86) / 13 = 89.77
NumPyモジュールにはこのためのメソッドがあります。NumPyモジュールについては、NumPyチュートリアルで学習してください。
例
NumPyのmeans()
メソッドを使用して平均速度を求めます。
import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.mean(speed)
print(x)
Median
Medianは、すべての値を並べ替えた後の中央の値です。
77, 78, 85, 86, 86, 86,
87
, 87, 88, 94, 99, 103, 111
中央値を見つける前に、数値を並べ替えることが重要です。
NumPyモジュールには、このためのメソッドがあります。
例
NumPyのmedian()
メソッドを使用して中間値を見つけます。
import numpy
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)
真ん中に2つの数字がある場合は、それらの数字の合計を2で割ります。
77, 78, 85, 86, 86,
86, 87
, 87, 94, 98, 99, 103(86 + 87) / 2 =
86.5
例
NumPyモジュールの使用:
import numpy
speed = [99,86,87,88,86,103,87,94,78,77,85,86]
x = numpy.median(speed)
print(x)
Mode
Modeは、最も多く表示される値です。
99,
86
, 87, 88, 111,
86
, 103, 87, 94, 78, 77, 85,
86
= 86
SciPyモジュールにはこのためのメソッドがあります。SciPyモジュールについては、SciPyチュートリアルで学習してください。
例
SciPyのmode()
メソッドを使用して、最も多く出現する数値を見つけます。
from scipy import stats
speed = [99,86,87,88,111,86,103,87,94,78,77,85,86]
x = stats.mode(speed)
print(x)
章のまとめ
Mean、Median、Modeは、機械学習でよく使用される手法であるため、これらの背後にある概念を理解することが重要です。
プログラミング学習を加速させる
プログラミングをプロの講師に教えてもらいませんか。