機械学習 - 正規データ分布
正規データ分布
前の章では、指定されたサイズの、指定された 2つの値の間の完全にランダムな配列を作成する方法を学びました。
この章では、値が特定の値の周りに集中している配列を作成する方法を学びます。
確率論では、この種のデータ分布は*正規データ分布*、またはこのデータ分布の公式を考案した数学者カール・フリードリッヒ・ガウスの名前にちなんで*ガウスデータ分布*として知られています。
例
典型的な正規データ分布:
import numpy
import matplotlib.pyplot as plt
x = numpy.random.normal(5.0, 1.0, 100000)
plt.hist(x, 100)
plt.show()
結果:
注意:正規分布グラフは、釣鐘のような特徴的な形状をしているため、釣鐘曲線とも呼ばれます。
ヒストグラムの説明
100000個の値を含むnumpy.random.normal()
メソッドの配列を使用して、100個のバーからなるヒストグラムを描画します。
平均値は5.0、標準偏差は1.0と指定します。
つまり、値は 5.0付近に集中し、平均値から 1.0を超えることはめったにありません。
ヒストグラムからわかるように、ほとんどの値は4.0から6.0の間にあり、約5.0が最高値です。
プログラミング学習を加速させる
プログラミングをプロの講師に教えてもらいませんか。