Нормальный закон распределения

 

 

На практике наиболее часто (примерно в 30% измерений) встречается нормальный закон распределения погрешностей. Основываясь на положениях теории вероятностей, можно сделать вывод, что сумма достаточно большого числа независимых случайных погрешностей, подчиненных каким-либо законам распределения, при отсутствии явного доминирования одной или нескольких погрешностей над другими, подчиняется нормальному закону. Поэтому он является предельным законом для суммы независимых случайных погрешностей.

Практически при суммировании двух и более случайных погрешностей, распределенных по закону Симпсона, или четырех и более — по закону равномерной плотности, суммарное рассеивание подчиняется нормальному закону.

При большом числе измерений вероятность появления случайных погрешностей, как сказано выше, в большинстве случаев подчиняется нормальному закону, симметричному относительно точки, соответствующей максимальной плотности вероятности y=f (). Эта точка соответствует истинному (среднему) значению измеряемой величины xист (при наличии систематических погрешностей xист может быть не равно измеряемой величине).

Если перенести ось ординат в точку математического ожидания, то это будет кривая распределения величины = x - xист , т.е. кривая распределения случайных погрешностей (s3>s2>s1) (см. рис. 3а).

 

 

Рис. 3а. Кривые нормального закона распределения случайных погрешностей

 

 

Возникновение нормального закона распределения случайных погрешностей иллюстрирует виртуальный прибор Running Histogram 3.vi. На левой диаграмме прибора "X-Xu = Error (White Noise)" отображается случайная погрешность измерения , представляющая собой белый шум. Правый экран прибора "Running Histogram" представляет собой "бегущую" гистограмму, представляющую распределение количества случайных погрешностей результатов измерений в зависимости от их размера. Размер случайной погрешности (в s, т.е. единицах СКО) отложен по оси У в масштабе, соответствующем масштабу  диаграммы "X-Xu = Error (Noise)". Количество значений случайной погрешности определенного размера , возникающих в результатах последовательных измерений, тображается по оси Х в процентах от общего числа измерений.

Гистограмма "Running Histogram" автоматически пересчитывается с каждым новым результатом измерений. Общее число измерений отображается на индикаторе "Number of points". Шкала по оси Х автоматически изменяется так, чтобы её длина всегда соответствовала максимальному количеству значений случайной погрешности определенного размера (в процентах от общего числа измерений). При этом гистограмма добавляет каждую новую погрешность к ранее накопленным, т.е. является суммирующей. Кнопка "Reset" служит для обнуления числа измерений и сброса гистограммы в начальное состояние.

Максимальный размер случайной погрешности e* (в единицах СКО),  отложенный на гистограмме по оси У, соответствует значению ±3s. Если погрешность имеет больший по абсолютному значению размер,  то она на гистограмме не отображается. Количество таких погрешностей считается и отображается на индикаторе "Number out of range" в единицах или на индикаторе " % out of range" в процентах от общего числа измерений.

Запустите виртуальный прибор. Ползунком "Delay" установите максимальное время задержки. Нажмите кнопку "Reset" для обнуления гистограммы. Исследуйте, как изменяется масштаб гистограммы по У при отображении первых результатов. Оцените, сколько (и какой процент) значений случайной погрешности измерений превышает размер ±3s по абсолютному значению.

Далее, ползунком "Delay" установите минимальное время задержки, т.е. максимальную частоту измерений. Исследуйте, как изменяется гистограмма с увеличением количества измерений, на какую функцию становится все более похожей её огибающая.

Остановите и закройте виртуальный прибор, вернитесь к теории.

 

Нормальный закон распределения случайных погрешностей имеет вид

               (4)

где у — плотность вероятности для определенного значения;

— значение случайной погрешности;

s — среднее квадратическое отклонение.

 

Широкое распространение нормального закона распределения согласно центральной предельной теореме теории вероятностей объясняется тем, что рассеивание значений измеряемых величин вызывается множеством случайных факторов.

Уравнение (4) описывает симметричную кривую. Анализируя выражение (4), можно сделать следующие выводы. Так как  входит в показатель степени е, то для ее значений, одинаковых по абсолютной величине, но различных по знаку, плотность вероятности у одинакова. Чем меньше , тем больше у, т. е. малым значениям  соответствует большая вероятность их появления в данном ряде измерений, и наоборот.

Кривые распределений (см. рис. 3) с s1; s2; s3 симметричны относительно оси ординат, т. е. появление равных по значению, но противоположных по знаку случайных погрешностей имеет одинаковую выпуклость. В средней части кривые образуют выпуклость, по обе стороны от которой находятся точки перегиба, ниже которых кривые становятся вогнутыми, асимптотически приближаясь к оси абсцисс. Наибольшая вероятность для всех трех кривых соответствует случайной погрешности =0. При возрастании погрешности с любым знаком вероятность ее появления уменьшается.

Промежутки между точками перегиба и осью ординат равны (см. рис. 3б). среднему квадратическому отклонению ±s, характеризующему степень рассеивания значений случайных погрешностей от оси ординат (от х):

 

graph2

Рис. 3б. Промежутки между точками перегиба и осью ординат равны среднему квадратическому отклонению ±s,

 

 Мерой рассеивания служит дисперсия D() = s2().

В теоретическом уравнении (4) значение , равное разности между отдельным результатом измерения и истинным значением измеряемой величины xист неизвестно, так как xист непосредственно определить невозможно. По этой же причине нельзя рассчитать и значение s. Для практического использования уравнения (4) необходимо принять какоето истинное значение измеряемой величины. В литературе для устранения неопределенности значений  и s рекомендуют за наиболее вероятное значение измеряемой величины х принимать такое ее значение А, при котором сумма квадратов абсолютных погрешностей минимальна. Например, проведено п измерений х и получены значения a1; a2; a3;… an.Тогда, предположив, что систематические погрешности исключены, выражения для отдельных абсолютных погрешностей записывают в следующем виде:

 

; ; …;     .                   (5)

    где a i - значение i -того результата измерения

 

            Составив выражение для суммы Δi, и приравняв его к нулю на том основании, что алгебраическая сумма всех случайных погрешностей:

 

                              (6)

 получим выражение для оценки А как наиболее вероятного значения х:

 

            (7)

 

Чем больше число проведенных измерений n, тем справедливее приблизительное равенство (6). Таким образом, наиболее вероятным значением измеряемой величины будет среднее арифметическое ряда ее измерений, зная которое можно определить

  j i = a i                   (8)

    где j  i - случайное отклонение i -того результата измерения от среднего .

При достаточно большом числе измерений среднее арифметическое стремится к истинному значению измеряемой величины, а случайные отклонения j i - к соответственным случайным погрешностям Δi, т.е. при n®¥ :

 ;                             (9)

 

При принятых допущениях для определения точности ряда измерений вычисляют оценку значения средней квадратической погрешности по формуле Бесселя:

 

                   (10)

 

       Таким образом, после проведения серии измерений конкретной физической величины должно быть получено число, определяющее ее значение, и указана степень его достоверности, т. е. должен быть получен результат измерения. Но в данной серии из n измерений среднее арифметическое xср является линейной функцией результатов отдельных измерений a1; a2; a3;… an, и, если произвести новую серию из п измерений, то вследствие влияния отдельных факторов значения ai будут отличаться от полученных в первой серии, а следовательно, и новое значение xср будет иным.

 

Примечания:

1. Оценки, которые используются вместо истинных результатов показаний, называются точечными и выбор их неоднозначен. Предпочтительны те оценки, которые, во-первых, сходятся к оцениваемому значению (при n®¥) — состоятельные оценки, во-вторых, у которых математическое ожидание равно оцениваемому значению — несмещенные оценки, в-третьих, у которых выборочное распределение имеет наименьшую дисперсию—эффективные оценки.

2. Наряду с точечными широко применяются интервальные оценки числовых характеристик случайных величин, выражающиеся границами интервала, внутри которого с определенной вероятностью заключено истинное значение результата измерений.

 

Вероятность того, что результаты измерения не выйдут за границы какого-либо интервала погрешностей, определяется по площади, ограниченной кривой распределения и границами этого интервала, отложенным по оси абсцисс. Такой интервал (рис. 4) называют доверительным, а соответствующую ему вероятность появления   случайной погрешности  (заштрихованная площадь) P(t)—доверительной вероятностью. Нижнюю и верхнюю границы доверительного интервала называют доверительными границами.

 

 

Рис. 4. Доверительный интервал и доверительная вероятность.

 

Доверительный интервал, характеризующий степень воспроизводимости результатов измерения, может иметь различные значения, причем при большом доверительном интервале получается и большая доверительная вероятность. При измерении можно задаваться либо доверительным интервалом и по нему определять доверительную вероятность, либо, наоборот, по доверительной вероятности подсчитывать доверительный интервал. Таким образом, для характеристики случайной погрешности необходимо иметь две характеризующие ее величины — доверительный интервал и доверительную вероятность. При определении доверительных интервалов стремление застраховаться от возможной ошибки приводит к выбору весьма больших доверительных вероятностей порядка 0,99 и более. Однако это имеет и отрицательные стороны, так как чем больше доверительная вероятность, тем шире границы доверительного интервала. Опыт показывает, что доверительная вероятность, равная 0,95 и даже 0,90, вполне достаточна для практических целей.

Доверительный интервал e (предельная случайная погрешность, характеризующая доверительный интервал e*=e) обычно выражают через относительную величину t в долях среднего квадратического отклонения, т. е.

                                               (11)

 

Доверительную вероятность P(t) для различных значений t определяют по значениям интеграла вероятностей (интеграла Лапласа) Ф(t), и наоборот, при заданной P(t) определяют значение t.


Предельную погрешность (возможную или допускаемую) e*=e устанавливают по вероятности ее появления. Если принять e*=2s, т. е. t=2, то вероятность появления случайных погрешностей, не превышающих e*, будет Ф(t)=0,9545; при e*=3s, т. е. t=3, вероятность появления случайных погрешностей, не превышающих e*, будет Ф(t)= 0,9973. Задаваясь определенной доверительной вероятностью Ф(t), значение предельной погрешности можно определить по формуле

 

e*=s t                                       (12).

 

Можно показать, что для практических целей приведенные выше определения допустимы при n³20. При небольшом числе измерений п вычисленное значение среднего квадратического отклонения s существенно отличается от его действительного значения, и, следовательно, в этом случае нормальный закон для определения доверительной вероятности применять нельзя.

 

В начало главы

оглавление

практическая часть