Определяне на фона в последователности от данни

4. Определяне на фона в последователности от данни

      Следващата операция при първичната обработка на данните е определянето на фона. Да си спомним, че фон (подложка, англ. background) се нарича тази компонента на данните, която се дължи на процеси, които са, разбира се, също физични, но те са странични за предприетото изследване и не ни интересуват в момента. Това са основно процеси на взаимодействие на разсеяни лъчения, електрически и други шумове и пр. Фонът се счита за безполезна (и всъщност вредна) компонента, тъй като неговите статистически флуктуации се наслагват с тези на полезния сигнал и затрудняват определянето на интересуващата ни физична информация. Възможно е дори (при силен фон и съответно слаб сигнал) полезният сигнал да се "скрие" в шума.

Поради тези причини фонът трябва да се определи колкото е възможно по-добре и да се отдели от полезната компонента на данните.

Като правило фонът се мени плавно от канал в канал (във всеки случай по-плавно от изучавания сигнал).          От теоретична гледна точка най-добре е фонът да бъде определен в отделно измерване, което се състои в натрупването на данните при същите условия (апаратура, геометрия на експеримента и др.), но в отсъствие на източника на полезния сигнал. Тогава “чистият” сигнал се получава просто чрез поточково изваждане на фоновия спектър от спектъра на основното измерване.

      Това въобще е единственият възможен начин да се определи фона в случай, че полезният сигнал има скорост на изменение от канал към канал, сравнима с тази на фона. Такъв подход обаче не винаги е възможен, понеже  част от фона може да е породена от вторични процеси в детектора, които се дължат на самия източник на сигнала, който се изучава. В такъв случай трябва да се използуват методи за оценка на фона непосредствено от измервания спектър. В общия случай не е възможно да се изхожда от някакъв аналитичен израз за разпределението на фона, който да е съгласуван с физическото му формиране поради извънредно сложния характер на процесите, водещи до възникването на фон (за да си дадем представа за тяхната сложност, достатъчно е да помислим, че това са обикновено вторични или многократни взаимодействия). При това положение информацията, на която може да се разчита, че е известна, е:

·      че скоростта на изменение на фона е по-малка от тази на полезния сигнал, и

·      че фонът е по-малък от сумарния сигнал (ние ще говорим за емисионни спектри, при които е именно така; при абсорбционните спектри, напротив, фонът мажорира полезния сигнал). С други думи, считаме, че фонът представлява обвивка отдолу на полезната компонента на сигнала.

 

На тези свойства се основава и алгоритъмът, който ще разгледаме тук.

Този алгоритъм се основава на идея, подобна на тази на метода за изглаждане на данните на Злоказов. Подобно на мярката за осцилацията на една функция се въвежда мярка за нейната изменчивост, която е най-естествено да бъде свързана с първата й производна:

                                                                                             (1)

Интегралната (квадратична) мярка за изменчивост на функцията в краен интервал е:

                                                                         (2)

И тъй, ние искаме да построим апроксимация на фона - гладка обвивка на наблюденията  отдолу, като решение на една вариационна задача: да се намери фонът  от минимума на функционала:

                                                      (3)

при граничните условия:

                                                                                    (4)

Тук се въвежда специална тегловна функция , която има за задача да осигури близост на фона  към данните  за малките стойности на данните и да отслабва това ограничение за големите стойности на . Смисълът на тази тегловна функция е ясен - при голям сигнал фонът е далеч отдолу и не е необходимо да се поставя (силно) ограничение за близост на сигнала към фона, а при малък сигнал фонът очевидно трябва да е близо под него, тъй като тогава целият сигнал се състои почти само от фон.

Подходящ избор на тегловната функция е:

.                                                                                                (5)

Малкото число  в (5) служи за ограничаване на теглото до крайни стойности при нулев сигнал.

Дискретизираният вариант на функционала  има вида:

.                                                                 (6)

Тук конкретният вид на  не е написан, важно е само  да не зависи от фона .

За да намерим минимума на  спрямо , които тук са неизвестните величини, подлежащи на определяне, трябва отново да намерим първите частни производни на  спрямо тези параметри и да ги приравним на нула.

Ето как изглеждат те:

                                     (7)

...

В краищата производните се определят като се имат предвид и граничните условия (4) (които водят всъщност до анулиране на първите членове в следващите изрази):

                                                       (8)

Системата линейни уравнения за  в този случай изглежда така:

                (9)

Матрицата на тази система е също реална, симетрична, положително дефинитна и лентова, както и онази при метода за изглаждане. Но тя има сега само един ненулев кодиагонал, което опростява още повече решаването на уравненията.

Конкретният вид на тегловната функция  и стойността на параметъра на изглаждане  се избират обикновено въз основа на тестове.