Ковариация и корелация - studopediya

Ковариация изразява степента на статистически зависимости между два набора от данни и се определя от следното уравнение (3.1):

където X. Y - множество случайни променливи на измерение m; М (X) - математическата очакването на случайна променлива X; М (Y) - математическата очакването на случайна променлива Y.







Както следва от формулата, положителната съизмененията наблюдава в случаите, когато по-големи стойности на случайна променлива х съответстват на големи стойности на случайната променлива Y. т.е. между тях има силна пряка връзка. Съответно отрицателен ковариация ще настъпи при ниски стойности в зависимост от случайна променлива X е по-големи стойности на случайна променлива Y. В леко в зависимост индекс ковариация стойност е близка до 0 ° С.

Ковариация на мерни единици зависи от променливи проучени, което ограничава неговото прилагане на практика. По удобен начин за използване в анализа е получен от неговия индекс - Р. корелационен коефициент, изчислен съгласно формула (3-2):

Корелационният коефициент има същите свойства като ковариация, но е безразмерна и има стойност 1 (показва линейна обратна връзка) към едно (линейна характеристика директна връзка). За независим случайни величини корелация стойност коефициент близък до 0.

Определяне на количествени характеристики за оценка на близостта на връзката между произволни стойности в ДКТ EXCEL може да се направи по два начина:

- със специални инструменти статистически анализ.

Ако броят на променливите учи повече от 2, това е по-удобно да използвате инструментите за анализ.

Данните инструмент за анализ "корелация"

Ние дефинираме степента на стягане взаимовръзки между променливите V, Q, P, NCF и NPV. В същото време, тъй като мярката ще използваме индекса на корелация R.

1. Изберете "анализ на данни". Изберете от списъка с "OK" бутона "Инструменти за анализ" изберете "корелация" и кликнете (Фигура 3.1). Резултатът ще бъде появата на диалогов прозорец инструмент "корелация".

2. Напълнете в диалогов прозорец, както е показано на Фигура 3.2.

Тип EBS получени след извършване на елементарни операции форматирането показани на Фигура 3.3.

Фигура 3.1. Списък на инструменти за анализ (изберете "корелация")

Фигура 3.2. Попълване диалоговия инструмент "корелация"

Фиг. 3.3. Резултатите от анализа на съответствието

резултатите от анализа на корелация са представени под формата на EBS в квадратна матрица, само наполовина пълна, тъй като коефициентът на корелация между две случайни величини не са независими от порядъка на обработка. Лесно е да се отбележи, че тази матрица е симетрична около основните диагоналните елементи са равни на 1, тъй като всяка променлива корелира със себе си.

Както следва от резултатите от анализа на съответствието, изтъкнати в процеса на решаване на предишния пример хипотезата за независимост на разпределенията на ключови променливи V, Q, P-общо потвърдена. Стойностите на коефициентите на корелация между променливите разходи V, сумата от цената Р и Q (клетки B3: В4, -С4) е достатъчно близо до 0 ° С.

От своя индикатор NPV стойност зависи от стойността на потока плащания (R = 1). Освен това, има средна степен на корелация между Q и NPV (R = 0548), Р и NPV (R = 0,67). Както се очакваше, между стойностите на V и има умерен NPV обратна корелация (R = -0,39).

Полезността на последващ статистически анализ на резултатите от симулацията експеримент е и във факта, че в много случаи тя разкрива неточността в първоначалните данни, или дори грешки при формулиране на проблема. По-специално, в този пример, липсата на връзка между променливите разходи и обем V на продукт Q изисква допълнително обяснение, тъй като увеличаването на последната, степента на V трябва да се увеличи. Така очакваният диапазон от променливите разходи V промени трябва да бъдат тествани и евентуално коригира.

Трябва да се отбележи, че в близост до нула стойност на коефициент на корелация R на не показват линейна зависимост между изследваните променливи, но не изключва възможността за нелинейна зависимост. В допълнение, има голяма корелация не означава непременно винаги означава причинно-следствена връзка, тъй като двете изследвани променливи могат да зависят от трета стойност.

При извършване на симулация експеримент и последващо вероятностен анализ на получените резултати, ние изхождаха от предположението за нормално разпределение на показателите на източника и изходни. Въпреки това валидността на предположенията, направени, поне за параметър ННС на изход, трябва да бъдат проверени.

За да тествате хипотезата на нормално разпределени случайни величини конкретни статистически изследвания, използвани: Колмогоров-Смирнов, с 2. Като цяло RFP EXCEL ви позволява бързо и ефективно да извършва изчисляване на необходимите критерии и извършване на статистическа оценка на хипотези.







Данните инструмент за анализ "Описателни статистики"

Колкото повече случайни променливи характеристики, тъй като ние знаем, толкова по-добре може да се съди, описани обработва. Tool "дескриптивна статистика" автоматично изчислява най-широко използвани в практически анализ на характеристиките на разпределения. Стойностите могат да бъдат определени за множество променливи проучени.

Определяне на параметрите на описателни статистики за променливите V, Q, P, НФК, ННС. За да направите това, изпълнете следните стъпки.

1. "Анализ на данни". Изберете от списъка на "Инструменти за анализ", изберете "дескриптивна статистика".

2. Попълнете в диалоговия прозорец, както е показано на фигура 3.4, а след това щракнете върху бутона "ОК".

В резултат на тези действия ще бъде формирането на отделен лист, съдържащ изчислените характеристики описателни статистики за изследваните променливи. Изпълнение на операция форматиране, е възможно да се предизвика получената ЕТ-интуитивно форма (Фигура 3.5).

Много от характеристиките, изброени в ЕТ вече сте запознати, и техните стойности вече са определени с помощта на съответните функции в листа "Резултати от анализа." Ето защо, ние разглеждаме само тези, които не са споменати по-горе.

Вторият ред съдържа стойности ЕТ стандартна грешка е за средните стойности на разпределението. С други думи, стойност или очакваната стойност на случайната променлива М (Е) се определят с точност от ± д.

Фиг. 3.4. Запълване на диалогови полета "Описателни статистики"

Фигура 3.5. Описателни статистики за учебни променливи

Средното - стойността на случайната променлива който разделя зоната, ограничена от половина на разпределителната крива (т.е. средния ред или цифров интервал). Както очакването, медианата е една от характеристиките на случайна променлива разпределителен център. В симетрични разпределения на медианната стойност е равна на или е достатъчно близо до очакването.

Както следва от резултатите, това условие се отнася и за оригиналните променливи V, Q, P (средни стойности са в границите от М (Е) ± д т.е. -. Приравняване на средното). Все пак за отбелязване на променливи НФК, ННС стойности са по-ниски от средната стойност на средните линии, които предполагат едностранно асиметрия на техните разпределения.

Мода - най-вероятната стойност на случайната променлива (най-често срещаната стойност в интервала от данни). За симетрични разпределения мода е очакването. Понякога, мода може да отсъства. В този случай, RFP EXCEL върна съобщение за грешка. По този начин, в режим на изчисляване не е възможно.

Ексцес характеризира острота (положителна стойност) или гладкост (отрицателна стойност) на разпределение в сравнение с нормалната крива. Теоретично, ексцеса на нормалното разпределение трябва да бъде равен на 0. На практика обаче за общи популации на големи обеми от ниски стойности могат да бъдат пренебрегнати.

В този пример, за една и съща положителна ексцеса наблюдава в разпределенията на променливите Q, НФК, ННС. Така графики на тези разпределения ще бъде почти заострени, в сравнение с нормалната крива. Съответно графични разпределения на променливите на V и Р са малко по-плоска в сравнение с нормалното.

Asymmetry (коефициент на асиметрия или фаска - и) характеризира обем на разпределение около средната стойност. Ако положителна стойност на разпределението на коефициента изкривена надясно, т.е. по-дългата си част се намира в дясно от центъра (очакване), както и обратното. За нормален коефициент разпределение асиметрия е 0. На практика, това може да бъде пренебрегната малки стойности.

По-специално, асиметрични разпределения на променливите V, Q, P в този случай може да се смятат за незначителни, обаче, е невъзможно да се каже за разпределението на стойностите NPV.

Ние правим оценка на значимостта на коефициента на асиметрия на разпределението на нетната настояща стойност. Най-лесният начин за получаване на такава оценка е да се определи стандарт (средна квадратична) грешка на асиметрия, която се изчислява по формулата (3-3):

където п - брой на стойности на случайна променлива (в този случай 500).

Ако съотношението на коефициента на асиметрия и на стойността на грешката и като най-малко три (т.е., S / и като <3), то асимметрия считается несущественной, а ее наличие объясняется воздействием случайных факторов. В противном случае асимметрия статистически значима и факт ее наличия требует дополнительной интерпретации. Осуществим оценку значимости коэффициента асимметрии для рассматриваемого примера.

Въведете в нито една клетка ЕТ формула:

= 0,763 / SQRT (6 * 499/501 * 503) (резултат: 7.06).

Тъй като съотношението на S / и като> 3, асиметрията трябва да се счита за значително. По този начин нашите оригинални поемане на десния асиметрията на разпределението на NPV потвърдена.

За този пример присъствието на дясната асиметрия може да се разглежда като нещо положително, защото това означава, че голяма част от разпределението е по-висок от очаквания, т.е. големи стойности ННС са по-вероятни.

По подобен начин може да се извършва от д ексцес формула значение стойност за изчисляване на стандартната грешка на разликата е от формата (3.4) .:

където п - броят на стойностите на случайна променлива.

Ако съотношението е / и ех <3, эксцесс считается незначительным и его величиной можно пренебречь.

"Интервал" на стойност се дефинира като разликата между максималната и минималната стойност на случайната променлива (цифровата поредица). "Профил" и "количество" параметри са редица стойности в даден диапазон и количество, съответно.

Последната характеристика "ниво надеждност" показва степента на доверителния интервал за средната стойност в съответствие с предварително зададено ниво на надеждност или ниво подразбиране надеждност doveriya.Po приема, че е 95%.

За този пример, това означава, че с вероятност от 0.95 (95%) NPV очаквана стойност попада в обхвата на 3412,14 ± 224.88.

Можете да зададете различно ниво на сигурност, например - 98%, като въведете съответните стойности в диалоговия прозорец "ниво надеждност" "дескриптивна статистика". Трябва да се отбележи, че по-високото ниво на получавания на надеждност, толкова по-голям ще бъде стойността на доверителния интервал за средната стойност.

В заключение, ние отбелязваме, че симулацията позволява, като се отчита възможно най-голям брой фактори на околната среда в подкрепа на вземането на управленски решения и е най-мощният инструмент за анализ на инвестиционни рискове. Необходимостта от употреба на практика се дължи на вътрешния финансов пазар предлага български характеризира субективност, зависимостта от не-икономически фактори и висока степен на несигурност.

Резултатите от симулацията могат да бъдат допълнени с вероятностни и статистически анализ и управление като цяло предоставят най-пълната информация за степента на въздействие на ключови фактори за очакваните резултати и възможни сценарии.