Wskaźniki szczelności korelacji dla modelu korelacji wieloczynnikowej z regresem




Bliskość związku między badanymi parametrami w przypadku korelacji wielokrotnej wyznacza się na podstawie różnych współczynników. Aby równanie regresji odpowiednio odzwierciedlało (przybliżone) rzeczywiste symulowane procesy społeczno-gospodarcze lub zjawiska, muszą być spełnione warunki i wymagania wielokrotnej korelacji i analizy regresji.

Korelacja - analiza regresji : analityczna ekspresja regresji (prostoliniowej, krzywoliniowej) dla wieloczynnikowego modelu korelacyjno-regresyjnego. Określenie parametrów i ich interpretacja.

Bliskość relacji między nimi mierzy się stosunkiem wariancji czynnikowej do całkowitej wariancji wynikowego atrybutu, zwanego indeksem determinacji. Wskaźnik determinacji charakteryzuje proporcję zmienności uzyskanej cechy pod wpływem cechy czynnikowej w całkowitej zmienności uzyskanej cechy. Jeśli istnieje korelacja między znakami, to wraz ze wzrostem, tj. zwiększając bliskość związku między znakami produkcyjnymi i czynnikami, wskaźnik determinacji wzrasta i maleje wraz ze słabnięciem. Zatem wskaźnik determinacji charakteryzuje bliskość połączenia, bliskość korelacji z funkcjonalnością.

Pierwiastek kwadratowy wskaźnika determinacji jest indeksem korelacji lub teoretycznym współczynnikiem korelacji . Indeks korelacji lub teoretyczny współczynnik korelacji charakteryzuje bliskość połączenia z jakąkolwiek formą zależności. Dyspersja szczątkowa Konieczne jest wybranie najlepszej funkcji, która najbardziej wyrównuje (przybliża) linię regresji empirycznej. Funkcja aproksymująca jest wybierana zgodnie z minimalną dyspersją resztową s 2 OST = S (y t - ) 2 / n lub .

Szczególnym przypadkiem indeksu korelacji jest liniowy współczynnik korelacji r , który służy do oszacowania bliskości relacji z relacją liniową. Współczynnik korelacji przyjmuje wartości od -1 do +1, wskazując nie tylko bliskość, ale także kierunek związku. Znak "+" wskazuje na bezpośredni związek między znakiem skutecznym a współczynnikiem, znak "-" wskazuje na odwrotną zależność między nimi. Jeśli r = 0, wówczas nie ma połączenia między znakami. Im bliżej r jest jeden, tym bliższy jest związek między rozpatrywanymi cechami.

W liniowej formie komunikacji parametrem równania linii prostej jest współczynnik regresji a 1, a współczynnik korelacji r są wzajemnie połączone w następujący sposób:

i 1 = rs r / s x . W przypadku połączenia liniowego współczynnik korelacji liniowej jest identyczny z indeksem korelacji, są one liczbowo równe: .

Współczynnik korelacji liniowej r jest używany do oszacowania bliskości relacji z linią liniową: równanie linii prostej = a 0 + a 1 x


border=0


Aby uprościć obliczenia liniowego współczynnika korelacji, użyj przekształconej formuły: .

Charakter zależności zależy od wartości współczynnika korelacji :

r Współczynnik korelacji charakter komunikacji
r = 0 do 0.3 praktycznie nieobecny
0 <r <1 0,3 - 0,5 + prosto słaby
-1 <r <0 0,5 - 0,7 - wstecz umiarkowany
r = 1 0,7 - 1,0 1 - funkcjonalny silny

Znaczenie liniowego współczynnika korelacji określa kryterium t - Studenta. Określone przez obliczoną wartość t calc , która jest porównywana z wartością tabeli t crit . Współczynnik korelacji liniowej jest uważany za znaczący, jeśli stosunek: t calc > t crit .

za pomocą n przy n <50.

t crit określa tabela "Wartość kryterium t - studenta na poziomie istotności 0,10, 0,05, 0,01 i stopnie swobody .

Zadaniem korelacji wieloczynnikowej - analizy regresji jest, po pierwsze, zbadanie szeregu czynników wpływających na badany wskaźnik i wybór tych najbardziej znaczących; po drugie, przy określaniu stopnia wpływu każdego czynnika na wynikowy atrybut przez zbudowanie modelu - równania regresji wielokrotnej, które pozwala określić, w którym kierunku i w jakiej wysokości efektywny wskaźnik zmieni się po zmianie każdego czynnika wchodzącego do modelu; po trzecie, w ilościowej ocenie bliskości związku między znakiem skutecznym a silnikiem.

Matematycznie problemem jest znalezienie analitycznej ekspresji funkcji = f (x 1 , x 2 , x 3 , ..., x n ), najlepiej odzwierciedlające zależność znaków czynnikowych od wypadkowej. Wyniki analizy teoretycznej i możliwość ich zastosowania w praktyce zależą od prawidłowego wyboru funkcji regresji, dlatego też forma połączenia powinna najlepiej odpowiadać faktycznie istniejącym powiązaniom między wypadkową a właściwościami czynnikowymi. Trudność w wyborze funkcji polega na tym, że efektywną cechą z różnymi czynnikami mogą być różne formy połączenia - prosta i krzywoliniowa. Empiryczne uzasadnienie typu funkcji za pomocą wykresów relacji parami praktycznie nie nadaje się do wielokrotnej korelacji i regresji.



Wybór formy równania regresji wielokrotnej opiera się na teoretycznej analizie badanego zjawiska. Jeśli analiza zależności między znakiem skutecznym a faktycznym nie pozwala na rozpisanie się na jakiejkolwiek formie połączenia, wówczas różne funkcje są uporządkowane, a optymalna wybrana do wyrównywania z punktu widzenia bliskości wartości empirycznych charakterystyki efektywnej, ale wymaga to dużej pracochłonności w obliczaniu parametrów różnych równań. Jeśli istnieje specjalne oprogramowanie implementujące algorytm do iteracji nad różnymi równaniami PCR, otrzymuje się kilka modeli, najlepsze wybiera się przez statystyczną kontrolę parametrów równania w oparciu o kryterium t-Studenta i kryterium F Fishera .

Wybór formy równania regresji wielokrotnej jest realizowany w praktyce

w oparciu o wykorzystanie pięciu typów modeli :

liniowy a 0 + a 1 x 1 + a 2 x 2 + ... + a n x n ;

moc ;

orientacyjny ;

paraboliczny

hiperboliczny

Najczęściej zatrzymują się na modelach liniowych. Wyjaśnia to fakt, że po pierwsze, parametry równań liniowych są łatwo interpretowane, same modele są proste i wygodne do analizy ekonomicznej, a po drugie, w razie potrzeby, dowolna funkcja może zostać zredukowana do postaci liniowej za pomocą logarytmu lub zmiany zmiennych.

W równaniu regresji liniowej w postaci liniowej parametry 1 , 2 , 3 , ... oraz współczynniki regresji pokazują stopień wpływu odpowiednich czynników na wynikowy atrybut, gdy inne czynniki są ustalone na średnim poziomie, tj. ile y zmieni się wraz ze wzrostem odpowiedniego czynnika o 1 punkt jego jednostki zmiany; parametr a 0 jest wolnym członkiem, nie ma sensu ekonomicznego.

Parametry równania regresji wielokrotnej , a także pary, są obliczane metodą najmniejszych kwadratów w oparciu o rozwiązanie układu równań normalnych. Ponieważ współczynniki regresji są nieporównywalne ze sobą (czynniki mają różne jednostki miary), niemożliwe jest porównanie siły wpływu każdego z czynników zawartych w modelu na wynikowy wskaźnik oparty na współczynnikach regresji. Aby ocenić względną siłę wpływu czynników, oblicza się współczynniki częściowej sprężystości i współczynniki b.

Prywatny współczynnik elastyczności pokazuje, ile średnio średnio efektywny wskaźnik zmieni się, gdy współczynnik zmieni się o 1% i ustalona pozycja innych czynników i są obliczane osobno dla każdego czynnika:

gdzie a jest współczynnikiem regresji dla i-tego czynnika; - średnia wartość i-tego współczynnika; - średnia wartość efektywnego wskaźnika.

Współczynnik b pokazuje, która część odchylenia standardowego zmienia wynikowy atrybut, gdy odpowiadający mu czynnik zmienia się o wartość jego odchylenia standardowego , gdzie s xi , s y - standardowe odchylenia i-tego współczynnika i wynikowa cecha.

Ze względu na to , że zjawiska ekonomiczne są narażone na wiele złożonych przyczyn, w równaniu regresji wielorakiej należy uwzględnić zasadnicze, systematycznie działające czynniki, gdy wyeliminowany zostanie wpływ innych czynników. Najważniejsze czynniki wybierane są na podstawie analizy bliskości i istotności związku między czynnikami a wskaźnikiem skuteczności. W tym przypadku warunkiem włączenia czynników do modelu jest brak bardzo ścisłego powiązania korelacji między nimi, który jest zbliżony do funkcjonalnego. Obecność bardzo bliskiej liniowej zależności pomiędzy dwoma czynnikami (współczynnik korelacji liniowej r przekracza wartość bezwzględną 0,85) nazywa się kolinearnością , a pomiędzy kilkoma czynnikami nazywana jest wieloklinowość .

Przyczynami wielokolinowości znaków są, po pierwsze, że analizowane znaki charakteryzują ten sam aspekt zjawiska lub procesu (na przykład kapitał własny i liczba pracowników charakteryzują wielkość przedsiębiorstwa) i nie jest wskazane uwzględnianie ich w modelu w tym samym czasie; po drugie, znaki czynnikowe są składowymi elementami wzajemnie ze sobą związanymi, powielają się nawzajem lub ich całkowita wartość daje stałą wartość (na przykład wskaźnik zaopatrzenia w energię i kapitału oraz pracy, udział pożyczonych środków i funduszy własnych). Jeżeli w modelu uwzględnione są czynniki wieloliniowe, to równanie regresji nie będzie właściwie odzwierciedlać rzeczywistych relacji ekonomicznych, parametry modelu zostaną zniekształcone (przeszacowane), znaczenie ulegnie zmianie, a ekonomiczna interpretacja współczynników regresji i korelacji będzie trudna.

Dlatego przy budowaniu modelu jeden z czynników współliniowych jest wykluczany na podstawie analizy jakościowej i logicznej, lub początkowe znaki czynników są przekształcane w nowe, powiększane. Jakość i adekwatność modelu do rzeczywistego zjawiska i procesu społeczno-ekonomicznego zależy od optymalności liczby znaków czynnikowych: im więcej czynników uwzględniamy, tym lepiej model opisuje zjawisko i proces, ale taki model jest trudny do wdrożenia; przy niewielkiej liczbie czynników model ten nie jest wystarczająco adekwatny.

Problem wyboru znaków czynnikowych i redukcji wymiaru modelu wielorakiej korelacji rozwiązuje się na podstawie heurystycznych i wielowymiarowych metod analizy. Hierarchiczne metody analizy obejmują metodę oceny eksperckiej, opartą na intuicyjno-logicznych przesłankach oraz merytoryczną i jakościową analizę nieparametrycznych wskaźników szczelności komunikacji: współczynniki korelacji rang, zgodność. Najczęściej stosowaną metodą jest regresja krok po kroku , polegająca na sekwencyjnym włączaniu czynników do modelu i ocenie ich znaczenia.

Po wprowadzeniu współczynnika określa się, jak suma sum kwadratów reszt zmniejsza się, a wartość współczynnika korelacji wielokrotnej R wzrasta .Jeśli współczynnik xk jest uwzględniony w modelu, wartość R wzrasta, a współczynnik regresji ak nie zmienia się lub nieznacznie się zmienia, wtedy współczynnik ten jest znaczący i jego włączenie do modelu konieczne.

· Całość badanych wskaźników powinna być jednorodna zgodnie z warunkami tworzenia znaków skutecznych i czynników (rozróżnione obserwacje powinny być wyłączone z całości);

· Wynikowy atrybut powinien być zgodny z prawem rozkładu normalnego, silnia powinna być zbliżona do rozkładu normalnego. Jeśli objętość agregatu jest wystarczająco duża (n> 50), to normalność dystrybucji może być potwierdzona na podstawie obliczeń i analiz Pearsona, Yastremskiego, Kołmogorowa, Boyarskiego i innych kryteriów;

· Symulowane zjawisko lub proces jest opisany ilościowo (parametry muszą mieć wyrażenie liczbowe) za pomocą jednego lub kilku równań związków przyczynowo-skutkowych. Wskazane jest opisanie związków przyczynowych za pomocą zależności liniowych lub zbliżonych do liniowych;

· Spójność struktury terytorialnej i czasowej badanej populacji, brak ograniczeń ilościowych dotyczących parametrów modelu;

· Wystarczająca liczba jednostek ludności: ich liczba powinna być kilkukrotnie większa niż liczba czynników uwzględnionych w modelu. Każdy czynnik powinien mieć co najmniej 5-6 obserwacji, tj. liczba objawów czynnikowych powinna być 5-6 razy mniejsza niż objętość badanej populacji.

Główne etapy analizy korelacji i regresji to:

· Wstępna analiza teoretyczna istoty zjawiska, pozwalająca ustalić zależności przyczynowo-skutkowe między znakami, wybrać najważniejsze czynniki, zdecydować o pomiarze znaków efektywnych i czynnikowych;

· Przygotowanie wstępnych informacji , w tym pytań o adekwatność jednostek obserwacyjnych, jednorodność całości badanych cech i bliskość ich rozkładu do normy;

· Wybór formy relacji między cechą wydajności a czynnikami opartymi na wyliczeniu kilku funkcji analitycznych;

· Badanie bliskości związku między wskaźnikiem a czynnikami, a także między czynnikami opartymi na konstrukcji macierzy sparowanych współczynników korelacji liniowej i badaniami czynników wieloklinowych;

· Wybór znaczących (znaczących) czynników zawartych w modelu wieloczynnikowym - równanie regresji wielorakiej, w oparciu o odpowiednie metody statystyczne;

· Obliczanie parametrów równania regresji wielokrotnej i ocena istotności wybranych czynników, współczynników korelacji i regresji z zastosowaniem kryteriów t- Studenta i F- Fishera ;

· Analiza wyników.

Relacje między znakami są z reguły analizowane na podstawie obserwacji próbek, a zatem w celu sprawdzenia, czy uzyskiwane zależności są raczej regularne niż losowe, szacuje się istotność (istotność) wskaźników korelacji i regresji.

Korelacja - analiza regresji służy do oceny wskaźników biznesplanu i poziomów regulacji wskaźników ekonomicznych, odzwierciedlających efektywność wykorzystania zasobów produkcyjnych, identyfikację istniejących rezerw produkcyjnych, przeprowadzenie analizy porównawczej, ocenę potencjalnych możliwości przedsiębiorstw, krótkoterminowe prognozowanie rozwoju produkcji.

Równanie regresji wielokrotnej pozwala znaleźć teoretyczną, możliwą wartość efektywnego wskaźnika dla pewnych wartości znaków czynników.

Parametry równania regresji wielokrotnej oblicza się metodą najmniejszych kwadratów na podstawie rozwiązania układu równań normalnych. Dla równania regresji liniowej z n współczynnikami, układ zbudowany jest z (n + 1) normalnych równań:

a 0 n + a 1 Sx 1 + a 2 Sx 2 + ... + a n Sx n = Sy,

a 0 Sx 1 + a 1 Sx 2 1 + a 2 Sx 1 x 2 + ... + a n Sx 1 x n = Syx 1 ,

:

a 0 Sx n + a 1 Sx 1 x n + a 2 Sx 2 x n + ... + a n Sx 2 n = Syx n .

Bliskość związku między badanymi parametrami w przypadku korelacji wielokrotnej wyznacza się na podstawie różnych współczynników.

Współczynniki korelacji parami r mierzą bliskość zależności liniowej między czynnikami oraz między wypadkową oceną a każdym z rozpatrywanych czynników, nie biorąc pod uwagę ich interakcji z innymi czynnikami.

Częściowe współczynniki korelacji charakteryzują stopień wpływu czynników na wynikowy znak, pod warunkiem, że pozostałe czynniki są ustalone na stałym poziomie. W zależności od liczby czynników, których wpływ jest wykluczony, współczynniki częściowej korelacji mogą być rzędu pierwszego (jeśli wpływ jednego czynnika jest wykluczony), drugiego rzędu (jeśli dwa czynniki są wykluczone), itp.

Współczynnik częściowej korelacji pierwszego rzędu między yi x 1 z wyłączeniem wpływu x 2 w modelu dwuskładnikowym oblicza się za pomocą następującego wzoru: ,

gdzie r yx 1 , r yx 2 , r x1x2 - sparowane współczynniki korelacji między odpowiadającymi charakterystykami.

Skumulowany współczynnik korelacji wielokrotnej, R, szacuje bliskość związku między wynikowym atrybutem a wszystkimi czynnikami. Jest to główny wskaźnik liniowej korelacji wielokrotnej. W przypadku modelu dwuskładnikowego skumulowany współczynnik korelacji wielokrotnej oblicza się za pomocą następującego wzoru:

. Skumulowany współczynnik korelacji R waha się od 0 do 1. Im mniejsze empiryczne wartości wynikowej cechy różnią się od wartości wyrównanych wzdłuż linii regresji wielokrotnej, tym bliższy jest związek korelacji między badanymi parametrami a skumulowanym wielokrotnym współczynnikiem korelacji do jedności.

Skumulowany współczynnik wielokrotnego oznaczania , równy R2 , pokazuje, jak duża część zmienności uzyskanej cechy jest spowodowana wpływem czynników uwzględnionych w modelu.

Skumulowany wskaźnik wielu korelacji charakteryzuje bliskość związku między wypadkową cechą a wszystkimi czynnikami o krzywoliniowym związku:

= gdzie - rozproszenie uzyskanej cechy pod wpływem czynników zawartych w modelu; - resztkowe rozproszenie powstałej cechy, spowodowane wpływem czynników nieuwzględnionych w modelu. W liniowej formie komunikacji współczynnik skumulowany i wskaźnik korelacji wielokrotnej są sobie równe.

Znaczenie współczynnika korelacji wielokrotnej R określa kryterium F - Fishera. Określa obliczona wartość F calc , która jest porównywana z wartością tabeli F crit . Współczynnik korelacji wielokrotnej jest uważany za znaczący, zależny od zależności: F calc > F crit .

lub ,

n to liczba obserwacji, m to liczba parametrów równania.

F крит выбирается по таблице «Значение при заданном F – критерию Фишера при уровне значимости », i .

Оценка существенности включения фактора в модель осуществляется по частному F – критерию Фишера. Фактор считается значимым при соблюдении соотношения: F расч > F крит .

Д л я фактора х 1 : ;

Для фактора х 2 : .





; Data dodania: 2014-01-25 ; просмотров: 37969 ; Czy opublikowany materiał narusza prawa autorskie? | | Ochrona danych osobowych ZAMÓW pracę


Nie znalazłeś tego, czego szukałeś? Użyj wyszukiwania:

Najlepsze powiedzonka: zostaniesz uwiedziony przez dziewczynę, ogony będą rosły, będziesz zaangażowany w naukę, rogi wyrosną 8686 - | 6842 - lub przeczytaj wszystkie ...

Zobacz także:

border=0
2019 @ edudoc.icu

Generowanie stron przez: 0,009 sek.