Wat is de variantie-inflatiefactor (VIF)?

De variantie-inflatiefactor (VIF) meet de ernst van multicollineariteit in regressieanalyse. Regressieanalyse. Regressieanalyse is een reeks statistische methoden die worden gebruikt voor het schatten van relaties tussen een afhankelijke variabele en een of meer onafhankelijke variabelen. Het kan worden gebruikt om de sterkte van de relatie tussen variabelen te beoordelen en om de toekomstige relatie daartussen te modelleren. . Het is een statistisch concept dat de toename van de variantie van een regressiecoëfficiënt aangeeft als gevolg van collineariteit.

Variantie-inflatiefactor

Overzicht

  • Variantie-inflatiefactor (VIF) wordt gebruikt om de ernst van multicollineariteit te detecteren in de gewone kleinste-kwadratenregressieanalyse (OLS).
  • Multicollineariteit vergroot de variantie en type II-fout. Het maakt de coëfficiënt van een variabele consistent maar onbetrouwbaar.
  • VIF meet het aantal opgeblazen varianties veroorzaakt door multicollineariteit.

Variantie-inflatiefactor en multicollineariteit

In gewone kleinste kwadraten (OLS) -regressieanalyse bestaat multicollineariteit wanneer twee of meer van de onafhankelijke variabelen Onafhankelijke variabele Een onafhankelijke variabele is een invoer, aanname of drijfveer die wordt gewijzigd om de impact ervan op een afhankelijke variabele (de uitkomst) te beoordelen . demonstreren een lineaire relatie tussen hen. Om bijvoorbeeld de relatie tussen bedrijfsomvang en -inkomsten te analyseren met aandelenkoersen in een regressiemodel, zijn marktkapitalisaties en inkomsten de onafhankelijke variabelen.

De marktkapitalisatie van een bedrijf Marktkapitalisatie Marktkapitalisatie (Market Cap) is de meest recente marktwaarde van de uitstaande aandelen van een bedrijf. De marktkapitalisatie is gelijk aan de huidige aandelenkoers vermenigvuldigd met het aantal uitstaande aandelen. De investerende gemeenschap gebruikt vaak de marktkapitalisatiewaarde om bedrijven te rangschikken en de totale inkomsten zijn sterk gecorreleerd. Naarmate een bedrijf stijgende inkomsten genereert, groeit het ook in omvang. Het leidt tot een multicollineariteitsprobleem in de OLS-regressieanalyse. Als de onafhankelijke variabelen in een regressiemodel een perfect voorspelbare lineaire relatie vertonen, staat dit bekend als perfecte multicollineariteit.

Met multicollineariteit zijn de regressiecoëfficiënten nog steeds consistent, maar niet langer betrouwbaar omdat de standaardfouten worden opgeblazen. Het betekent dat het voorspellende vermogen van het model niet wordt verminderd, maar dat de coëfficiënten mogelijk niet statistisch significant zijn met een Type II-fout Type II-fout Bij het testen van statistische hypothesen is een type II-fout een situatie waarin een hypothesetest de nulhypothese niet verwerpt is fout. In andere .

Daarom, als de coëfficiënten van variabelen niet individueel significant zijn - respectievelijk niet kunnen worden verworpen in de t-toets - maar gezamenlijk de variantie van de afhankelijke variabele kunnen verklaren met afwijzing in de F-toets en een hoge determinatiecoëfficiënt (R2), er kan multicollineariteit bestaan. Het is een van de methoden om multicollineariteit te detecteren.

VIF is een ander veelgebruikt hulpmiddel om te detecteren of er multicollineariteit bestaat in een regressiemodel. Het meet hoeveel de variantie (of standaardfout) van de geschatte regressiecoëfficiënt wordt opgeblazen als gevolg van collineariteit.

Gebruik van variantie-inflatiefactor

VIF kan worden berekend met de onderstaande formule:

Variantie-inflatiefactor - formule

Waarbij R i 2 vertegenwoordigt het ongecorrigeerde determinatiecoëfficiënt regressie voor de i-onafhankelijke variabele op de overblijvende. Het omgekeerde van VIF staat bekend als tolerantie . Ofwel VIF of tolerantie kan worden gebruikt om multicollineariteit te detecteren, afhankelijk van persoonlijke voorkeur.

Als R i 2 gelijk is aan 0, kan de variantie van de resterende onafhankelijke variabelen niet worden voorspeld op basis van de ie onafhankelijke variabele. Daarom, wanneer VIF of tolerantie gelijk is aan 1, is de ie onafhankelijke variabele niet gecorreleerd met de overige, wat betekent dat multicollineariteit niet bestaat in dit regressiemodel. In dit geval wordt de variantie van de ie regressiecoëfficiënt niet opgeblazen.

Over het algemeen geeft een VIF boven 4 of tolerantie onder 0,25 aan dat er mogelijk multicollineariteit bestaat, en verder onderzoek is vereist. Wanneer VIF hoger is dan 10 of de tolerantie lager is dan 0,1, is er een aanzienlijke multicollineariteit die moet worden gecorrigeerd.

Er zijn echter ook situaties waarin hoge VFI's veilig kunnen worden genegeerd zonder te lijden aan multicollineariteit. De volgende zijn drie van dergelijke situaties:

1. Hoge VIF's bestaan ​​alleen in controlevariabelen, maar niet in relevante variabelen. In dit geval zijn de variabelen van belang niet collineair ten opzichte van elkaar of de controlevariabelen. De regressiecoëfficiënten worden niet beïnvloed.

2. Wanneer hoge VIF's worden veroorzaakt als gevolg van het opnemen van de producten of vermogens van andere variabelen, veroorzaakt multicollineariteit geen negatieve effecten. Een regressiemodel bevat bijvoorbeeld zowel x als x2 als onafhankelijke variabelen.

3. Als een dummyvariabele die meer dan twee categorieën vertegenwoordigt een hoge VIF heeft, bestaat er niet noodzakelijk multicollineariteit. De variabelen hebben altijd hoge VIF's als er een klein deel van de gevallen in de categorie is, ongeacht of de categorische variabelen gecorreleerd zijn met andere variabelen.

Correctie van multicollineariteit

Aangezien multicollineariteit de variantie van coëfficiënten opblaast en type II-fouten veroorzaakt, is het essentieel om deze op te sporen en te corrigeren. Er zijn twee eenvoudige en veelgebruikte manieren om multicollineariteit te corrigeren, zoals hieronder vermeld:

1. De eerste is om een ​​(of meer) van de sterk gecorreleerde variabelen te verwijderen. Omdat de door de variabelen verstrekte informatie overbodig is, zal de determinatiecoëfficiënt niet sterk worden aangetast door de verwijdering.

2. De tweede methode is het gebruik van principale componentenanalyse (PCA) of partiële kleinste kwadratenregressie (PLS) in plaats van OLS-regressie. PLS-regressie kan de variabelen tot een kleinere set reduceren zonder onderlinge correlatie. In PCA worden nieuwe niet-gecorreleerde variabelen gemaakt. Het minimaliseert informatieverlies en verbetert de voorspelbaarheid van een model.

Meer middelen

Finance is de officiële aanbieder van de wereldwijde Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ -certificering De Certified Banking & Credit Analyst (CBCA) ™ -accreditatie is een wereldwijde standaard voor kredietanalisten die betrekking heeft op financiën, boekhouding, kredietanalyse en cashflowanalyse , convenantmodellering, terugbetalingen van leningen en meer. certificeringsprogramma, ontworpen om iedereen te helpen een financiële analist van wereldklasse te worden. Om uw carrière verder te ontwikkelen, zijn de onderstaande aanvullende bronnen nuttig:

  • Basisconcepten voor statistieken in financiën Basisconcepten van statistieken voor financiën Een gedegen kennis van statistieken is van cruciaal belang om ons een beter begrip van financiën te geven. Bovendien kunnen statistische concepten investeerders helpen bij het monitoren
  • Voorspellingsmethoden Voorspellingsmethoden Topvoorspellingsmethoden. In dit artikel leggen we vier soorten inkomstenvoorspellingsmethoden uit die financiële analisten gebruiken om toekomstige inkomsten te voorspellen.
  • Meervoudige lineaire regressie Meervoudige lineaire regressie Meervoudige lineaire regressie verwijst naar een statistische techniek die wordt gebruikt om de uitkomst van een afhankelijke variabele te voorspellen op basis van de waarde van onafhankelijke variabelen
  • Willekeurige variabele Willekeurige variabele Een willekeurige variabele (stochastische variabele) is een type variabele in statistieken waarvan de mogelijke waarden afhangen van de uitkomsten van een bepaald willekeurig fenomeen

Aanbevolen

Is Crackstreams afgesloten?
2022
Is het MC-commandocentrum veilig?
2022
Verlaat Taliesin een cruciale rol?
2022