Wat is meervoudige lineaire regressie?

Meervoudige lineaire regressie verwijst naar een statistische techniek die wordt gebruikt om de uitkomst van een variabele te voorspellen op basis van de waarde van twee of meer variabelen. Het is soms eenvoudigweg bekend als meervoudige regressie, en het is een uitbreiding van lineaire regressie. De variabele die we willen voorspellen staat bekend als de afhankelijke variabele, terwijl de variabelen die we gebruiken om de waarde van de afhankelijke variabele te voorspellen Afhankelijke variabele Een afhankelijke variabele is er een die zal veranderen afhankelijk van de waarde van een andere variabele, de onafhankelijke variabele. staan ​​bekend als onafhankelijke of verklarende variabelen.

Meerdere lineaire regressieFiguur 1: Voorspellingen van meerdere lineaire regressiemodellen voor individuele waarnemingen (bron)

Overzicht

  • Meervoudige lineaire regressie verwijst naar een statistische techniek die twee of meer onafhankelijke variabelen gebruikt om de uitkomst van een afhankelijke variabele te voorspellen.
  • Met deze techniek kunnen analisten de variatie van het model en de relatieve bijdrage van elke onafhankelijke variabele in de totale variantie bepalen.
  • Meervoudige regressie kan twee vormen aannemen, namelijk lineaire regressie en niet-lineaire regressie.

Meerdere lineaire regressieformule

Meervoudige lineaire regressie - formule

Waar:

  • yi is de afhankelijke variabele of voorspelde
  • β0 is het y- snijpunt , dwz de waarde van y als xi en x2 beide 0 zijn.
  • β1 en β2 zijn de regressiecoëfficiënten die de verandering in y vertegenwoordigen ten opzichte van een verandering van één eenheid in xi1 en xi2 , respectievelijk.
  • βp is de hellingscoëfficiënt voor elke onafhankelijke variabele
  • ϵ is de willekeurige fout (rest) term van het model.

Inzicht in meervoudige lineaire regressie

Met eenvoudige lineaire regressie kunnen statistici de waarde van een variabele voorspellen met behulp van de beschikbare informatie over een andere variabele. Lineaire regressie probeert de relatie tussen de twee variabelen langs een rechte lijn vast te stellen.

Meervoudige regressie is een type regressie waarbij de afhankelijke variabele een lineair verband vertoont met twee of meer onafhankelijke variabelen. Het kan ook niet-lineair zijn , waarbij de afhankelijke en onafhankelijke variabelen Onafhankelijke variabele Een onafhankelijke variabele is een invoer, aanname of drijfveer die wordt gewijzigd om de impact ervan op een afhankelijke variabele (de uitkomst) te beoordelen. volg geen rechte lijn.

Zowel lineaire als niet-lineaire regressie volgen een bepaalde respons grafisch met behulp van twee of meer variabelen. Niet-lineaire regressie is echter meestal moeilijk uit te voeren, omdat deze wordt gecreëerd op basis van aannames die zijn afgeleid van vallen en opstaan.

Veronderstellingen van meervoudige lineaire regressie

Meervoudige lineaire regressie is gebaseerd op de volgende aannames:

1. Een lineaire relatie tussen de afhankelijke en onafhankelijke variabelen

De eerste aanname van meervoudige lineaire regressie is dat er een lineair verband bestaat tussen de afhankelijke variabele en elk van de onafhankelijke variabelen. De beste manier om de lineaire relaties te controleren, is door scatterplots te maken en de scatterplots vervolgens visueel te inspecteren op lineariteit. Als de relatie die wordt weergegeven in het scatterplot niet lineair is, moet de analist een niet-lineaire regressie uitvoeren of de gegevens transformeren met behulp van statistische software, zoals SPSS.

2. De onafhankelijke variabelen zijn niet sterk met elkaar gecorreleerd

De gegevens mogen geen multicollineariteit vertonen, wat optreedt wanneer de onafhankelijke variabelen (verklarende variabelen) sterk met elkaar gecorreleerd zijn. Wanneer onafhankelijke variabelen multicollineariteit vertonen, zullen er problemen zijn bij het uitzoeken van de specifieke variabele die bijdraagt ​​aan de variantie in de afhankelijke variabele. De beste methode om de aanname te testen is de Variance Inflation Factor-methode.

3. De variantie van de residuen is constant

Bij meervoudige lineaire regressie wordt ervan uitgegaan dat de hoeveelheid fouten in de residuen op elk punt van het lineaire model gelijk is. Dit scenario staat bekend als homoscedasticiteit. Bij het analyseren van de gegevens moet de analist de gestandaardiseerde residuen uitzetten tegen de voorspelde waarden om te bepalen of de punten eerlijk zijn verdeeld over alle waarden van onafhankelijke variabelen. Om de aanname te testen, kunnen de gegevens worden geplot op een scatterplot of door statistische software te gebruiken om een ​​scatterplot te produceren die het hele model omvat.

4. Onafhankelijkheid van waarneming

Het model gaat ervan uit dat de waarnemingen onafhankelijk van elkaar moeten zijn. Simpel gezegd, het model gaat ervan uit dat de waarden van residuen onafhankelijk zijn. Om deze aanname te testen, gebruiken we de Durbin Watson-statistiek.

De test toont waarden van 0 tot 4, waarbij een waarde van 0 tot 2 een positieve autocorrelatie aangeeft, en waarden van 2 tot 4 een negatieve autocorrelatie. Het middelpunt, dwz een waarde van 2, geeft aan dat er geen autocorrelatie is.

5. Multivariate normaliteit

Multivariate normaliteit treedt op wanneer residuen normaal worden verdeeld. Om deze aanname te testen, bekijkt u hoe de waarden van residuen zijn verdeeld. Het kan ook worden getest met behulp van twee hoofdmethoden, namelijk een histogram met een bovenliggende normale curve of de methode Normal Probability Plot.

Meer middelen

Finance biedt de Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ -certificering De Certified Banking & Credit Analyst (CBCA) ™ -accreditatie is een wereldwijde standaard voor kredietanalisten die betrekking heeft op financiën, boekhouding, kredietanalyse, cashflowanalyse, convenantmodellering, lening terugbetalingen, en meer. certificeringsprogramma voor diegenen die hun carrière naar een hoger niveau willen tillen. Bekijk de aanvullende relevante financiële bronnen hieronder om te blijven leren en uw kennisbasis te ontwikkelen:

  • Voorspellingsmethoden Voorspellingsmethoden Topvoorspellingsmethoden. In dit artikel leggen we vier soorten inkomstenvoorspellingsmethoden uit die financiële analisten gebruiken om toekomstige inkomsten te voorspellen.
  • Poisson-verdeling Poisson-verdeling De Poisson-verdeling is een hulpmiddel dat wordt gebruikt in de statistiek van de waarschijnlijkheidstheorie om de hoeveelheid variatie te voorspellen op basis van een bekende gemiddelde frequentie van voorkomen, binnen
  • Willekeurige variabele Willekeurige variabele Een willekeurige variabele (stochastische variabele) is een type variabele in statistieken waarvan de mogelijke waarden afhangen van de uitkomsten van een bepaald willekeurig fenomeen
  • Regressieanalyse Regressieanalyse Regressieanalyse is een verzameling statistische methoden die wordt gebruikt voor het schatten van relaties tussen een afhankelijke variabele en een of meer onafhankelijke variabelen. Het kan worden gebruikt om de sterkte van de relatie tussen variabelen te beoordelen en om de toekomstige relatie daartussen te modelleren.

Aanbevolen

Is Crackstreams afgesloten?
2022
Is het MC-commandocentrum veilig?
2022
Verlaat Taliesin een cruciale rol?
2022