Wat is de determinatiecoëfficiënt?

De determinatiecoëfficiënt (R² of r-kwadraat) is een statistische maat in een regressiemodel dat het aandeel van de variantie in de afhankelijke variabele bepaalt dat kan worden verklaard door de onafhankelijke variabele Onafhankelijke variabele Een onafhankelijke variabele is een invoer, aanname of drijfveer dat wordt gewijzigd om de impact ervan op een afhankelijke variabele (de uitkomst) te beoordelen. . Met andere woorden, de determinatiecoëfficiënt vertelt iemand hoe goed de gegevens passen bij het model (de goedheid van fit).

Bepalingscoëfficiënt

Hoewel de determinatiecoëfficiënt enkele nuttige inzichten geeft met betrekking tot het regressiemodel, moet men bij de beoordeling van een statistisch model niet alleen op de maat vertrouwen. Het geeft geen informatie over het oorzakelijk verband tussen de onafhankelijke en afhankelijke variabelen. Afhankelijke variabele Een afhankelijke variabele is er een die zal veranderen afhankelijk van de waarde van een andere variabele, de onafhankelijke variabele. en het geeft niet de juistheid van het regressiemodel aan. Daarom moet de gebruiker altijd conclusies trekken over het model door de determinatiecoëfficiënt samen met andere variabelen in een statistisch model te analyseren.

De determinatiecoëfficiënt kan waarden tussen 0 en 1 aannemen. Bovendien wordt de statistische metriek vaak uitgedrukt in percentages.

Interpretatie van de determinatiecoëfficiënt (R²)

De meest gebruikelijke interpretatie van de determinatiecoëfficiënt is hoe goed het regressiemodel past bij de waargenomen gegevens. Een determinatiecoëfficiënt van 60% toont bijvoorbeeld aan dat 60% van de gegevens in het regressiemodel passen. Over het algemeen duidt een hogere coëfficiënt op een betere pasvorm voor het model.

Het is echter niet altijd zo dat een hoge r-kwadraat goed is voor het regressiemodel. De kwaliteit van de coëfficiënt is afhankelijk van verschillende factoren, waaronder de maateenheden van de variabelen, de aard van de variabelen die in het model worden gebruikt en de toegepaste datatransformatie. Soms kan een hoge coëfficiënt dus wijzen op problemen met het regressiemodel.

Er is geen universele regel die bepaalt hoe de determinatiecoëfficiënt moet worden meegenomen in de beoordeling van een model. De context waarin de voorspelling of het experiment is gebaseerd, is buitengewoon belangrijk, en in verschillende scenario's kunnen de inzichten uit de statistische metriek variëren.

Berekening van de coëfficiënt

Wiskundig kan de determinatiecoëfficiënt worden gevonden met behulp van de volgende formule:

Formule

Waar:

  • SS- regressie - de som van kwadraten als gevolg van regressie (verklaarde som van kwadraten)
  • SS totaal - de totale som van vierkanten

Hoewel de termen "totale som van kwadraten" en "som van kwadraten als gevolg van regressie" verwarrend lijken, zijn de betekenissen van de variabelen eenvoudig.

De totale som van de kwadraten meet de variatie in de geobserveerde gegevens (gegevens gebruikt bij regressiemodellering). De som van de kwadraten als gevolg van regressie meet hoe goed het regressiemodel de gegevens weergeeft die werden gebruikt voor het modelleren.

Meer middelen

Finance is de officiële aanbieder van de wereldwijde Financial Modelling & Valuation Analyst (FMVA) ™ FMVA®-certificering Sluit je aan bij 350.600+ studenten die werken voor bedrijven als Amazon, JP Morgan en Ferrari-certificeringsprogramma, ontworpen om iedereen te helpen een financiële analist van wereldklasse te worden . Om te blijven leren en uw carrière vooruit te helpen, zijn de onderstaande aanvullende financiële bronnen nuttig:

  • Basisconcepten voor statistieken in financiën Basisconcepten van statistieken voor financiën Een gedegen kennis van statistieken is van cruciaal belang om ons een beter begrip van financiën te geven. Bovendien kunnen statistische concepten investeerders helpen bij het monitoren
  • Binominale distributie Binominale distributie Binominale distributie is een algemene waarschijnlijkheidsverdeling die de kans modelleert om een ​​van de twee uitkomsten te verkrijgen onder een bepaald aantal parameters
  • Centrale limietstelling Centrale limietstelling De centrale limietstelling stelt dat het steekproefgemiddelde van een willekeurige variabele een bijna normale of normale verdeling zal aannemen als de steekproefomvang groot is
  • Regressieanalyse Regressieanalyse Regressieanalyse is een verzameling statistische methoden die wordt gebruikt voor het schatten van relaties tussen een afhankelijke variabele en een of meer onafhankelijke variabelen. Het kan worden gebruikt om de sterkte van de relatie tussen variabelen te beoordelen en om de toekomstige relatie daartussen te modelleren.

Aanbevolen

Is Crackstreams afgesloten?
2022
Is het MC-commandocentrum veilig?
2022
Verlaat Taliesin een cruciale rol?
2022