Wat is LASSO?

LASSO, een afkorting van Least Absolute Shrinkage and Selection Operator, is een statistische formule met als hoofddoel de feature selectie en regularisatie van datamodellen. De methode werd voor het eerst geïntroduceerd in 1996 door hoogleraar statistiek Robert Tibshirani. LASSO introduceert parameters voor de som van een model, waardoor het een bovengrens krijgt die fungeert als een beperking voor de som om absolute parameters binnen een toelaatbaar bereik op te nemen.

lasso

De LASSO-methode regulariseert modelparameters door de regressiecoëfficiënten te verkleinen, waardoor sommige ervan tot nul worden teruggebracht. De kenmerkselectiefase vindt plaats na de krimp, waarbij elke niet-nulwaarde wordt geselecteerd om in het model te worden gebruikt. Deze methode is significant bij het minimaliseren van voorspellingsfouten die veel voorkomen in statistische modellen Kwantitatieve analyse Kwantitatieve analyse is het proces van het verzamelen en evalueren van meetbare en verifieerbare gegevens zoals inkomsten, marktaandeel en lonen om het gedrag en de prestaties van een bedrijf. In het tijdperk van datatechnologie wordt kwantitatieve analyse beschouwd als de voorkeursbenadering voor het nemen van geïnformeerde beslissingen. .

LASSO biedt modellen met een hoge voorspellingsnauwkeurigheid. De nauwkeurigheid neemt toe omdat de methode krimp van coëfficiënten omvat, wat op zijn beurt de variantie vermindert en bias minimaliseert. Het presteert het beste wanneer het aantal waarnemingen laag is en het aantal kenmerken hoog. Het is sterk afhankelijk van parameter λ, die de controlerende factor is bij krimp. Hoe groter λ wordt, des te meer coëfficiënten worden gedwongen nul te zijn.

Als λ gelijk is aan nul, wordt het model de gewone kleinste-kwadratenregressie. Bijgevolg, wanneer λ toeneemt, neemt de variantie significant af, en neemt ook de afwijking in het resultaat toe. Lasso is ook een handig hulpmiddel bij het elimineren van alle variabelen die niet relevant zijn en die niet gerelateerd zijn aan de responsvariabele.

LASSO in statistische lineaire modellen

Een statistisch model is een realistische wiskundige weergave van een probleem. Het model moet het probleem zo dicht mogelijk bij de echte wereld weergeven en het tegelijkertijd eenvoudig en gemakkelijk te begrijpen maken. Een model is samengesteld uit verklarende variabelen en responsvariabelen.

De verklarende variabele is een onafhankelijke variabele die ter beoordeling van de onderzoeker staat. De onafhankelijke variabelen zijn de inputs in het model die door de onderzoeker kunnen worden gemeten om hun effect op de resultaten van het model te bepalen.

De responsvariabele is een afhankelijke variabele. Afhankelijke variabele Een afhankelijke variabele is een variabele die zal veranderen afhankelijk van de waarde van een andere variabele, de zogenaamde onafhankelijke variabele. dat vormt de belangrijkste focus van het experiment. Het vormt het resultaat van het experiment, dat een enkel resultaat kan zijn in het geval van univariate modellen, of, in het geval van multivariate modellen, meerdere resultaten.

LASSO vormt een integraal onderdeel van het modelbouwproces, vooral met behulp van de functieselectie. De kenmerkselectiefase helpt bij de selectie van verklarende variabelen, dit zijn de onafhankelijke variabelen en dus de invoervariabelen in het model.

De inputvariabelen zijn belangrijke elementen die de output van het model bepalen en die helpen bij het meten van hun effect op de responsvariabelen. Het kiezen van de juiste variabelen bepaalt de nauwkeurigheid van het model. De functieselectiefase van de LASSO helpt bij de juiste selectie van de variabelen.

Schatting met LASSO

Statistische modellen vertrouwen op LASSO voor nauwkeurige variabele selectie en regularisatie. Bij lineaire regressie Regressieanalyse Regressieanalyse is een verzameling statistische methoden die wordt gebruikt voor het schatten van relaties tussen een afhankelijke variabele en een of meer onafhankelijke variabelen. Het kan worden gebruikt om de sterkte van de relatie tussen variabelen te beoordelen en om de toekomstige relatie daartussen te modelleren. LASSO introduceert bijvoorbeeld een bovengrens voor de som van de kwadraten, waardoor de fouten in het model worden geminimaliseerd. De LASSO-schatter is afhankelijk van de parameter λ.

De parameter λ regelt de sterkte van de krimp, waarbij een toename van λ resulteert in een toename van de krimp. De bovengrens van de som van alle coëfficiënten is omgekeerd evenredig met de parameter λ. Wanneer de bovengrens in waarde toeneemt, neemt de parameter λ af. Wanneer de bovengrens afneemt, neemt de parameter λ gelijktijdig toe.

Naarmate de bovengrens toeneemt naar oneindig, nadert de parameter λ nul, waardoor het experiment wordt omgezet in een gewone kleinste kwadraat, waarbij de parameter λ altijd gelijk is aan nul. Wanneer de bovengrenscoëfficiënten nul naderen, neemt de waarde van parameter λ toe tot oneindig.

LASSO-geometrie

LASSO vormt een ruitvorm in de plot voor zijn beperkingsgebied, zoals weergegeven in de onderstaande afbeelding. De diamantvorm omvat hoeken, in tegenstelling tot de ronde vorm gevormd door nokregressie. De nabijheid van het eerste punt tot de hoek laat zien dat het model wordt geleverd met één coëfficiënt, die gelijk is aan nul.

Het gebied met randregressiebeperkingen vormt een cirkelvorm die geen hoeken bevat die vergelijkbaar zijn met die gevormd door het LASSO-beperkingsgebied bij het uitzetten. De nokregressiecoëfficiënten kunnen daarom niet gelijk zijn aan nul.

Gewogen LASSO

Gewogen LASSO is het resultaat van een onderzoeker die de regressiecoëfficiënten afzonderlijk bestraft. Dit betekent dat in plaats van een gemeenschappelijke parameter λ voor alle coëfficiënten te bestraffen, de coëfficiënten afzonderlijk worden bestraft, met behulp van verschillende parameters.

De gewichten kunnen worden bepaald met behulp van een LASSO-algoritme om op de juiste manier gewichten toe te wijzen voor nauwkeurige modellering. Een vergelijkbare weging van regressiecoëfficiënten is de coöperatieve LASSO, waar de coëfficiënten worden bestraft in groepen die als vergelijkbaar worden beschouwd.

Aanvullende bronnen

Finance is de officiële aanbieder van de Certified Banking & Credit Analyst (CBCA) ™ CBCA ™ -certificering De Certified Banking & Credit Analyst (CBCA) ™ -accreditatie is een wereldwijde standaard voor kredietanalisten die betrekking heeft op financiën, boekhouding, kredietanalyse, cashflowanalyse, convenantmodellering, terugbetalingen van leningen en meer. certificeringsprogramma, ontworpen om van iedereen een financiële analist van wereldklasse te maken.

Om uw kennis van financiële analyse te blijven leren en ontwikkelen, raden we de onderstaande aanvullende financiële bronnen ten zeerste aan:

  • Voorspellingsmethoden Voorspellingsmethoden Topvoorspellingsmethoden. In dit artikel leggen we vier soorten inkomstenvoorspellingsmethoden uit die financiële analisten gebruiken om toekomstige inkomsten te voorspellen.
  • Onafhankelijke variabele Onafhankelijke variabele Een onafhankelijke variabele is een invoer, aanname of drijfveer die wordt gewijzigd om de impact ervan op een afhankelijke variabele (de uitkomst) te beoordelen.
  • Meervoudige lineaire regressie Meervoudige lineaire regressie Meervoudige lineaire regressie verwijst naar een statistische techniek die wordt gebruikt om de uitkomst van een afhankelijke variabele te voorspellen op basis van de waarde van onafhankelijke variabelen
  • Scenario-analyse Scenario-analyse Scenario-analyse is een techniek die wordt gebruikt om beslissingen te analyseren door verschillende mogelijke uitkomsten bij financiële investeringen te speculeren. Bij financiële modellen is dit

Aanbevolen

Is Crackstreams afgesloten?
2022
Is het MC-commandocentrum veilig?
2022
Verlaat Taliesin een cruciale rol?
2022