Haku

Harjuregression ja lasson vertailu äidin rintamaidon oligosakkaridiaineistossa

QR-koodi

Harjuregression ja lasson vertailu äidin rintamaidon oligosakkaridiaineistossa

Teknologian kehitys on yleistänyt suuret ja leveät aineistot myös lääketieteessä. Lineaarisen regression sovittaminen aineistoon ei aina ole mahdollista, kun havaintojen määrä on pieni muuttujien määrään verrattuna. Kutistamismenetelmillä pyritään korjaamaan PNS-estimoinnissa esiintyviä ongelmia kuten multikollineaarisuutta, poikkeavien havaintojen tuottamia ongelmia sekä estimaattorien varianssin kasvua, joka syntyy, kun muuttujien lukumäärä lähestyy havaintojen lukumäärää.

Harjuregressio ja lasso ovat kutistamismenetelmiä, jotka perustuvat regressiokertoimien kutistamiseen. Menetelmät rajoittavat regressiokertoimia valitulla sakkofunktiolla ja tasoitusparametrilla. Harjuregressiossa sakkofunktiona toimii parametrien neliöiden summa ja lassossa parametrien itseisarvojen summa. Tasoitusparametri kontrolloi kutistamisen määrää; mitä suurempi parametrin arvo on, sitä enemmän regressioparametreja kutistetaan kohti nollaa. Lasso kykenee myös mallin valintaan, koska se voi kutistaa parametrit täsmälleen nollaksi. Elastinen verkko yhdistää lasson ja harjuregression hyödyt. Siltaregressio on taas näiden kahden menetelmän yleistys.

Äidin rintamaidon oligosakkaridit ovat äidin rintamaidossa olevia hiilihydraatteja, joita lapsi ei käytä ravinnokseen. Tutkielmassa sovitetaan harjuregressio, lasso ja PNS-estimoitu lineaarinen regressio äidin rintamaidon oligosakkaridiaineistoon ja vertaillaan mallien tuottamia tuloksia ja niiden sopivuutta aineistoon. Tutkielmassa tutkitaan, miten nämä oligosakkaridit ennustavat lapsen painon z-scorea yhden vuoden iässä.

Tallennettuna: