/Kommunal Finanshåndbok

Noen elementære statistiske begreper

I studien av porteføljeteori vil vi være opptatt av hva som skjer når vi kombinerer individuelle verdipapirer i en portefølje. Porteføljens risiko blir ofte målt som variabiliteten i avkastningen porteføljen gir. Som en konsekvens av dette vil det viktigste spørsmålet vi stiller være; Hva skjer med variabiliteten i avkastningen når vi legger til et eller flere verdipapirer til vår portefølje. I dette kapittelet vil vi introdusere noen statistiske begreper som vi benytter for å svare på dette spørsmålet.


6. februar 2015
Publisert: 6. februar 2015

La oss se for oss at vi ønsker å kartlegge potensialet for å oppnå en avkastning høyere enn null for et tenkt verdipapir over en tidsperiode. Hvis vi kan anslå sannsynligheten for ulike avkastningsutfall, vil vi kunne tegne en enkel sannsynlighetsfordeling – en normalfordeling som i figur c-1.
c1

Figur c 1

På den horisontale aksen plottes alle mulige avkastningsutfall vi kan forvente i perioden. Symbolet rj relateres til det j`te mulige avkastningsutfallet i perioden.

På den vertikale aksen måles sannsynligheten hj for å oppnå et gitt avkastningsutfall. Summen av sannsynlighetene for alle mulige avkastningsutfall i perioden (arealet under kurven) vil være 1,0 eller 100 %.

Ved å gjøre to beregninger kan vi beskrive nærmere hvordan denne <strong>fordelingen</strong> ser ut. La oss anta at vi ønsker å finne ut hvor på den horisontale aksen ”tyngden” av observasjoner ligger.

Rent billedlig kan vi se for oss en stang hvor det bortetter stangen henger flere lodd med forskjellig vekt. Det punktet som balanserer stangen, dvs. at stangen holdes i likevekt, vil være tyngdepunktet.

Parameteren som beskriver tyngdepunktet i den statistiske fordelingen angir den forventede avkastningen i tidsperioden. Som navnet antyder, forteller denne parameteren hvilken avkastning vi kan forvente i den angitte tidsperioden.

Forventet avkastning, E(r) er gitt ved:

formel_c_1

Formel c 1

Summen av alle avkastningsutfallene (r`ene) vektet med respektive sannsynlighetene (h`ene) i graf 1 er 10 %.

Den andre parameteren som beskriver sannsynlighetsfordelingen er varians. Variansen forteller noe om potensialet for avvik i forhold til den forventede avkastningen. Formelen for variansen er:

formel_c_2

Formel c 2

Vi ser at variansformelen summerer sannsynligheten for hvert enkelt utfall multiplisert med differansen mellom det tilhørende utfallsresultat og forventet resultat, opphøyet i annen. I og med at finansiell risiko defineres som resultatsvingninger rundt en forventet avkastning er formelen for varians relativt intuitiv. Grunnen til at differansen mellom utfallsresultatene og forventet resultat er opphøyet i annen, er at utfall på begge sider av forventet resultat skal få telle like mye. Dersom ikke disse differansene hadde vært opphøyet i annen ville jo differansene til venstre for forventet resultat blitt negative, og i et uendelig utfallsrom ville variansen blitt lik null.

Jo høyere varians, dess større er muligheten for at de enkelte observasjonene i tidsperioden avviker fra den forventede avkastningen.

Tar vi kvadratroten av variansen, σ2 finner vi standardavviket, σ. Standardavviket er uttrykt i samme enhet som forventet avkastning, og blir ofte benyttet ved risikoberegninger.

formel_c_3

Formel c 3

Informasjon om forventet avkastning og standardavviket kan brukes til å beskrive hvordan sannsynlighetsfordelingen.

c2

Figur c 2

I de fleste tilfeller har man imidlertid ikke muligheten til å se hele det faktiske utfallsrom for avkastningen til et aktiva. Vi må derfor forutsette at vi kan beskrive fordelingen av utfall ved å estimere forventningen og variansen ut fra et utvalg historiske observasjoner. Disse estimatene kalles utvalgsgjennomsnitt og utvalgsvarians.

For at estimatene skal kan være gyldige, må et sett med forutsetninger legges til grunn: for det første må vi anta at den underliggende fordelingen (utfallsrommet og sannsynligheten for de enkelte utfall) er konstant over tid. Dernest må vi forutsette at fordelingen er normalfordelt. Dette innebærer at fordelingen har samme form som i figur c-2, hvor kurven er symmetrisk rundt forventningen, E. Fra statistiske tabeller kan vi anslå arealet under normalfordelingen for ulike verdier. F. eks vil om lag 66,7 % av alle mulige utfall ligge innen 1 standardavvik på begge sider av forventet verdi, om lag 95 % innen 2 standardavvik og praktisk talt alle innen 3 standardavvik.

Utvalgsgjennomsnittet, r, finnes ved:

formel_c_4
Formel c 4

La oss anta at figur 3-1 beskriver samtlige avkastingsutfall for en aksje over en periode. For å estimere forventningen og variansen tar vi seks månedlige observasjoner:

observasjonavkastning
16%
22%
34%
4-1%
512%
67%
N = 6 

Figur c 3
Setter vi tallene inn i formelen finner vi at r= 5 prosent. Fra figur b-1 vet vi at den faktiske forventningen er 10 %. Differansen blir gjerne kalt utvalgsavvik (ε). Dette avviket vil bli mindre jo flere observasjoner vi benytter i estimeringen av utvalgsgjennomsittet. Vi må imidlertid være oppmerksom på vår forutsetning om at den underliggende sannsynlighets-fordelingen ikke endrer form over tid. Denne forutsetningen blir mer og mer urealistisk jo lenger periode vi velger å hente observasjoner fra.

Utvalgsvariansen finnes ved:
formel_c_5
Formel c 5

Beregningen kan settes opp tabellarisk:
c4

Figur c 4

I vårt tilfelle blir variansen 0,0020, og standardavviket 4,47 %.


Tilbake

ANONNSØRER

chevron-downmenu-circlecross-circle