- Metodit ja lähestymistavat konkurssinennustamis-tutkimuksessa
4.1. Human Information Processing eli HIP eli inhimillinen päätöksentekoprosessi
- tarkastelee laskentatoimen informaation roolia päätöksentekijöillä ja laskentatoimen monimutkaisia päätöksiä käytännössä (esim. tilintarkastus)
- pyrkii parantamaan laskentatoimen päätöksentekoa ja lisäämään perustietämystä inhimillisistä päätöksentekoprosesseista
- lähestymistapa perustuu Brunswikin (1952) esittämälle linssi-mallille
LINSSI-MALLI
Voitto
Maksuvalmius
1 2 Osingot
Kassavirta
Velat/opo
Informaation
johtolangat 3
_______________________ ________________________
Ympäristön ennustettavuus Ihmisen kyky hyödyntää
4 5
- = todellinen tapahtuma josta päätöksentekijä on kiinnostunut
- = päätöksentekijän ennuste
- = todellisen tapahtuman ja johtolankojen välinen suhde (esim. DA-testaus)
5 = päätöksentekijän arvion ja johtolankojen välinen suhde
SOVELLUKSIA
- data : otos toimivia ja konkurssiyrityksiä (vastinparit?)
- joukko ihmisiä : lainanantajia, lask.toimen opiskelijoita, kirjanpitäjiä, yritysanalyytikkoja, tilintarkastajia jne.
- Vastaajille 1-5 mjaa joka yrityksestä. Voivat olla
- vastaajat luokittelevat yritykset F ja NF- luokkiin
- voidaan tehdä 1-3 vuotta ennen F
- tulos esimerkiksi: kolmella tunnusluvulla analyytikot luokittelivat 80 % yrityksistä oikein
- päätöksenteon mallintaminen
- päätöksentekosäännön muoto lineaarinen
- MDS, multidimensional scaling
- Erotteluanalyysi: DA ja MDA
- ensimmäinen tilastollinen menetelmä konkurssin ennustamisessa
- vertailee F ja NF yritysten taloudellisia ja ei-taloudellisia mjia
- lama v. 1930 oli pääsyy kasvaneeseen tutkimusinnostukseen
- pioneeritutkimus DA:ta hyväksikäyttäen: Beaver (1966):
- 79 F ja niiden vastinparit
- profiilianalyysi 5 vuodelle
- yksinkertainen malli, vain yksi muuttuja
- Esimerkki metodeista Foster 1986
- Ehdollisen todennäköisyyden mallit
(Conditional probability models)
- lin. erotteluanalyysin ongelmat:
- mjat noudattavat multinormaalista jakaumaa (multinormaalisuus)
- mjat ovat toisistaan riippumattomia (multikollineaarisuus)
- poikkeamat eivät aina ole vaarallisia, mutta heikentävät mallin suorituskykyä
3) DA:n tuloksena saadun Z-luvun sisällöllinen tulkinta?
- ratkaisu: logistinen regressioanalyysi (logistic regression analysis l. logit analysis)
- ei vaadi multinormaalisuutta
- sallii multikollineaarisuuden
- lopputuloksena tuottaa ehdollisen todennäköisyyden havainnon kuulumiselle tiettyyn luokkaan riippumattomien muuttujien arvojen perusteella
ehdollisen todennäköisyyden malli (Martin 1977, Ohlson 1980)
- ehdollinen konkurssitodennäköisyys P(Z):
DA: Z = a + b1*x1 + … + bn*xn, missä
xi (i=1,…n) = selittävä mja
bi (i=1,…n) = estimoitu kerroin
1
LOGIT: konkurssin todennäköisyys P(Z) = _________
1 + e –Z
1
= _________
1 + e – (a + b1*x1 + … + bn*xn) , missä
xi ja bi kuten DA:ssa
samantyyppisiä!
- exp(-Z) tarkoittaa luonnollisen logaritmin kantalukua, Neperin lukua e, joka on korotettu potenssiin –Z, joka taas on selittävien mjien painotettu summa
kun painotettu summa sijoitetaan eri jakaumiin:
- logit-analyysi : logistinen kumulatiivinen funktio
- probit-analyysi : normaali kumulatiivinen funktio
- malli estimoidaan suurimman uskottavuuden menetelmällä
Kumulatiivinen todennäköisyysjakauma: ks. kuvio
Funktioiden muotoja, ks. kuviot
- Rekursiivinen osittaminen (recursive partitioning)RP
- rekursiivisessa osittamisessa käytetään hyväksi yksinkertaista päättelysääntöä
- olettamuksia riippuvien tai riippumattomien muuttujien jakaumista ei ole kutan DAssa ja logitissa
- yhdistää yhden ja monen muuttujan hyvät puolet
Menetelmä:
1) määritellään etukäteistodennäköisyydet ja virheiden kustannukset metodi pyrkii minimoimaan väärinluokitusten kustannukset
- valitaan yksittäinen riippumaton mja joka luokittelee yritykset alhaisimmilla odotetuilla väärinluokittelun kustannuksilla
Esimerkki: V: 3 F
39 NF
Y: 10 F TDTA
44 NF
50 F
50 NF CR U: 7 F
5 NF
X: 40 F
6 NF päätössolut
(terminal nodes)
Luokittelumatriisi: todellinen status
F NF
Luokittelu: F
NF
4.5 HERMOVERKOT (NEURAL NETWORKS, NN)
- juuret 1940-luvulla: hermosolu
-yksinkertaisista laskenta-alkioista koostuvia suuria signaaliverkkoja ja näistä muodostuvia hierarkisia järjestelmiä
- matemaattisia systeemejä, joita alunperin kehiteltiin jäljittelemään biologisia hermojärjestelmiä
- keinoälyä on sovellettu mm. jäjittelemään ihmisen käyttäytymistä kuten puheen tuottamista ja kuvien tunnistamista
- NNssä yhdistyy tilastollisten menetelmien kyky hyödyntää suurta aineistoa ja ihmisen kyky käyttää hyväkseen äärihavaintoja
- idea: tuottaa esimerkkitapausten avulla ilmiöstä mahdollisimman yleinen kuvaus vähän alkuoletta-muksia!
- Peruselementit: solut (artificial neurons), jotka jaetaan eri kerroksiin (layers)
neuroni Vaste
Syöte
Piilokerros (hidden layer)
- jotta verkko voi suorittaa tehtävän, se on ensin opetettava (train tai teach)
- ohjattu opetus: verkolla annetaan syöte-vaste-pareja ja se opettelee assosioimaan pareihin liittyviä ominaisuuksia (supervised)
- ohjaamaton opetus: annetaan vain syötteet ja verkko etsii aineistosta tyypillisiä piirteitä (unsupervised)
- itseorganisoituvat kartat: luodaan kartta, jossa huomattavimmat syöttötietojen piirteet ovat edustettuina (ks. esimerkit kartoista)
- hermoverkon kehittäminen ja toiminta systeeminä:
kehittäminen:
verkon rakenne ei
ratkaistava opetus testaus validi
tehtävä
mjien valinta
kyllä
toiminta: syöte hermoverkko
vaste
- verkko voidaan opettaa melko suureen tarkkuuteen, mutta monimutkaiset riippuvuudet johtavat siihen, ettei se toimi ehkä hyvin testiaineistossa
- Eloonjäämisanalyysi (survival analysis)
- ensimmäiset metodit biolääketieteessä ja insinööri-tieteissä
- edelliset menetelmät tarkastelevat havaintojoukkoa tiettynä hetkenä, esim. 1 vuosi ennen konkurssia
- tilinpäätös- ja konkurssihetkestä riippuen "1 vuosi" saattaa olla esim. 6 tai 20 kk
- aikaisempien vuosien havaintoja on vaikea käyttää hyödyksi samanaikaisesti
- eloonjäämisanalyysi on menetelmä, joka pyrkii hyödyntämään tiedon tp-tietojen syntyhetken ja konkurssihetken välillä (survival time)
- konkurssinennustamiseen sovellettiin 1980-luvun puolivälissä
- Lane, Looney ja Wansley (1986)
- Luoma & Laitinen (1991)
- dynaaminen malli luonteva konkurssiprosessia ajatellen
- keskeisiä käsitteitä:
- riskijoukko (risk set): ne havainnot, jotka ovat vaarassa joutua konkurssiin tiettynä hetkenä
- riskiluku (konkurssiriski tai välitön kuolinvaara): alttius, jolla konkurssi tapahtuu tietyllä hetkellä
- mallin eli riskiluvun kaavan kertoimien estimointi vaatii tiedon siitä, kuinka paljon aikaa kullakin konkurssiyrityksellä on konkurssiin
- toimivat yritykset (ei konkurssihetkeä) = sensuroidut havainnot, joille määritellään riittävän pitkä elinaika
- olettaa perusmuodossaan kaikille F-yrityksille samanlaisen konkurssiprosessin
- käytetyin versio Coxin suhteellisen riskin malli:
h(t,Z) = h0(t) * exp (Z) ja
Z = A1 * x1 + A2 * x2 + … An * xn ,
Missä h(t,Z) = hazard rate eli taipumus tehdä konkurssi
H0(t) = baseline hazard eli perusriski hetkellä t, kun Z = 0
- lähellä logit-mallia, mutta hyödyntää myös eloonjäämisajan
- estimoidaan suurimman uskottavuuden menetelmällä kuten logit-mallissa
- ks. kuviot
- Erikoissovelluksia
- Chernoff: yritystä koskeva informaatio esitetään kasvoina
- mitä korkeampi konkurssiriski, sitä surkeampi naama
- Korhonen (1989): taloanalyysi: yritystä koskeva info esitetään taloina
- mitä suurempi riski, sitä ränsistyneempi talo