COVID-19-viruksen aiheuttama pandemia on levinnyt yli maapallon, eikä kausaalia syytä, interventiota, keinoa parannukselle, tahdo löytyä! Lukuisat tutkimusryhmät testaavat sekä tekevät kokeita niin olemassa olevilla lääkkeillä kuin kehitettävillä uusilla lääkkeillä ja rokotteilla. Miksi ja miten tämä tapahtuu? Miten testit ja kokeet tehdään?

Yhteiskunnan ongelmat – työttömyys, vanhusten hoito, ilmaston lämpeneminen ja monet muut – ovat vuodesta toiseen otsikoissa. Parannusta ei tahdo näkyä. Miksi?

Yrityksissä ja organisaatioissa vuosi toisensa jälkeen taistellaan samojen ongelmien kanssa. Lukuisista yrityksistä huolimatta ongelmat eivät näytä ratkeavan. Miksi?

Oletko koskaan ihmetellyt, miksi asiat eivät näytä ratkeavan? Olet tehnyt kaikkesi! Tiedät lukuisia syitä, joilla asiat voi muuttaa paremmaksi ja olet muuttanut (so. parantanut) joitain näistä syistä ja kuitenkin parannusta ei tapahdu. Miksi? Jotain puuttuu!

Miksi ”syyt” eivät paranna? Olemme tietämättämme törmänneet kausaliteetin näkymättömään seinään!

Parannus ja kausaliteetti

Jokainen parannus, on se pieni tai suuri, vaatii muutoksen ja syyn vaikutuksen yhdistelmän, kausaliteetin. Tämä syy-vaikutus -yhdistelmä on vaativa kuin tikanheitossa tikan (syy) osuminen taulun kymppiin (vaikutus). Epäonnistuminen pahentaa lähes aina tilannetta. Siksi jokainen parannus on testattava ja kokeiltava, jotta voidaan varmistua parantavasta syystä. Tavallinen syy ja korrelaation muodostava syy eivät yleensä johda parannukseen vaan tilanteen heikkenemiseen, jos tehdään toimenpide.

Kausaliteettisyy, joka on ulostulon parannusmuutoksen aikaansaava syyvaikutus, on hyvin harvinainen tilanne. Ehkä 1/20 – 1/100:s satunnainen syy (common cause), jonka keksit, täyttää syy-vaikutus -ehdot ja samalla parantamisen ehdot! Erityssyy tilanteissa (special causes) kausaliteettisyy on oleellisesti helpompi löytää ”jäljen” perusteella. Jos pyörän rengas tyhjenee ja löydät naulan renkaasta, on tämä kausaliteettisyy ja korjaus (huom. ei parannus) tapahtuu paikkaamalla reikä. Erityissyyt ja satunnaissyyt voidaan erotella toisistaan SPC:n avulla. (SPC= Statistical Process Control). Ilmiö itsessään ei anna pohjaa erottelulle. Parannus tapahtuu ensi sijassa systeemin sisäisten satunnaistekijöiden kautta ja korjaus erityissyiden kautta! Vertaa krooniset ja akuutit sairaudet.

Kysymys on siis niistä syistä, joita laatukielellä kutsutaan ”vital few” (oleelliset muutamat) syiksi erotuksena ”trivial many” (tavanomaisen lukuisat). Tämä ilmiö tunnetaan myös Pareto-periaatteena, (varianssin summautumisen laki, teholaki, neliölaki, liike-energian laki W=1/2mv2). Muutoksen vaikutukset (contribution) noudattavat neliöllistä summakaavaa. Muutokseen tarvitaan tehoa/energiaa!

Luonnonilmiön (esim . normaalijakauma) vaikuttavat tekijät noudattavat Pareto-jakaumaa.
Kuva 1. Luonnonilmiön (esim . normaalijakauma) vaikuttavat tekijät noudattavat Pareto-jakaumaa! Oikeanpuoleisen Pareton kaksi ensimmäistä luokkaa, pylvästä (20 %), selittää 79 % vasemmanpuoleisen kuvan luonnonilmiöstä. Kaikista yritysten virheistä/luokista yli 80% selittyy alle 20 % syillä/luokilla, jotka ovat systeemiperusteisia, vital few!

Naivisti sanottuna Loton 40:stä numerosta vain ne 7 ovat kausaalisyitä (vital few), jotka osuivat arvottuun riviin – ja tilille napsahtaa 1-2 milj. €. Näillä voi jotain jo muuttaa! Loput numerot ovat ”trivial many”. Autossa on 5 000 – 30 000 osakokonaisuutta tai osaa. Tarvitaan vain 3-4 kausaalitekijää (”osaa”), joilla auto käynnistyy (minun autossani: 1. avainkortti, 2. jarru pohjaan ja 3. starttinappulan painaminen) ja ajaessakin tarvitaan vain alle 10 kausaalitekijää ja loput ovat ”trivial many”! Tarkastellaan mitä tahansa luonnonilmiötä tai prosessia, tämä lainalaisuus pätee!

Asioihin ei todellakaan vaikuta kuin muutamat syyt, mutta asiat riippuvat, niihin liittyy, on yhteydessä, valtava määrä syitä, joskus kutsutaan tekijöiksi, faktoreiksi. Vaikuttaa ja liittyy, (riippuu, olla yhteydessä) ovat eri asioita. Miten?

Mikä on syy – syy, joka on?

Yleisesti ottaen syyksi voidaan nimittää kaikki tekijät, jotka uskotaan olevan yhteydessä jonkin kanssa. Yleensä ihmiset ideoivat, assosioivat, erilaisia syitä siitä mitä näkevät, kuulevat, tuntevat, haistavat, maistavat, keksivät ilman mitään rajoitteita. Tarvitaan vain hyvä mielikuvitus ja vähän ”hoksottimia”, niin kaikkiin asioihin voi liittää satoja, jopa tuhansia erilaisia syitä ja tekijöitä. Ilmaston lämpenemiseen liittyy lähes 8 miljardia ihmistä, mutta parikymmentä, ehkä vain 4-5 ihmistä voi tähän vaikuttaa!

Laatutekniikassa käytetään aivoriihitekniikoita, post-it-lappuja ja vastaavia, joilla ideat, ”syyt”, luodaan ja luetellaan. Auton tapauksessa tietysti voisi luetella kaikki osat ja niiden kiinnitystavat. Kuvassa 2 esimerkkinä ideoitu ”kolarin” syitä.

Syiden ideoinnista ryhmittelyyn – kalanruoto eli Ishikawa-diagrammi
Kuva 2. Syiden ideoinnista ryhmittelyyn – kalanruoto eli Ishikawa-diagrammi

Joskus nämä syyt myös ”asetellaan” kalanruotokaavioon eli Ishikawa-kaavioon, jolla ilmaistaan, että syy on ennen haluttua tapahtumaa ja syyllä on rakenne. Tällä pyritään rajaamaan syitä. Syyt voidaan ryhmitellä eri tavoin perustuen mielipiteeseen tai johonkin tietoon. Ryhmittelytapoja on monia. Ajatellaan, että ryhmittelyprosessi tuo uutta hiljaista tietoa ja ”vahvistaa” oleellisia syitä. Joskus tuo ja vahvistaa, joskus ei!

Mikä on korrelaatio ja ristiintaulukointi – syy, jolla on yhteys?

Korrelaatio ja ristiintaulukointi ovat menetelmiä, joilla vahvistetaan syyn ja seurauksen tai kahden tai useamman asian välinen tilastollinen tai todennäköinen yhteys tai riippuvuus, siis EI vaikutus, kuten usein virheellisesti uskotaan ja sanotaan. Korrelaatiossa käytetään jatkuvia muuttujia ja ristiintaulukoinnissa diskreettejä esiintyvyyksiä, tiheyksiä.

Korrelaatio (jatkuva data) ja ristiintaulukointi (diskreetti data).
Kuva 3. Korrelaatio (jatkuva data) ja ristiintaulukointi (diskreetti data) ovat pohja tilastollisen riippuvuuden, yhteyden määrittämiseen.

Korrelaatio ja siihen läheisesti liittyvät menetelmät vaativat aina havaintoaineiston (näytteen) keräämistä ja sen perusteella tehtävää tilastollista analyysiä. Analyysin tehtävänä on erottaa todellinen ilmiö sattuman aiheuttamista muutoksista. Analyysi perustuu näytteenoton tilastolliseen teoriaan, miltä sattuma tämän näytteenoton yhteydessä näyttää. Yleensä vähintään 95% todennäköisyys vaaditaan (p<0,05) korrelaatioon ja riippuvuuteen (yhteyteen). Analyysi voi olla yksinkertainen tai hyvinkin yksityiskohtainen ja laajoja matemaattisia taitoja vaativaa. Puhutaan monimuuttuja-analyysistä MA (Multivariable Analysis). Datan on oltava laadultaan hyvää ja madollisimman kuvaavaa. Tämä tietysti maksaa (mittaaminen, kerääminen), joten kaikista syistä ei voida dataa kerätä. Niinpä rajaamme datan keräystä ”osuvimpiin” syihin.

Kokemus on osoittanut, että kaikista niistä ”osuvimmista” syistä, joista keräämme dataa (jatkuvaa tai diskreettiä), vain 2-3% osoittaa tilastollista riippuvuutta ja yhteyttä. Emme voi kuitenkaan osoittaa datalla ja tilastollisilla teorioilla ideoimamme syyn olevan vaikuttava tekijä! Se voi olla tai ei! Todennäköisyysteoria kuvaa siis yhteyttä tai riippuvuutta.

Oletetaan, että valitsemme tarkastelun kohteeksi nämä 2-3% ideoimistamme syistä ja teemme parannuksen (muutoksen) prosessiin tai tuotteeseen ja … epäonnistumme! Hetkinen, nyt muistamme tilastokurssilta, että ”korrelaatiosta ja riippuvuudesta ei välttämättä seuraa kausaliteettia”.

Ehkä muistamme myös vitsin haikaranpesien ja Pariisin väestön välisestä yhteydestä, jäätelönkulutuksen yhteydestä hukkuneiden määrään tai vaikkapa läpimenoajan ja ulostulonopeuden välisestä yhteydestä. Rakentamalla haikaroille pesiä ei Pariisin väestöä voida kasvattaa, jäätelönsyönnin kieltäminen ei vaikuta hukkuneisiin ja prosessin läpimenoajan lyhentäminen ei lisää tuotantomäärää (kapasiteetin/energian lisääminen kyllä lyhentää läpimenoaikaa ja lisää tuotantomäärää). Ei vitsi vaan erittäin tärkeä opetus!

Vaikka kahden muuttujan arvot ovat yhteydessä toisiinsa, niin pelkän havaitun näkemisen, assosiaation, perusteella ei voida tehdä päätelmiä kausaalisuudesta ja parannuksen onnistumisesta, vaikutuksesta. Tätä korrelaatioiden ja yhteyksien verkkoa tutkii ja analysoi tilastotiede, mutta tilastotieteessä ei ole sanaa vaikutus, vaan yhteys! Kirjassa ”The Improvement Guide” sivu 150 on vakuuttavasti ositettu, että tilastollinen efekti (p<0,05) ei välttämättä ole parannus. Katso myös artikkeli: Onnistuuko tuottavuuden ja laadun parannus?

Kausaliteetti – syy, jolla on tiedetty seuraus, efekti?

Kausaliteetti on syy–seuraussuhde eli kahden tapahtuman suhde, jossa toinen aiheuttaa toisen, siis vaikutussuhde. Toinen tapahtuma on tällöin syy ja toinen seuraus. Siis kysymys on erittäin rajatuista joukosta syitä, jolla on tekemisen ehto (tee-operaattori, huom. +-merkki on yhteenlaskun operaattori), että syyn muuttaminen vaikuttaa/muuttaa juuri tiettyä asiaa.

Tilastotiede, niin arvokas kuin se onkin, ei ole kaikkein tärkein työyhteisöissä. Työyhteisössä teemme työtä, muutamme kausaaleja syitä, tekijöitä, jotta saamme tietyn työn (muutoksen) tehtyä. Ammattitaito perustuu juuri näiden kausaalisyiden ja seurausten löytämiseen, tuntemiseen ja hallintaan. Kirveen lyönti (tekeminen, tee-operaattori) klapiin halkaisee puun! Siksi meillä yrityksessä ei yleensä ole tilasto-osastoa eikä tilastotekniikoita opeteta kovinkaan laajalti, koska riippuvuudesta on vain vähän hyötyä. Sen sijaan meillä on laatuosasto tai vastaava, jonka pitäisi olla erikoistunut kausaalianalyysiin, syiden ja niiden seurauksien analyysiin; osata käyttää ”työkaluja” – Ishikawa, Pareto, FMEA, PDSA (Plan, Do, Study, Action), MSA, QFD, DoE, Taguchi muutaman mainitakseni. Näiden joukossa ei ole oikeastaan puhtaita tilastomenetelmiä.

Analyyttinen analyysi on kausaaleja muutoksia tutkiva tiede. Laatutiede, quality engineering. Se on arvokkaampi kuin riippuvuuksia ja yhteyksiä tutkiva tilastotiede, statistics. Työyhteisössä yritetään saada jotain aikaiseksi. Tämä aikaansaaminen tapahtuu AINA muutosten, interventioiden kautta. Nämä interventiot, tekemiset, ovat kausaalissa yhteydessä haluttuun tulevaan tilaan, siis työtulokseen. Yritämme kuvata ja ennustaa (predective) tätä yhteyttä usein erilaisilla tavoilla – työ ja prosessiohjeet, menettelytavat, standardit, piirustukset jne.

Kaikki parannus- ja kehitysmenetelmät kietoutuvat kausaalin yhteyden hakemiseen ja testaamiseen. Tätä sanotaan yleisesti empirismiksi eli kokemukselliseksi ajatteluksi, jossa kokemus ei perustu yksinomaan järjen käsitteisiin, intuitioon (assosiaatio), sisäiseen näkemykseen tai uskomuksiin. Empirismistä on johdettu myös laajat työkalukokonaisuudet kuten Lean, Lean Six Sigman, Shainin ja Taguchi-metodi, 8D, A3, ATS, Tap RooT, jne. joilla kausaliteettisyyt etsitään ja todistetaan.

Käsittelin näitä kahta erilaista analyysiä (tilasto ja kausaali) artikkelissa ”Numeeriset ja analyyttiset tutkimukset” 2019. Huomaa näiden ero. Numeerinen eli tilastollinen analyysi tutkii olemassa olevaa ja siinä olevia eroja ja analyyttinen eli kausaalitekniikka ennustaa muutoksen vaikutusta eli nykytilan ja tulevaisuuden tilaneroja, kun nykytila muuttuu tai muutetaan.

Numeerisen tutkimuksen tavoitteena on arvioida ysiköiden lukumäärä tietyssä rajatussa tilassa, joka kuuluu tiettyyn luokkaan.

Analyyttisen tutkimuksen tavoitteena on luoda perusta toimenpiteelle, joka kohdistuu syy-systeemiin tai prosessiin, jotta tulevaisuuden tuotetta voidaan parantaa.”

Numeerinen ja analyyttinen ongelma (olosuhde) ja tutkimus.
Kuva 4. Numeerinen ja analyyttinen ongelma (olosuhde) ja tutkimus (2). Huomaa eroavuudet analyysitavoissa ja menetelmissä.

Tämän saman idean (erilaisen tutkimusmenetelmän) on tri Judea Pearl esittänyt Causality-models, reasoning and interference -kirjassa kolmiportaisen kausaalitikkaan muodossa, jossa porras 1 esittää Numeerista tilastollista tutkimusta ja portaat 2 ja 3 interventiota ja kontrafaktuaalia. Portaat 2 ja 3 on rinnastettavissa analyyttiseen tutkimukseen ja kausaatioon.

Kausaaliportaat (J. Pearl)
Kuva 5. Kausaaliportaat (J. Pearl)

Alin taso on näkeminen – assosiaatio – on toiminnoltaan havainnointia. Tällä tasolla esitämme kysymyksiä ja miten asiat liittyvät toisiinsa ja mitä tapahtuu, jos muutan tätä (x), kuinka se liittyy, muuttaa uskoani, lopputulokseen (Y). Korrelaatio.

Keskimmäinen taso on tekemisen taso – interventio – on asioihin puuttumista. Teemme jotain ja pohdimme mitä tapahtuu lopputulokselle (Y), jos muutan tätä (x). Kausaatio.

Ylin taso on kuvittelu – kontrafaktuaalit – ymmärtämistä ja kuvittelua, siitä mitäs, jos tämä (x) aiheutti lopputuloksen (Y), tai jos tätä ei olisi tapahtunut, olisiko lopputulos (Y) silti tapahtunut. Kausaatio.

Kuinka kausaatiotutkimus suoritetaan – miten saat parannukset onnistumaan?

Keskeinen idea kausaatiotutkimuksessa (syy-seuraus) on löytää syy, tekijä, asia, parannus, jonka muuttamisella saadaan haluttu muutos aikaan juuri tietyssä meidän toivomassa asiassa.

Olemme ehkä ideoineet suuren määrän mielestämme tärkeitä ”vaikuttavia” syitä toivomaamme asiaan ja karsineet tilastollisilla ja muilla menetelmillä yhteydessä ja riippuvuussuhteessa olevat tekijät, jotka voisivat olla osa kiinnostavia tekijöitä. Emme voi millään tilastollisella tai muilla assosiaation keinolla (aisteilla) erottaa näistä syistä varmasti vaikuttavia tekijöitä. Mitä voimme tehdä?

Määritys voidaan tehdä ainakin kolmella tavalla: 1. Arvioimalla (Hillin lista), 2. Kokeella (DoE) ja 3. Kausaalilaskennalla (tri Judea Pearl) (Uusin tapa)

1. Kausaalisuuden määritys arvioimalla

Kausaalisessa arvioinnissa voidaan käyttää viittä kriteeriä. Nämä viisi kriteeriä eivät ole varmat, mutta antavat suuntaa:

  1. Yhtäpitävyys (monissa samankaltaisissa tutkimuksissa saadaan samankaltaisia tuloksia). Tieteessä eikä yrityksessä pidä luottaa yhteen tulokseen, esimerkkiin!
  2. Yhteyden vahvuus (suurempi arvo tai annos x:ään lisää Y:n vahvuutta)
  3. Yhteyden spesifisyys (erityisellä tekijällä tulee olla erityinen vaikutus, ei pitkää vaikutusten listaa. Pareto). Kaikki asiat EIVÄT siis vaikuta, vaikka toisin väitetään!
  4. Ajallinen suhde (vaikutuksen tulee selkeästi seurata syytä)
  5. Johdonmukaisuus (uskottavuus ja yhtäpitävyys muunlaisten todistusten kanssa)

Lista syntyi aikanaan tupakan ja keuhkosyövän välisen yhteyden ”todistamisesta”. Presidentti John F. Kennedy aloitteesta asetettiin komitea 1963 tutkimaan tupakoinnin ja keuhkosyövän välistä yhteyttä. Tiedemiehillä ei ollut 1960-luvulla mitään keinoa määrittää kausaalista vaikutusta (tupakanpoltto aiheuttaa keuhkosyöpää) ilman satunnaistettua vertailukoetta. Komitean jäsen ja koesuunnittelun uranuurtaja tri Cochran kirjoittaa komitearaportissa:

”Tilastolliset menetelmät eivät voi todistaa yhteyden kausaalista suhdetta. Yhteyden kausaalinen merkitsevyys on arviointikysymys, ja se on laajempi kuin mikä tahansa tilastollinen todennäköisyyden väite. Piirteen tai tekijän ja sairauden välisen yhteyden tai terveyteen vaikuttavan kausaalisen merkityksen arvioinnissa on hyödynnettävä lukuisia kriteerejä, joka yksinään ei ole sellaisenaan riittävä arvioinnin perusta.”

Komiteatyön seurauksena määrättiin poliittisesti, että tupakka aiheuttaa keuhkosyöpää ja tupakka-askeihin tuli varoituksia ja tupakkaa vastaan käytävät oikeustaistelut saivat perustelun ja ne alkoivat. Huom. satunnaistettu vertailukoe nähtiin keuhkosyövän tapauksessa epäeettiseksi!

Lääketieteellisissä tutkimuksissa (epidemiologia), kun haetaan parantavaa lääkettä tai hoitoa, käytetään myös pidempää ns. Hillin listaa, joka luettelee 10 tekijää, joiden olisi oltava voimassa, jotta tekijän muutoksen voidaan otaksua olevan seurauksen syy (kausaali) ja täyttävän parantavan lääkkeen tai hoitosuosituksen alustavat ehdot. Tämä ei yksin riitä, vaan aina lääkkeen tai hoitosuosituksen on läpäistävä sarja testejä/kokeita. Olisipa näin laadunparannustenkin osalta!

Hillin kausaalikriteerit:

  1. Vahvuus (vaikutuksen koko): Pieni assosiaatio ei tarkoita, että syy-vaikutusta ei olisi, vaikka mitä suurempi assosiaatio, sitä todennäköisemmin se on kausaalinen.
  2. Toistettava johdonmukaisuus: Johdonmukaiset havainnot, joita eri henkilöt ovat havainneet eri paikoissa eri näytteillä, vahvistavat vaikutuksen todennäköisyyttä.
  3. Erityisyys, spesifisyys: Syy-yhteys on todennäköinen, jos tietyssä paikassa on erityinen populaatio ja tauti, jolla ei ole muuta todennäköistä selitystä. Mitä tarkempi yhteys tekijän ja vaikutuksen välillä on, sitä suurempi on todennäköisyys syy-suhteelle.
  4. Ajallinen suhde: vaikutuksen on tapahduttava syyn jälkeen (ja jos syyn ja odotetun vaikutuksen välillä on odotettu viive, vaikutuksen on tapahduttava kyseisen viiveen jälkeen).
  5. Biologinen gradientti (annos-vastesuhde, yhteyden vahvuus): Suuremman altistumisen tulisi yleensä johtaa suurempaan vaikutukseen. Joissakin tapauksissa pelkkä tekijän esiintyminen voi kuitenkin laukaista vaikutuksen. Toisissa tapauksissa havaitaan käänteinen osuus: suurempi altistuminen johtaa alhaisempaan ilmaantuvuuteen.
  6. Selvyys: Todennäköinen syyn ja seurauksen välinen mekanismi on hyödyllinen (mutta Hill huomautti, että mekanismin tuntemusta rajoittaa nykyinen tieto).
  7. Johdonmukaisuus: Epidemiologisten ja laboratoriohavaintojen yhdenmukaisuus lisää vaikutuksen todennäköisyyttä. Hill kuitenkin totesi, että ”… tällaisen [laboratorio] näytön puuttuminen ei mitätöi epidemiologisia vaikutuksien yhteyksiä”.
  8. Koe: ”Toisinaan on mahdollista vedota kokeelliseen näyttöön”.
  9. Analogia: Analogioiden tai yhtäläisyyksien käyttö havaitun assosiaation ja muiden assosiaatioiden välillä.
  10. Palautettavuus: Jos syy poistetaan, vaikutuksen tulisi myös kadota

Laadun parantamisessa ja ongelmanratkaisussa hyvin harvoin, jos koskaan, käytetään edellä olevia arviointilistoja systemaattisesti. Liekö syynä laadun parannuksen lyhyt historia (Deming käytännössä aloitti 1981-) vai selkeä osaamattomuus! Ainakin viisi ensimmäistä olisi huomioitava. Henkilökohtaisesti tarkistan aina mielessäni (lue: epäilen) parannusratkaisua, jos poikkeamaa esiintyy erityisesti ensimmäisten 5 listalla olevan tekijän kohdalla – yhtäpitävyys, vahvuus, spesifisyys, ajallinen suhde ja johdonmukaisuus.

2. Kausaalisuuden määritys kokeellisesti

Edellä jo mainittiin satunnaistettu vertailukoe, joka antaa ratkaisun kausaation eli vaikuttavan syyn määrittämiseen ja projektien onnistumiseen. Tälle satunnaistetulle vertailukokeelle (koesuunnitelma) on lukuisia nimiä DoE, DE, Design of Experiments, Taguchi, Teollinen Koesuunnittelu, PDSA, PDCA, MVT jne.

Helsingin Sanomissa oli 29.2.2020 näyttävä artikkeli ”Rintojen omatarkkailun hyödyllisyys on myytti. Pitkään Suomessakin opetettu ja edistetty parannus osoittautui jopa vaaralliseksi luoden pelkoa, turhia tutkimuksia ja koepalojen näytteenottoa”. ”Muutos tapahtui, kun suoritettiin satunnaistettu suurtutkimus (koe). Tutkimuksessa oli mukana satoja tuhansia naisia ja tulokset olivat selviä: omatarkkailusta ei ole hyötyä rintasyöpäpotilaiden kuolleisuuden vähenemisessä.”

Koesuunnittelu on parantamisen (so. kausaalitutkimuksen) Graalin malja. Tämän muistamme ehkä Da Vinci koodi- elokuvasta. Graalin malja on mytologian mukaan ihmeitätekevä malja, joka parantaa kaikki sairaudet ja tuo rikkaudet. Näin myös yrityksille, jotka tästä maljasta pääsevät nauttimaan. Lean Six Sigma on kausaalitutkimusta, joka on rakennettu kausaalisuuden ja koesuunnittelun ympärille.

Mikä on satunnaistettu vertailukoe?

Satunnaistettu vertailukoe on tieteellinen koe, jolla ”kuulustellaan” luontoa, prosessia. Kokeen tarkoituksena on paljastaa kausaalit syytekijät. Paljastamista vaikeuttavat sekoittavat (confounding) tekijät. Tri R. A. Fisher kehitti satunnaistetut vertailukokeet 1923-24 Rothamstadissa Englannissa. Tämän seurauksena viljojen satoisuudet kasvoivat valtavasti kaikkialla maailmassa. Suomessa murros tapahtui 1940-50-luvulla.

Satoisuustutkimus
Kuva 6. Tri R A. Fisher ja satoisuustutkimus. Vasemmalla Suomen ohran ja vehnän hehtaarisatojen kehitys 1871-lähtien. Satoisuus kasvoi Suomessa 3-4 kertaiseksi/hehtaari 1940-luvulta lähtien. 1800-luvulla siemeniä laitettiin hehtaarille n. 800 kg/ha ja nyt n. 150-180 kg/ha eli satoisuus on parantunut siementasolla 1,2:sta 25:een. Huomaa 1930-luvulla vallinneet poikkeukselliset erittäin lämpimät sääolosuhteet kuten nyt tällä hetkellä!

Fisher oivalsi, että epävarma vastaus oikeaan kysymykseen on parempi kuin varma vastaus väärään kysymykseen. Tämän oivalluksen pitäisi jokaisen tuottavuuden- ja laadunparantajan kokea.

Satunnaistamisesta saadaan kaksi merkittävää etua. Satunnaistaminen –

  1. poistaa sekoittajavinoutuman (confounding)
  2. määrittää epävarmuuden

Tutkitaan satunnaistettua vertailukoetta Fisherin viljelyesimerkillä (esimerkin antanut J. Pearl). Piirretään kausaalikaavio, malli, miten kunkin kuvassa 6 esitetyn viljelylohkon sato määräytyy normaaleissa olosuhteissa. (kuva 7). Yrityksessä voit ajatella, että Sato = voitto tai tuotantomäärä, jakso/läpimenoaika jne. ja Lannoite = Six Sigma -parannus tai joku Lean-työkalu (5S, Kanban, Andon, SMED). Kuvan 7 ylärivillä erilaisia yrityksen asioita ja olosuhteita! Sama analogia sopii COVID-19-viruksen aiheuttamaan sairastumiseen.

Kausaalikaavio
Kuva 7. Kausaalikaavio lannoitteen ja muiden tekijöiden vaikutuksesta satoon. Tekijät vaikuttavat niin lannoitteeseen kuin satoonkin ”hallitsemattomasti”.

Viljelijä (tai sinä) päättää jollain perusteella (uskomus, arvaus), mikä lannoite (Lean-työkalu, Six Sigma -parannus) on paras kullekin lohkolle (yritykseen, työpaikalle, koneeseen). Viljelijä asettaa (kausaali) kysymyksen: ”Mikä on sato (=voitto), kun käytän lannoitetta 1 (lannoitteen 2 asemasta) tasaisesti koko pellolla?” Kausaalilaskennalla kysymys voidaan ilmaista ehdollisena todennäköisyytenä tee-operaattorilla (Tee= do (eng.). P(sato|tee(lannoite=1)) tai yritysmaailmassa P(voitto|tee(parannus).

Jos viljelijä tekee kokeen naivisti käyttämällä lannoitetta 1 pellon rinneosaan ja lannoitetta 2 laakso-osaan, sekoittajaksi nousee ilmeisesti ojitus. Jos hän käyttää lannoitetta 1 yhtenä vuotena ja toisena lannoitetta 2, sekoittajaksi nousee luultavasti sää. Molemmissa tapauksissa vertailu on vinoutunut ja tulos väärä. On esitetty väärä kysymys. Löydät yrityksestäsi (prosessista) varmasti verrannolliset tapaukset. Sekoittavia tekijöitä on valtavasti – kaikki ideoimasi ja luettelemasi syyt ja paljon muita.

Miten vinouma, sekoittuminen, poistetaan? Kuvan 8 malli esittää maailmaa, josta viljelijä haluaa tietoa. Miten lannoite vaikuttaa satoon? Tässä kaikki lohkot saavat lannoitetta=1.

Ideaalitilanne, jolla voidaan lannoitteen vaikutus satoon määrittää ilman vinoumia ja sekoittumista
Kuva 8. Ideaalitilanne, jolla voidaan lannoitteen vaikutus satoon määrittää ilman vinoumia ja sekoittumista

Tee-operaattorin vaikutuksesta kaikki Lannoitteeseen kohdistuvat nuolet katoavat ja pakottavat tämän muuttujan erityiseen arvoon (Lannoite=1), koska viljelijä on päättänyt käyttää Lannoitetta 1 riippumatta muista osioista. Tee-operaattori kuvaa interventiota.

Miten satunnaistaminen vaikuttaa tilanteeseen? Joihinkin lohkoihin kohdistetaan tee(lannoite=1) ja muihin tee(lannoite=2) niin, että kunkin lohkon lannoite valitaan satunnaisesti. Yrityksessä tietysti ei normaalisti ole pellon tapaisia lohkoja, mutta ajan voi lohkoa viikon päiviksi ja päivän tunneiksi, työntekijät voi lohkoa, koneet voi lohkoa, asetukset voi lohkoa jne. Koesuunnittelussa tätä kutsutaan lohkomiseksi, blocking.

Tällöin satunnaistettu muuttuja (Lannoite) saa arvonsa satunnaislaitteella, vaikkapa Fisherin korttipakalla. Fisher käytti korttipakkaa satunnaistajana! Minitab-ohjelma käyttää satunnaisgeneraattoria, mutta korttipakkakin käy tai arpanoppa!

Satunnaistettu koe.
Kuva 9. Satunnaistettu koe. Satunnaistetaan lannoite joko 1 tai 2 esimerkiksi korttipakan korteilla (punaista/mustaa). Kokeella voidaan kuvata ideaalitilannetta ja poistaa vinoumat ja sekoittuminen.

Lannoitteeseen osoittavat nuolet on poistettu. Tämä kuvaa tilannetta, että viljelijä kuuntelee vain ”korttipakan kortteja” päättäessään kumpaa lannoitetta lohkolla käytetään. Yhtä tärkeää on myös, että ”kortista” ei ole nuolta Satoon, koska kasvit eivät osaa lukea kortteja. (Ihmiskokeissa tämä on vakava huomio. Lääkettä annettaessa potilas osaa lukea lääkkeen antajaa. Siksi antaja ei tiedä myöskään, onko lääke lume vai ei. Tätä kutsutaan Satunnaistetuksi kaksoissokkokokeeksi)

Yllä oleva malli kuvaa tilannetta, jossa Lannoitteen ja Sadon välinen sekoittuminen on purettu (eli Lannoitteella ja Sadolla ei ole yhteistä syytä, common cause). Tämä tarkoittaa, että suureen Lannoite=1 näkeminen (assosiaatio) ja suureen Lannoite=1 tekeminen (interventio) on nyt sama asia. Ydinsanoma on: satunnaistaminen on keino simuloida yllä olevaa ideaalimallia (kuva 8) ja muuttaa interventio assosiaatioksi. Satunnaistaminen poistaa vanhat sekoittajat tuomatta tilanteeseen uusia sekoittajia.

Tunnemme tämän kokeen/testin hypoteesitestauksena tai OFAT-kokeina (One Factor At the Time, Yksi tekijä kerralla). Minitab 19 -ohjelmassa on erinomaiset hypoteesitestauksen ohjeet ja analyysi. Ohjeita on syytä myös noudattaa!

Yksimuuttujakokeet eli hypoteesitestaus (Minitab 19, Assistant)
Kuva 10. Yksimuuttujakokeet eli hypoteesitestaus (Minitab 19, Assistant)

Edellä kuvattu lannoitekoe (malli) voidaan toteuttaa muillakin tavoilla. Toinen tapa simuloida tilannetta niissä tapauksissa, joissa sekoittavat tekijät tunnetaan. Tällöin mitataan sekoittavat tekijät ja vakioidaan tulokset niiden suhteen. Ylensä tämä tapahtuu parittaisen kokeen muodossa, kuvassa Paired t-testi. Tätä tekniikkaa Judea Pearl kutsuu takaoven tekniikaksi.

Satunnaistamisella (kokeella) on se etu, että se katkaisee jokaisen satunnaistettuun muuttujaan tulevan linkin, myös ne, joita emme tiedä tai osaa mitata (kuvissa ”Muut tekijät”). Minitabin ensimmäisenä ohjeena parittaiselle kokeelle on: ”Kerää kohteista satunnaiset näytteet ja testaa jokainen näyte kahdessa eri olosuhteessa”.

Kolmas tapa on käyttää koesuunnittelumatriiseja (DOE, Taguchi), ns. ortogonaali-matriiseja, joilla ohjataan (lohkotaan, block) kaikkia kriittiseksi oletettuja syytekijöitä niin, että tekijät ovat ”lähes” toisistaan riippumattomat. Kyseessä on siis laajennettu satunnaistettu yksimuuttujakoe. Koe on monimuuttujakoe. Tällä kokeella saadaan sama hyöty kuin yksimuuttujakokeella tehokkaammin, mutta myös paljon muuta. Teollisuudessa ja palveluissa kokeet tehdään yleensä monimuuttujana ortogonaalimatriiseilla (DoE, Taguchi).

Kuvassa 11 on Minitabilla luotu satunnaistettu monimuuttujakoe L8-matriisilla, jossa sekoittavat tekijät on lohkottu ja asetettu ”kohtisuoraan” toisiaan vastaan. 8 ennalta määriteltyä lohkoa (standardi järjestys) on satunnaistettu (run order) ja mitattu sato.

Satunnaistettu viljelykoe (DoE) ja tekijöiden vastekuvat (vaikutukset).
Kuva 11. Satunnaistettu viljelykoe (DoE) ja tekijöiden vastekuvat (vaikutukset). Vain lannoite vaikuttaa satoon. Lannoite 2 parantaa satoa! Vastekuvaajan punainen ympyrä.

Itse asiassa DOE:ssa on kyse yksimuuttujakokeen laajennuksesta moneen muuttujaan, joilla voidaan samanaikaisesti tutkia ei vai lannoitteen vaikutusta vaan kaikkia mahdollisia tekijöitä ”lähes” riippumatta toisistaan.

Koesuunnittelumatriisit ovat rakenteeltaan vähän kryptisiä, mutta jos ymmärtää ja uskoo, että niillä estetään tiettyjen tekijöiden sekoittumista keskenään ja voidaan määrittää vaikutus (interventio) ja epävarmuus, niin jo tällä tiedolla voi niitä käyttää, jos on hyvä softa avustamassa. Matemaattinen todistus on vaativaa. Katso artikkeli Onko DSD-koesuunnitelmat vuosisadan merkittävin parannus- ja koesuunnitteluinnovaatio?, jossa olen esitellyt ja vertaillut uusimpia matriiseja.

Seuraavissa artikkelissa on esimerkkejä (11) kokeista (kausaalitekijöiden, syiden) määrittämisestä:

  1. Koesuunnittelu – Tehokas prosessin sekä datankeräys- ja analysointimenetelmä  
  2. Robust Design Simplified
  3. Avain parannukseen ja innovaatioihin vaihtelua pienentämällä
  4. Lean Six Sigma ja simulointi
  5. Muutanko yhtä tekijää vai useita tekijöitä? OFAT vai DoE?
  6. Kokeilua vai koetoimintaa?
  7. Kumpi auto on parempi – Käytännön ongelman ratkaiseminen Six Sigman avulla  
  8. Prosessin ja työkoneen säätäminen ja asettaminen – OSA III  
  9. Lean Six Sigma, suorituskyky ja monimuuttujakokeet 
  10. Prosessin ja työkoneen säätäminen ja asettaminen – OSA IV  
  11. Yritys ja erehdys vai koe? – Kokeellinen vanukas

Koesuunnittelumatriisien etuna on, että voimme selvittää useiden tekijöiden kausaalivaikutuksen samanaikaisesti (simuloida interventiota ja muuntaa se assosiaation tasolle, jossa voidaan käyttää ”normaalia” tilastotekniikkaa) ja optimoida tuloksen kaikkien tekijöiden suhteen samanaikaisesti ja vieläpä useiden ulostulomuuttujen osalta. Tämän mahdollistaa optimointi valikko ja Derringerin linkfunktio (Minitab Optimizer-valikko).

3. Kausaalisuuden määritys kausaalilaskennalla

Tri Judea Pearl (2000) on kehittänyt menetelmän, jossa joissain tapauksissa voidaan kerätystä assosiaatiodatasta määrittää tekemisen eli intervention (=kausaalisuuden) vaikutus. Hän kutsuu tätä ”Syyn ja Seurauksen uudeksi tieteeksi” tai ”Kausaatiomullistukseksi”. Hän sai tästä kehitystyöstä erittäin arvostetun Turing-palkinnon 2011 (Tietojenkäsittelyn ” Nobel palkinto”). Tohtori Judea Pearl toimii Kalifornian Yliopiston tietojenkäsittelyn professorina.

Tekoälyn (AI, Artificial Intelligence) kehittyminen vaatii kausaatioportaiden toisen askeleen eli intervention (tekemisen) ratkaisemista ilman koetoimintaa. Ratkaisu vaikuttaa olevan vielä kaukana, mutta ehkä sitä kohden lähestytään kausaatiolaskennan avulla. Kausaalilaskenta muuntaa tekemisen näkemiseksi. Vasta tämän jälkeen voidaan aidosti puhua tekoälystä ja sen kyvystä parantaa hyvinvointia/tuottavuutta.

Kausaatiolaskennassa on kolme sääntöä, joilla tekeminen (tee-operaatio) voidaan muuntaa näkemisen eli assosiaation tasolle, jossa tekoäly toimii.

1. Sääntö 1. sanoo, että kun havaitaan muuttuja W, joka on epäoleellinen suhteessa Y:n (mutta mahdollisesti ehdollinen suhteessa muihin muuttujiin z), niin Y:n todennäköisyysjakauma ei muutu.

P(Y|tee(X), Z, W) = P(Y|tee(X), Z).

2. Sääntö 2 muunnos tulee takaoven kriteeristä. Jos joukko Z tukkii kaikki takaoven polut X:stä Y:n, niin tee(X) on sama kuin näen (X) ehdolla Z.

P(Y|tee(x), Z) = P(Y|X, Z)

3. Sääntö 3 on yksinkertainen: se sanoo olennaisesti sen, että voimme poistaa tee(X) lausekkeesta P(Y|tee(x)) aina kun Y:n ei ole kausaaleja polkuja

P(Y|tee(X)) = P(Y)

Näillä laskentakaavoilla voidaan kausaalisuuden todistamisessa vaadittava interventio (tekeminen=koe) muuntaa joissain tapauksissa näkemisen (assosiatio=satunnainen havaintoaineisto) tasolle. Vaaditaan kuitenkin edeltä käsin oleva kausaalimalli. Tri Judea Pearl antaa esimerkin tupakoinnin-tervan-syövän ja genomityypin mallin, jolla tupakointi voidaan muuttaa tervan väliaineen kautta syöväksi ja tämä voidaan todistaa ilman koetta. Ehkä tämä voidaan toteuttaa myös COVID-19-viruksen immuniteettivasteen kautta. Huomaa, että kuvaan piirretty kysely sisältää do-operaattorin (tee-operaattori) ja estimandista kyseinen do-operaattori on voitu poistaa edellä olevilla säännöillä.

Intervention muuttaminen assosiaation tasolle tee-laskennan avulla. Esimerkki tri J. Pearl (2018)
Kuva 12. Intervention muuttaminen assosiaation tasolle tee-laskennan avulla. Esimerkki tri J. Pearl (2018)

Jos tervaa (kuva 12) ei ole väliaineena, on käytettävä Hillin listaa, jos ei haluta satunnaisesti valita esim. 2000 henkilöä, jotka koko elämänsä polttavat tupakkaa tietyn määrän ja 2000 henkilöä, jotka eivät polta (satunnaistettu kaksoissokkokoe). Koe on epäeettinen ja altistaa koehenkilöt mahdolliselle kuolemalle!

Yhteenveto

Kausaalin syyn löytäminen tai tunteminen on ehdottoman tärkeää minkä tahansa työn suorittamiselle ja onnistumiselle. Kirveestä ja klapista, jonka näemme, ei voi tilastollisesti päätellä, että iskemällä kirveellä klapiin (tekemällä), se halkeaa! Olemassa oleva numeerinen tila ei anna informaatiota kausaalisuudesta, vaikka usein niin uskotaan. Tilastotekniikat, numeerinen olosuhde ja analyysi, kertoo assosiatiivisella, näkemisen tasolla asioita.

Sekä Lean että Six Sigma perustuvat ensi sijassa interventioihin, muutoksiin, jotka tehdään yritykseen, prosessiin, työmenetelmiin jne. Ennen kuin interventiota voidaan käyttää, on sen vaikutus tunnettava ja todistettava vaikutuksen muutos todelliseksi parannukseksi. Vaikutus voidaan löytää testin/kokeen avulla (ja ehkä myöhemmin myös interventiolaskenta).

Kausaalitutkimus (analyyttinen tutkimus) ei pelkästään sisällä koetta, vaan myös syytekijöiden etsimisen, mittausjärjestelmän, luokittelun, analysoinnin ja itse kokeen ja tuloksen valiioinnin jne. Tri Mikel Harry muotoili tämän loogisen suodattimen eli DMAIC-muotoon ja Toyotan (Kakuro Amasakan) N7, MA, DE prosessiksi. Yksi ja sama asia!

Six Sigman looginen suodatin ja Toyotan käyttämä parannusmenetelmä (Amasaka)
Kuva 13. Six Sigman looginen suodatin ja Toyotan käyttämä parannusmenetelmä (Amasaka)

Leanin osalta luotetaan ehkä liikaakin ”Lean-parannustyökalujen” toimimiseen kaikissa olosuhteissa ilman testausta ja kokeita. Päteekö edellä mainitut 5 kohtaa Lean-parannukseen? Leanissa korostetaan korostamatta päästyä testausympyrää, PDCA:ta (koeympyrä), mutta käytännössä näyttää siltä, että Check-vaiheella tarkoitetaan virheellisesti, että esim. työkalu on otettu käyttöön. Lapsi on heitetty pesuveden mukana pois! PDCA:n tarkoituksena on tarkistaa, että suunniteltu etukäteen lausuttu parannustavoite (Plan) toteutuu/ei toteudu ulostulossa siis Lean-työkalu vaikuttaa. Jos muutos on liian pieni tai väärään suuntaan, työkalu (parannus) hylätään tai yritetään uudestaan. Leanissa PDCA on sekoitettu SDCA:n, jossa Standardia (S) sovelletaan (D) ja soveltaminen varmistetaan (C) ja ryhdytään toimenpiteisiin (A) eli otetaan menettely (standardi, etukäteen hyväksi todistettu) käyttöön.

Hyvä, mutta naiivi esimerkki PDSA/PDCA-parantamisesta on lottoaminen. Suunnittelet (P) rikastuvasi, täytät kupongin ja valitset (D) 7 ”kausaali”numeroa. Arvonta suoritetaan. Tutkit (S) tai tarkastat (C) lottorivin. Jos on voitto, menet kassan kautta (A) ja kuittaat rahat. Jos ei ole voittoa, häviät (A) rahat (omat/yrityksen) ja ehkä yrität uudelleen uusilla numeroilla (P) … ja parantamisen ympyrä pyörii! Parannus on onnistunut, kun kuittaat rahat.

Lean Six Sigmassa ei edellä olevaa Leanin kaltaista ”sekaannusta” esiinny. Koe ja validointi sisältyvät DMAIC-prosessiin. Kuva 13. Siksi Lean Six Sigma tulokset ovat erinomaiset. (Katso kirja Lean Six Sigma 2.0 ja Laatuteknologia tai artikkeli Suomalainen Laatu 2020). On viitteitä, että myös Lean Six Sigman yhteydessä jotkin kouluttajat ovat ohjelmissaan ohittaneet varmentavat kokeet ja testit ja hukanneet ”lapsen”!

Liian usein parannukseen pyrittäessä unohdetaan tai ei tiedosteta, että näkemisen tasolla ilmaistut syyt eivät välttämättä ilmaise kausaalia syytä, joka muuttaa ulostulon parannukseksi. Pahimmassa tapauksessa hyvää tarkoittava parannus muuttuu vaaralliseksi ja tuhoisaksi yrityksen ja yksilön kannalta. Parannus vaatii AINA testin/kokeen.

Toivottavasti joskus koittaa aika laadunparannuksessakin, että parannusta ei saa toteuttaa ennen kuin on testillä/kokeella todistettu parannus kuten lääkkeiden ja hoitojen osalta jo nyt on käytäntö (kansainväliset sopimukset, lait ja määräykset).

Lähteet:

  1. Gerald J. Langley, Ronald D. Moen, Kevin M. Nolan, Thomas W. Nolan, Clifford L. Norman, Lloyd P. Provost: The Improvement Guide – A Practical Approach to Enhancing Organizational Performance, Second Edition (2009)
  2. W. Edwards Deming: On the classification f the problems of statistical inference. Journal of the American Statistical Association, 1942
  3. R, Moen, T. Nolan, L. Provost: Quality Improvement trough Planned Experimentation, 2012
  4. R.A. Fisher: Statistical Methods Experimental Design and Scientific Inference, 1935
  5. G. Derringer, R. Suich: Simultaneous Optimization of Several Response Variables, JQT, 1980
  6. Judea Pearl: Causality-models, reasoning and interference, 2000, 2009
  7. Judea Pearl, Dana Mackenzie: Miksi – Syyn ja seurauksen uusi tiede, 2018
  8. Kakuro Amasaka: Science SQC, New Quality Control Principle – The Quality Strategy of Toyota (2004)
  9. Tanja Karjalainen, Eero Karjalainen: Lean Six Sigma 2.0 ja Laatuteknologia (2020)
  10. Suomalainen Laatu 2020

Kommentoi artikkelia

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *

Tilaa uutiskirje

Liity postituslistalle ja saat uusimmat artikkelit suoraan sähköpostiisi.