Mitä pitäisi ymmärtää datasta - tilastoista? OSA II

Julkaistu 13.02.2009    Kirjoittanut Eero E. Karjalainen  Tilaa RSS


Eletään informaatioaikakautta, on olemassa dataa – tietoa – numeraalisessa ja ei-numeraalisessa muodossa, josta pitäisi päätellä jotain. Katsot mihin tahansa, ympärilläsi on vuorittain – gigatavuja – dataa. Mark Twain sanoi aikoinaan, että vale, emävale ja tilasto. Valehteleeko tilasto vai tulkitseeko numeronaivi tilastosta kohinan singaaliksi? Kuinka välttyä informaation käyttössä tältä harhalta? Tämä kysymys on tärkeä kaikissa datan käyttötarkoituksissa.

epvarmuuden_kasvaminen_ja_laatuteknologian_rooli_epvarmuuden_pienentmisess.jpg

Kuvassa 1 on kuvattu punaisilla pylväillä tiedon epävarmuuden kasvu käyttökohteen mukaan. Sininen käyrä kuvassa on kuvaa oikein käytetyn laatuteknologian tumaa vaikutusta tiedon laatuun.

 

Varmista datan oikeellisuus

Organisaatioissa ja yrityksissä on kerätty, kerätään ja parasta aikaa mietitään, kuinka kerättäisi tietoa ja dataa toiminnasta ja/ tai prosessista.

Datan täytyy olla oikeaa dataa,

  1. dataa täytyy pystyä analysoimaan ja esittämään ymmärrettävällä tavalla, ja
  2. tuloksia saa tulkita vain siinä "ympäristössä, kontekstissa", josta alkuperäinen data on otettu/vedetty.

Tiedon luotettavuutta käsiteltiin artikkelisarja osassa yksi. Artikkeli: Mitä pitäisi ymmärtää datasta – tilastoista – Osa I?

 

Analysoi ja osaa analysoida – vain signaalista voi oppia!

Edistys ja kehitys perustuvat viimekädessä vertailuun, kahdesta tai useammasta hyvästä on valittava parempi! Asiakas vertailee ja valmistaja vertailee! Mikä tuote on parempi? Mikä konstruktio on parempi? Mikä materiaali on parempi? Mikä tuotantomenetelmä on parempi? Mikä tuotantokone on parempi? Mitkä asetukset ovat paremmat? Vertailua, Vertailua!

Toiminnan ja laadun parantamisessa ja haetaan vaihtoehtoja ja tehdään vertailua valitaksemme parempia vaihtoehtoja ja varmennamme, että olemme onnistuneet vertailussa?

Tuotekehityksessä ja tuotannossa käytetään yleisesti hyvin kallista ja tehotonta yksimuuttuja vertailua DoE:n sijaa. Mitä vertailu taktiikka sinä käytät? Hallitsetko monimuuttujatekniikat – DOE?

 

Taulukossa 1 on kuvattu suunnitellun kokeen tuoma hyöty. Käytännössä tämä tarkoittaa dramaattista kehitysnopeuden kasvua. Vasemmassa laidassa tutkittavien tekijöiden määrä, keskellä perinteisesti tehtävien kokeiden määrä ja oikealla DOE tekniikalla tehtävien kokeiden määrä.

ofat_doe.jpg

Vertailujen tuloksena syntyy dataa - tilastoja. Nämä tilastot ovat käytännössä tuotantoraportteja, vuosiraportteja, tutkimustuloksia, prosessidataa, käyttäytymisdata, mitä tahansa tietoa. Maailma käyttäytyy nykytieteen tuntemuksen mukaisesti niin, että vain harva data pitää sisällään informaatiota – signaalia. Signaalia on vain harvassa datassa (n. 2 %), mutta kohinaa sisältää kaikki data (n. 98 %).  Kuvassa 2 punaiset pisteet ovat signaaleja ja mustat pisteet edustavat kohinaa. Seuraus tästä realiteetista on, että milloinkaan voida tehdä järkeviä päätöksiä, ennen kuin suodatetaan pois KOHINA. Ensisijainen työkalu tässä suodatuksessa on yksinkertainen SPC -kortti, joka tunnetaan nimellä I-mR eli Individual -kortti.

imr.jpg

Kuvassa 2 on SPC:n ohjauskortti, jonka avulla on luokiteltu datasta signaali ja kohina toisistaan. Mustat pisteet ovat kohinaa ja punaiset pisteet ovat signaaleja. I-mR kortilla on laajat käyttökohteet ja se on yksinkertainen ja tehokas työkalu käytännössä.

 

perapeili2.jpgJos emme suodata kohinaa pois voimme, voimme tulkita rutiini vaihtelun eli kohinan signaalina! Tämä on tyypillinen tilanne aamu- viikko- kk-palavereissa sekä neljännes- ja vuosikatsauksissa, jossa tutkitaan ja verrataan kuinka on mennyt. Liki 98 % organisaatiossa tulkitaan tätä kohinaa! Huomatkaa, jos tulos poikkeaa halutusta – kuten budjetti tai tavoite – se ei tarkoita välttämättä, että ko. tapaukselle voitaisiin löytää selvittävä tekijä. Jos teemme näin, päädymme lopulta kuvaamaan tapahtunutta muutosta olemattomilla syillä, joka vääjäämättä johtaa siihen, että selityksemme ei ole sen todellisuuden mukainen, jossa työskentelemme. 

 

Toisaalta jos ajatellaan, että vaihtelu on vain rutiinia eikä erottele rutiinivaihtelua poikkeuksellisesta vaihtelusta, päädytään lopulta hukkaamaan signaalin. Tämä johtaa, että ei ymmärretä ongelmaa ja menetetään mahdollisuus oppia. Tässä tapauksessa kehitys hidastuu ja jäädään jälkeen, jos kilpailijat hallitsevat tämän. Tämä on tyypillistä edellä esitetyissä foorumeissa, kun ollaan lähellä tavoitetta, ei huomata mahdollista muutosta. 

MARK_TWAIN.jpgTulosten vertailun analyysissä voidaan tehdä kaksi erhettä, kun tulkitaan dataa:

  • Tulkitaan kohina signaaliksi ja ajaudutaan selitykseen, jota ei ole
  • Tulkitaan signaali kohinaksi ja epäonnistutaan oppimisessa, mitä pitäisi oppia 

Seuraus näistä kahdesta erheestä, jossa sekoitetaan signaali kohinaan ja kohina signaaliin, on perustavaa laatua, aina ja kaikissa muodoissa data-analyysiä. Analyysi vaatii tämän erottelun ja jokainen yritys tulkita dataa ilman analyysiä on osoitus numeerisesta NAIVIUDESTA.

Valitettavasti on olemassa valtavasti NUMERONAIVEJA. Ongelma on, että nämä ihmiset eivät tunnista tätä piirrettä itsestään. He ajattelevat, että koska he osaavat laskea, he ovat päteviä tulkitsemaan dataa. Heidän ajattelunsa voi summata ”Kaksi numeroa, jotka eivät ole sama, ovat eri!” Tämä osaamattomuus johdon ja kehitysihmisten yhteydessä johtaa merkittäviin epäonnistumisiin. Usein ylistetään heitä onnistumisista ja markkinoiden analysoinnista, mutta voisiko olla kysymys markkinoista, valtionvarainministeriön onnistumisesta eli kysynnästä vai todella osaamisesta?

Tämä tiedostamaton naiviuden teoria kääntää kaiken signaaliksi, kaksi pistettä muodostaa aina trendin, ja selityksiä vaaditaan kaikista (ei-toivottavista) kohinoista tuotanto-, laatu-, viikko- tai kuukausiraporteissa.

Ensimmäinen askel välttää numeerinen naivititeetti on ymmärtää data analyysin kahden erheen luonne.

Erhe I: Tulkitsemalla kohinan aikaansaama rutiini vaihtelu niin kuin se olisi prosessin muutossignaalin aikaansaama, vaikka se tosiasiassa on virhe signaali.

Erhe II: Ajattelemalla, että tutkittavan prosessin muutossignaali on vain pelkkää rutiinivaihtelun kohinaa, menetetään signaali.

 

Alla olevassa taulukossa 2 on esitetty päätöksentekomatriisi ja erheet 1 ja 2.

taitelu_oikeiden_ja_vaarien_paatosten_valilla_.jpg

 

  • Voit olla tekemättä erheen I kieltämällä kaiken, joka on signaali ja toisaalta – jäät kotiin, että ei satu mitään, mutta kuolet kuitenkin
  • Voit olla tekemättä erhettä II yksinkertaisesti tulkitsemalla kaiken signaaliksi – ostat, myyt, teet kaikkea mitä mieleen tulee ja onnistut sekä pyrit unohtamaan epäonnistumiset

 

”Temppu” on balansoida kahden erheen välillä suodattamalla rutiinivaihtelun kohinaa pois niin, että voimme havaita potentiaalisen signaalin datastamme. Tämä on oleellista kaikille tehokkaille data-analyyseille.

shewhartart.jpgLuotettavuusvälit, hypoteesitestit, regressiotekniikat ja tietysti DoE on suunniteltu ”puristamaan” viimeinenkin pisara kiinteästä ja äärellisestä määrästä koedataa (DoE). Todennäköisyysmallit ja kriittiset arvot on tarkoitettu ”terävöittämään” analyysejä niin, että kohtuullisen suurta signaalia ei hukata.

Toisaalta vastakohtana koedata-analyyseille (toiminnan tuloksena syntynyt data) on prosessin käyttäytymistä kuvaavat käyrät (SPC kortit), jotka erottelevat potentiaalisen signaalin todennäköisestä kohinasta käyttämällä geneeristä (kaiken kattavaa) ja kiinteää kolme-sigma rajaa analyysipohjana. SPC kortit ja niihin liittyvät menettelyt ja tekniikat ovat ainoat jatkuvan operaation/tuotantodatan analyysimenetelmät. Kaiken lisäksi SPC sallii suorittaa tämän erottelun käyttämällä dataa, joka on saatu olemassa olevasta prosessin tilasta ilman että tarvitsee tehdä mitään erityisiä kokeita tai tutkimuksia.

Seuraavassa artikkelissa jatketaan aihetta ja käsitellään tarkemmin tiedon keräämistä, analysointia, tulkintaa ja omaksuntaa. Jos analysoit oikein, tulkitset oikein, mutta jostain syytä et pääse haluttuun tulokseen, missä vika?

 

Otamme mielellämme vastaan kommentteja.

 

antti_uusi.jpg   eerooikee2.jpg
Antti Piirainen            Eero E. Karjalainen

 

Lue tästä muut artikkelisarjan osat: 

Osa I

Osa III

Osa IV

Kommentoi

(Sähköpostiosoitettasi ei julkisteta.)
Syötä kuvassa näkyvät kirjaimet ja numerot.
Captcha Code

Klikkaa kuvaa nähdäksesi uuden koodin.

    Tagipilvi

    muutosOpettaminenlaadunohjauskalanruotoBOKSPCJatkuva parantaminenHall of FameDOEluotettava mittauslaatuParetoSPC-korttiToyotalaadunkehittäjäkoulutusjitISO 9001:2015Lean Six Sigma Black BeltPDSA-ympyräjärjestäminenlajitteluTQMstabiiliMinitab 19FeigenbaumqfdtyökaluthypoteesitestausmenetelmätarvovirtajaksoaikaSigmaROILaatujärjestelmäLaatukonferenssiSix SigmaVOCsatunnainen vaihtelulaatu ratkaiseeCTPpuhdistaminendatan käsittely5W2H datan laaturyhmätyöskentelyparannustoimintaMinitab 18mittaaminenasiakastyytyväisyysvaihteluohjaussuunnitelmadataKingmanin yhtälöparannuksen johtaminenneukkarikoeLean Six Sigmaerityissyymuutoksen tuskasysteemiacceptance samplinglainalaisuudettehollinen aikaBig DatatilastonollavirhehypoteesitestiMSAtoleranssiShewhartCDAtilastomatematiikkatehdasfysiikkat-testiTPMdatan käsittelyHarryparannusmalliasiakastyytyväisyysGageMinitabparannuskausaliteettikvantitatiiviset menetelmätsuorituskykymittaritjohtamisjärjestelmäoperaatiotutkimusCombanion by MinitabASQpäämäärämalliShingovalvontaCTQ5SkorrelaatiolaatutaulutEDAprosessiFMEAjidokahävikkifunktiomonimuuttujatestiBalanced Scorecarddatan luokitteluBody of KnowledgeTOCL8-matriisistandardointimittausprosessihistogrammitoiminnan laitlaatutyökalutOpetusmenetelmätlaadunparannusoeesekoitekoePDSAtehokkuusreunaryhmittelykaaviouutiskirjeasiakasCrosbyinnovaatioparannustoiminnan kehittyminentilastollinen päätöksentekoBlack Beltlaatu Suomessa0-virhekuvaaminenriskinkartoitusLean-taloDFSSKingmanFactory PhysicsOhnosyy-seurauskaavioISO 9000ongelmanratkaisuDemingkustannussäästöthukan muodotennustaminenDesign of ExperimentsvuodiagrammitäystekijäkoeLean-visioValue Stream MappingDemonstraatiotTaguchiANOVATPSmixtureparantaminenLittlen lakiTätä on LeanregressioanalyysimittavirhePDCAmielenmallit8DlaadunhallintaDMADVtekoälyAsiakastarveMonte CarloWheelertiedonkerääminenhyväksymisnäytteenottoControl PlanISO 9001parannusmenetelmäDesign for Six SigmaHukkaLeanIATFarvovirta-analyysiturvallisuusMarkkinointiprosessitoiminnan lainalaisuudetohjauskorttiJohtaminenMarkkinointisitoutuminenkoesuunnitteluIATF 16949LaatutyökalutDSDIshikawaOFATVSMgurutKaizenKatasatunnaissyyaivoriihiLean HandbookpaloautopeliohjausprosessikuvausideointiDMAICvaihtelun vaikutusJuranriskimalliGage R&Rdatan keräysmonimuuttujakoeläpimenoaikadata-analyysidatan käsittelyarvovirtakuvausTuottavuusKaikakumittaussysteemi

    Arkisto