Kuinka lähestyä tiedon - datan - keräämistä?

Julkaistu 04.01.2008    Kirjoittanut Antti Piirainen  Tilaa RSS


Jos kaikki datajoukon datat eivät ole kerätty yhdenmukaisella tavalla,

data-arvot eivät ole vertailukelpoisia keskenään!

Mitattiinko tuotetta/prosessia tänään samalla tavalla kuin eilen tai viime vuonna!

- D.J.Wheeler –

 

Organisaatioissa ja yrityksissä on kerätty, kerätään ja parasta aikaa mietitään, kuinka kerättäisi tietoa ja dataa toiminnasta ja/ tai prosessista.

Mitä olisi hyvä ottaa huomioon, ennen kuin alat keräämään dataa, jotta keräämääsi tieto/dataa voidaan hyödyntää?

Osaatko vastat seuraaviin kysymyksiin:

  • Mikä on tiedon/datan keräyksen tarkoitus ja tavoite?
  • Ketkä käyttävät dataa?
  • Kuinka he käyttävät dataa?
  • Kuka hankkii datan?
  • Mitä ehtoja datankeräykselle on asetettava?, jne…

Tohtori Donald J. Wheeler on kirjoittanut datan keräämisestä, tiedon luotettavuuden arvioinnista ja sen analysoinnista pari vuosikymmentä erinomaisia kirjoja, joita löydät www.laatutieto.fi sivulta.

Hän on tiivistänyt nämä kysymykset seuraaviin kolmeen perustavaa laatua olevaan ehtoon:

  1. Datan täytyy olla oikeaa dataa,
  2. dataa täytyy pystyä analysoimaan ja esittämään ymmärrettävällä tavalla, ja
  3. tuloksia saa tulkita vain siinä ”ympäristössä, kontekstissa”, josta alkuperäinen data on otettu/vedetty.


Muutama sana ehdoista:

  1. Oikea data tarkoittaa, että data ei saa sisältää virhettä tai ainakin virheen määrä on tunnettu ja oikeassa suhteessa data. Virhettä tulee lukuisista lähteistä, joista tärkeimmät ovat mittausvirheet ja näytteenottovirheet.
  2. Datan analysoinnin mahdollisuus on ehkä kaikkein suurin ongelma. Jokainen analyysi ja esittämistapa vaativat datan keräämistä jollain tietyllä tavalla, jotta tulos olisi oikea. Jos keräät dataa tietämättä, kuinka sitä analysoidaan, et todennäköisesti pysty dataa käyttämään! Datan keräämisessä on noudatettava ”rationaalista näytteenottoa”. Ei siis mielivaltaista ja sattumadatan keräystä, jota tyypillisesti on tuotantodatan keräys!
  3. Me käytämme hyvin helposti dataa väärissä yhteyksissä. Esimerkiksi yritykselle tulee viime kesänä valmistuneesta tuotteesta reklamaatio. Reklamaation selvittäminen käynnistyy tutkimalla tuotantoprosessia (nyt talvella)! Mitä on vialla?

Luotettavien ja oikeiden johtopäätösten tekemisen perusehto on, että data on oikeaa, kerätty ja kohdennettu hyvin ja analysoitu oikein. Tässä artikkelissa keskitytään datan käyttökohteeseen ja sen vaatimusten tunnistamiseen.

Datan käyttökohde ja vaatimukset

Miksi mitataan jotakin? Aina, kun hankitaan tietoa mittaamalla, kulutetaan aikaa ja energiaa ja synnytetään kustannuksia. Tämän kustannuksen tulee maksaa itsensä takaisin, kun tarvittava tieto on saavutettu.

Jotta voisimme ymmärtää tätä prosessia paremmin, voidaan datan käyttökohteet jakaa viiteen luokkaan käyttötarkoituksen mukaan. Dataa käytetään asioiden menneen ja tulevan tilan päättelyyn. Siis, mitä eilen tapahtui ja toisaalta mitä huomenna tulee tapahtumaan. Ilmaston lämpötilasta on tiedettävä, kuinka lämpötila on muuttunut viimeisten satojen vuosien aikana – jatkuvasti lämmennyt ja toisaalta mitä tulee tapahtumaan lämpötilalle. Kummatkin näkökulmat vaativat datalta erilaista luotettavuutta (oikeellisuutta). Mitä vaativammat ovat datan laatuvaatimukset, sitä kalliimpaa se on. Siksi aluksi tulee pysähdyttävä miettimään, mitä haluan tietää?

Datan käyttökohteet:

  1. Monitorointi – Monitoring
  2. Kuvaaminen – Description
  3. Luonnehtiminen – Characterization
  4. Edustavuus – Representation
  5. Ennustaminen – Prediction

Kolme ensimmäistä luokkaa kuvaavat tilaa, joilla tarkastellaan mennyttä, mitä on tapahtunut. Oleellista on, miten oikeaa (tarkkaa) data on. Käytännössä nämä ovat prosessin tunnistamis-, ideointi- ja valvontatilanteita (1. 2. 3.)

Kaksi jälkimmäistä kuvaavat tulevaa, mitä tulee tapahtumaan. Näitä käytetään näytteenotto (SPC) ja suorituskykytutkimuksiin (4.) ja parannus- ja tutkimustilanteisiin Six Sigma (5.).

1. Monitorointi – Monitoring

Monitoroinnissa seuraamme tapahtumia "päältä". Näemme kaikkialla "monitoreja", joista joko näemme tai sitten emme yksityiskohtia. Oleellista on, että monitori pystyy karkealla tasolla ilmaisemaan poikkeaman. Monitorointia tapahtuu yrityksissä hyvin paljon – liikevaihtoa, varastoja, poissaoloja jne. Oleellista on, että ymmärrämme, että data saattaa sisältää paljonkin virhettä. Se on niin sanotusti vasemmalla kädellä kerättyä!

2. Kuvaaminen - Description

Tarkempi tapa käyttää dataa on kuvaaminen. Tiedon keräämisen motiivina on kalastella uusia ideoita, ilmoittaa jos jotain tapahtuu, halu saada tietoa olisiko tämä mittauskohde, josta olisi hyvä joskus kerätä dataa, tms. Onpa käyttötarkoitus mikä tahansa, se vastaa kysymykseen: kuinka monta tai kuinka paljon?

Mittaustietoa käytettäessä on tärkeää tietää rajoitukset kuinka ja miten käytän dataa. Toisin sanoin tulee ymmärtää mittauksen epätarkkuus, joka on seurausta mittauksesta itsestään. Tämän vuoksi organisaatiossa tulisi olla luotuna toimintatapa siihen, kuinka määritetään mittauksen epätarkkuuden määrä.

Tyypillisesti yrityksessä kuvataan tuotteita/palveluja hyvien ja huonojen määrillä. Jokaisen olisi ymmärrettävä, että luvut voivat olla vääriä. Hyvä tuote voi olla huono tai päinvastoin. Jotta luvuissa olisi jotain järkeä, tapa millä kuvataan (mitataan) dataa, on varmistettava eli määritettävä virhe. Ei ole mitenkään yllättävää, että yrityksen "virhe" tai saantoprosenteissa ei ole mitään järkeä. Ei ihme, jos ei laatu parane.

Tässä kuvaamiskäytössä datan ei tarvitse olla laadultaan huippua. Kuinka määrittelemme datan laadun? Datan laatua (virhettä) voidaan kuvailla erilaisilla tunnusluvuilla. Myöhemmin tässä artikkelissa on taulukko, jossa on esitetty mittausprosessin laatuvaatimukset. Datan laatuvaatimus kuvaamisessa on luokka II.

3. Luonnehdinta – Characterization

Toinen datan käyttökohde on luonnehdinta, joka on lähellä toista käyttökohdetta, mutta vertailu suoritetaan suhteellisia rajoja vasten. Tämä mittaus poikkeaa aiemmasta siinäkin mielessä, että mittaukseen voidaan liittää toimenpide, mikäli raja ylittyy. Tyypillinen tämä tilanne on, kun selvitetään onko jokin spekseissä vai ei. Toisin sanoin tähän liittyy säätötoimenpide, joka voi olla prosessin säätö tai hyväksymis- tai hylkäämispäätös. Luonnollisesti, koska tiedon keruuseen liittyy toimenpide, tulee mittauksen epätarkkuuden tunteminen tärkeämmäksi. Samalla mittauksen vaatimuksetkin kasvavat. Datan laadun vaatimus vähintään III -luokka.

4. Edustavuus - Representation

Neljäs käyttökohde on edustavuus. Mittauksen avulla halutaan esittää myös tuotteet tai tapahtumat, joita ei ole mitattu. Liittyy siis näytteenottoon. Suomen kansalaisilta (pieneltä osalta n. 1800 henkilöä) kysytään eduskuntavaalien välillä mielipidettä ja tästä päätellään, mitä n. 5 miljoona ihmistä on mieltä. Yrityksissä tämä tarkoittaa sitä, että halutaan tietää näytteen avulla, onko lähetyksen tuotteet hyväksyttäviä tai prosessivirrasta otetaan säännöllisin välein näytteitä ja päätellään, mitä näytteiden välissä tapahtuu. Laatuihmisille tästä tutumpi ilmaus on AQL ja SPC. Mittaaminen tapahtuu mittaamalla kohdetta stabiilista tapahtumaketjusta ja näiden arvojen avulla ekstrapoloidaan ne tuotteet ja tapahtumat, joita ei ole mitattu. Datan laadulta vaaditaan jo huomattavasti enemmän, koska pienestä määrästä informaatiota tehdään päätös. Datan laadun vaatimus vähintään IV -luokka.

5. Ennustaminen - Prediction

Viides käyttökohde on ennustaminen. Tämän kohteena on luokitella, mitä prosessi tulevaisuudessa tuottaa. Ennustaminen perustuu prosessin tarkkaan luonnehdintaan ja vaatii erittäin hyvää dataa. Ensin päätellään, onko kohde hyvä vai huono ja tämän jälkeen päätellään kuinka se käyttäytyy tulevaisuudessa. Tämä käyttötapa vaatii mittausprosessilta paljon ja tämän vuoksi sen vaatimukset ovat kovimmat. Tyypillisiä käyttökohteita ovat Six Sigma -projektien parannusvaihe, koesuunnittelu ja erilaiset mallinnustekniikat. Datan laadun vaatimus vähintään V -luokka.

Datan keräämisprosessin - mittausprosessin – laatuvaatimukset

Yhdenmukaisuus (Stabiilisuus)
Ilman tämän vahvistamista et voi mitata prosessia.

Täsmällisyys (GRR)
Ilman tämän tuntemusta et tiedä todellista mittauksen resoluutiota.

Tarkkuus (Kalibrointi)
Kiva tietää asia, mutta joskus bisnestä voidaan tehdä ilman tämän tuntemista.

Mittausprosessin, eli datankeräysprosessin luotettavuus voidaan arvioida mittaussysteemin analyysillä (MSA). Mittavirheet luokitellaan karkeasti kolmeen luokkaa: yhdenmukaisuus (consistency), täsmällisyys (precision) ja poikkeama (bias). Tärkein näistä kaikista ominaisuuksista yhdenmukaisuus, jos tästä ei olla varmoja, mittausprosessista tulee kuin ruletti. Toiseksi tärkein on selvittää täsmällisyys ja sitten vasta tarkkuus, bias. Mittavirheitä ja sen arviointia käsittelin aiemmin artikkelissa: Kuinka luotettavasti mittaan tai arvioin?

Perusperiaate mittavirheen tutkimuksessa on se, että se tulee toteuttaa normaaleissa olosuhteissa. Tämä tarkoittaa sitä, että mittaus suoritetaan siellä, missä mittaus tapahtuu operatiivisesti. Mittaus toistetaan vähintään kaksi kertaa saman osan tai asian osalta usean mittaajan toimesta. Mitattavia osia tai mitattavia kohteita tulee olla useita, mielellään kymmenen kappaletta. Mittavirheen tutkiminen on aina oma tutkimuksensa, koe. Tämän tutkimuksen avulla saadaan arvio mittausvirheestä. Mittavirhevaatimukset on luokiteltu käyttökohteen mukaisesti alla olevassa taulukossa. Tunnusluvut voidaan selvittää kvantitatiivisille ja kvalitatiivisille mittaussysteemeille.

Taulukko. Taulukkoon on luokiteltu mittavirhevaatimukset käyttötarkoituksen mukaan.

msa_vaatimustaulukko.jpg

Yhteenveto

Kun olet päättänyt datan käyttötarkoitukset,tiedät, kuinka luotettavasti sinun tulee kerätä tietoa. Mikäli haluat olla varma, että tieto on parasta mahdollista (= mittavirhe on pieni), maksat tiedosta kovempaa hintaa. Mikäli taas keräät tietoa, jonka luotettavuus ei ole hyvää ja yrität käyttää sitä, on kaikki tiedonkeräämiseen käytetty aika ja energia valunut hukkaan. Pahimmassa tapauksessa käyttökelvotonta dataa analysoidaan ja siitä tehdään johtopäätöksiä. Tässä tapauksessa tiedon kelvottomuuden kustannusvaikutus voi olla erittäin merkittävä.

Jälkimmäinen tilanne on yleisemmin esiintynyt. Tämä johtuu siitä, että organisaatioissa on harvoin luotu proseduuria kuinka mittaus otetaan käyttöön. Usein mittauksen aloittaminen on impulsiivinen tapahtuma, joka aloitetaan kun ongelma tai tarve on käsillä. Mittaus aloitetaan välittömästi ja määritelty mitä tulee tietää ja kuinka hyvin jää tekemättä. Luotettavan mittausprosessin luominen on yksi kehitystoiminnan peruselementtejä, joka ohitetaan sen vaikutuksen ja tekniikan tietämättömyydestä johtuen.

Artikkelissa emme käsitelleet datan keräämiseen liittyviä sääntöjä eli kuinka näytteenotto suoritetaan. Tähän ei ole yleistä ohjetta vain jokainen analyysitapa (AQL, SPC, ANOVA, regressio, DoE, MSA, jne.) vaatii oman tavan kerätä dataa.

Mikäli haluat tutustua aiheeseen lisää tutustu läheteissä oleviin kirjoihin tai osallistu kurssille ja saat omaksesi mittauksenluotettavuuden arvioinnin perusmanuaalin (MSA -manuaali).

 


antti_uusi.jpg
Antti Piirainen

Kommentoi

(Sähköpostiosoitettasi ei julkisteta.)
Syötä kuvassa näkyvät kirjaimet ja numerot.
Captcha Code

Klikkaa kuvaa nähdäksesi uuden koodin.

    Tagipilvi

    Gage R&RvuodiagrammiEDAGreen BeltmenetelmätmittavirheerityissyyBig DataMinitab 19ISO 9000kustannussäästötHarrylaatutyökaluthypoteesitestistabiiliSPClaatuCTQCrosbyjitkoesuunnittelumallitehdasfysiikkakalanruototoiminnan lainalaisuudetHall of FamearvovirtakuvausregressioanalyysiLean Handbooksatunnainen vaihtelutiedonkerääminenoeeparannusmallivalvontaISO 9001puhdistaminendatan käsittelysatunnaissyyDMADVLeanlajitteluohjaussuunnitelmaennustaminenFMEAdatan luokitteluhukan muodotdataLaatujärjestelmäLean Six SigmajaksoaikaMonte CarloparannusmenetelmäTPS8DtilastomatematiikkaJohtaminenryhmätyöskentelyFactory PhysicsKingmanläpimenoaikainnovaatioTOCt-testipaloautopeliSix SigmalaadunohjausturvallisuusVOCDesign for Six SigmaASQtyökalutaivoriihiarvovirtasekoitekoeryhmittelykaavioTuottavuusideointiMinitab 18asiakastyytyväisyystäystekijäkoelaatu SuomessajidokamonimuuttujakoeISO 9001:2015Littlen lakikorrelaatiomittausprosessihyväksymisnäytteenottokairyokoulutusYellow Beltsuorituskykyjärjestäminenohjaussyy-seurauskaavioValue Stream MappingjohtamisjärjestelmäBlack BeltDemingmonimuuttujatestiTaguchihypoteesitestausuutiskirjekvantitatiiviset menetelmätlaadunkehittäjäAsiakastarvetehokkuusreunatilastollinen päätöksentekolaadunhallintaVUTDFSSANOVApalveluPDSAJuranasiakastyytyväisyysmixturemittaussysteemiCTPriskiongelmanratkaisudatan käsittely5W2H PDSA-ympyräprosessineukkarikoehävikkifunktiotoiminnan laitSPC-korttiBOKCombanion by MinitabMSAstandardointiMarkkinointimuutoksen tuskamuutossuorituskykymittaritShingoShewhartdata-analyysiTQMTPMdatan laatuWheelerFeigenbaumacceptance samplingtilastoDOELaatutyökalutOpettaminenBody of KnowledgeMarkkinointiprosessiriskinkartoitusSigmaDesign of ExperimentsparannustoimintaPDCAToyotalaatu ratkaiseeMinitabTätä on Leanmielenmallitparannuksen johtaminenControl PlankuvaaminenDSDGageasiakasROInollavirheluotettava mittaustehollinen aikaIshikawaJatkuva parantaminenCDAsitoutuminenOhnodatan keräysLaatukonferenssiOFATLean Six Sigma Black BeltKingmanin yhtälövaihtelugurutsysteemiIATFlaadunparannusdatan käsittelytoleranssiDemonstraatiot5SparantaminenhistogrammiohjauskorttikausaliteettiBalanced ScorecardlainalaisuudetVSMparannustoiminnan kehittyminenparannustekoälyKaizenParetoarvovirta-analyysipäämäärämalliterveydenhuoltoL8-matriisivaihtelun vaikutuslaatutaulut0-virheprosessikuvausqfdKataIATF 16949OpetusmenetelmätLean-visiooperaatiotutkimusLean-talomittaaminenDMAICKaikakuHukka

    Arkisto