Kumpi auto on parempi

Julkaistu 01.04.2015    Kirjoittanut Jarno Kankaanranta  Tilaa RSS

Käytännön ongelman ratkaiseminen Six Sigman avulla


Johdanto

4-vuotias Joonas on saanut uuden autoradan, jossa on silmukka ja kaksi autoa. Hän haluaa tietää kumpi autoista, punainen vai vihreä on parempi. Joonas ei vielä ole opiskellut tilastotiedettä, mutta Joonas tietää isän puheiden perusteella, että Six Sigmassa käytännön ongelma "käännetään" tilastomatemaattiseksi ongelmaksi ja vastaavasti tilastomatemaattinen ongelman ratkaisu käytännön ongelman ratkaisuksi (Kuva 1) /5/.

Ratkaisustrategia.jpg
Kuva 1
. Six Sigman ongelmanratkaisusrategia/5/.

Joonas tietää isänsä opiskelleen tilastomatematiikkaa ja Six Sigmaa. Joonas päättääkin kysyä isältään, miten hän voisi ongelmansa ratkaista. Isä ja Joonas miettivät yhdessä, millainen auto on parempi. Joonaksen mielestä auto, joka kulkee pidemmän matkan autoradan jälkeen, on parempi. Tämän perusteella Joonas ja isä suunnittelevat testin ja analysoivat testin perusteella saatavaa dataa, saadakseen käytännön ongelman ratkaistua.

Datan keruu

Saadakseen dataa isän analyysejä varten Joonas "ampuu" kummankin auton 20 kertaa autoradalle ja mittaa auton radan jälkeen kulkeman matkan. Näiden matkadatojen perusteella on mahdollista selvittää autojen välinen paremmuus. Datankeruuprosessi on esitetty alla olevassa videossa.

Teoriaa

Edellä kuvatulla tavalla saatu aineisto muodostaa kaksi toisistaan riippumatonta otosta ja ovat kvantitatiivisia mittauksia kahdesta osapopulaatiosta, joita halutaan verrata toisiinsa. Tällaisessa tilanteessa vertailuun voidaan käyttää kahden otoksen t-testiä./7/

Kahden otoksen t-testi olettaa, että verrattavat otokset ovat normaalijakautuneita (Walpole, Myers, Myers ja Ye 2002; Grönroos 2003). Otosten normaalijakautuneisuus voidaan helposti testata käyttämällä esimerkiksi Anderson-Darling normaalisuustestiä. Anderson-Darling -testi kertoo, miten hyvin data noudattaa jotakin määriteltyä jakaumaa/1/.

Normaalijakautuneisuus.jpg
Kuva 2
. Autodatojen normaalijakautuneisuuden testaaminen.

Kuvasta 2 huomataan, että autodatojen Anderson-Darling –testin p-arvot ovat isot (>0,05), joten datojen voidaan olettaa noudattavan normaalijakaumaa.

Kahden otoksen t-testi olettaa myös, että vertailtavien datojen varianssien on oltava yhtäsuuret. Varianssien yhtäsuuruuden testaamiseen voidaan käyttää esimerkiksi Bartlettin- testiä tai Levenen –testiä./4/ Bartlettin –testi olettaa, että verrattavat datat ovat normaalijakautuneita/2/. Levenen –testi ei oleta datojen normaalijakautuneisuutta datojen on ainoastaan oltava jatkuvia/6/. Bartlettin –testin ja Levenen –testin hypoteesit voidaan kirjoittaa seuraavalla tavalla/3/ /7/.

H0: ?12 = ?22
H1:?12 ? ?22

Varianssien_testaus.jpg
Kuva 3
. Autodatojen varianssien yhtäsuuruuden testaaminen.

Kuvasta 3 huomataan, että autodatojen Bartlettin –testin (Multiple Comparisons) ja Levenen –testin p-arvot ovat isot (>0,05). Testattu data tukee siis hypoteesia, joten datojen hajonnat voidaan olettaa yhtä suuriksi.

Oletukset kahden otoksen t-testin suorittamiselle täytyvät edellisten analyysien perusteella, joten autodatojen ero voidaan nyt testata tilastollisesti. Kahden otoksen t-testin avulla voidaan testata, eroavatko tässä tapauksessa eri autojen kulkemien matkojen keskiarvot toisistaan. Tämä testi nähdään kuvassa 4. Testattavat hypoteesit voidaan kirjoittaa seuraavasti./3/ /7/

H0: ?1 = ?2
H1:?1 ? ?2

t-testin_tulokset.jpg
Kuva 4.
Autodatojen kahden otoksen t-testin tulokset

Kahden otoksen t-testin (Kuva 4) perusteella huomataan, että testin p-arvo on pieni (<0,05), joten voidaan päätellä, että aineisto tukee hypoteesia, että autojen kulkeman matkan välillä on eroa. Keskiarvoja tutkimalla (Kuva 4) voidaan edelleen päätellä, että punaisen auton kulkeman matkan keskiarvo on vihreän auton kulkeman matkan keskiarvoa suurempi. Vastaus Joonaksen ongelmaan on, punainen auto on parempi, koska se kulkee keskimäärin pidemmän matkan.

Yhteenveto

Tässä julkaisussa on pyritty esimerkin avulla selittämään Six Sigman olennaista ajatusta siitä, että käytännön ongelma on mahdollista saada ratkaistua muuntamalla se tilastomatemaattiseksi ongelmaksi. Vastaavasti Six Sigman ajatuksen perusteella tilastomatemaattista ratkaisu on mahdollista kääntää käytännön ongelman ratkaisuksi. Tässä kahden otoksen t-testin avulla saatiin ratkaistua Joonasta askarruttanut ongelma punaisen auton ja vihreän auton välisestä paremmuudesta.

 

Jarno_pieni.jpg
TkT Jarno Kankaanranta

 

Lähteet

 1. Anderson, T. W. & Darling, D. A., 1952. Asymptotic theory of certain "goodness-of-fit" criteria based on stochastic processes. Annals of Mathematical Statistics. 23, pp.193-212.
 2. Bartlett, M. S., 1937. Properties of sufficiency and statistical tests. Proceedings of the Royal Statistical Society, Series A. 160, pp. 268-282
 3. Chase, W. & Brow, F., 2000. General Statistics. 4. Painos, John Wiley & Sons, Inc.
 4. Grönroos, M., 2003. Johdatus Tilastotieteeseen Kuvailu, mallit ja päättely. 1. Painos, Finn Lectura
 5. Lean Six Sigma Black Belt -koulutuksen materiaali, kevät 2015. Quality Knowhow Karjalainen Oy
 6. Walpole, R. E., Myers, R. H., Myers, S. L. & Ye, K., 2002. Probability & Statistics for Engineers & Scientist. 7. Painos, Prentice Hall

Kommentoi

(Sähköpostiosoitettasi ei julkisteta.)
Syötä kuvassa näkyvät kirjaimet ja numerot.
Captcha Code

Klikkaa kuvaa nähdäksesi uuden koodin.

 • Opiskelija

  Mielenkiintoinen ja hyvin havainnollistava läpikäynti LSS:stä kiinnostuneelle opiskelijalle :) Juuri samoja asioita käymme läpi kurssilla tilastollisen tutkimuksen perusteet.

 • Kimmo

  Pitäisikö t-testin hypoteesit kuitenkin kirjoittaa toisin päin? eli
  H0: ?1 ? ?2
  H1:?1 = ?2

  Näinollen kun p

 • Jarno

  Hei,

  Kiitos kommenteistanne ja mukavaa, että artikkelini on kiinnostanut teitä.

  Kyllä nuo hypoteesit tuossa artikkelissa on oikein. Olen oppinut (ja tarkastin vielä), että "oletetaan keskiarvojen olevan samata (0-hypoteesi), kunnes toisin todistetaan (avaihtoehtoinen hypoteesi). Nyt p-arvo on pieni (

Kommentoi

(Sähköpostiosoitettasi ei julkisteta.)
Syötä kuvassa näkyvät kirjaimet ja numerot.
Captcha Code

Klikkaa kuvaa nähdäksesi uuden koodin.

  Tagipilvi

  datan käsittelyriskiGage R&Rmuutosvuodiagrammivaihtelun vaikutusdata-analyysiqfdtilastomatematiikka5W2H parannuksen johtaminenDesign for Six Sigmat-testiLittlen lakiTätä on LeanGageMonte CarlokausaliteettiBody of KnowledgeKingmanturvallisuusjärjestäminenmittaussysteemisekoitekoeROIkuvaaminenkoesuunnitteluMSAdatatilastoKaizentehokkuusreunaparantaminenjohtamisjärjestelmäTPMlaadunohjausCombanion by MinitabsitoutuminenlaatutaulutpuhdistaminenToyotaTOCtekoälyVOCprosessiLaatukonferenssimielenmallitControl Planlaatu ratkaiseeValue Stream MappingMinitab 18jidokaLean-taloohjauskorttiLaatujärjestelmähistogrammisysteemi0-virhedatan luokittelulajittelusuorituskykylaatu5SLean-visiohyväksymisnäytteenottoLeanpäämäärämalliHukkaMarkkinointiprosessiL8-matriisikanbanVSMtehdasfysiikkaTQMohjausDSDkalanruotoParetoideointiBlack BeltpaloautopeliriskinkartoitusASQEDAnollavirheDMAIClaatutyökaluttyökalutjitLaatutyökalutSix Sigmatäystekijäkoelaatu SuomessaOhnoShingoennustaminenneukkarikoeCTQKingmanin yhtälöDesign of ExperimentsJatkuva parantaminenCDAPDSAFMEADemingOpettaminensatunnaissyyDemonstraatiotinnovaatiovalvontaMinitabregressioanalyysiDMADVFactory Physicsmenetelmätuutiskirjetiedonkerääminenkvantitatiiviset menetelmätdatan keräysmittaaminenparannusGreen BeltTuottavuushävikkifunktiopalveluBOKtilastollinen päätöksentekodatan käsittelystabiiliOFATFeigenbaumTPSterveydenhuoltoaivoriihiOpetusmenetelmätSPC-korttimittavirheDFSSBig DataYellow BeltIshikawahypoteesitestausLean Six SigmaMinitab 19syy-seurauskaaviolaadunhallintaISO 9001:2015arvovirtakuvaushukan muodotmallimonimuuttujatestiasiakasläpimenoaikaHarryhypoteesitestiarvovirta-analyysiläpimenoCTPlaadunparannusdatan käsittelymonimuuttujakoearvovirtaCrosbyTaguchitoiminnan lainalaisuudetmixturesatunnainen vaihteluJuranmittausprosessiShewhartANOVAJohtaminenPDSA-ympyräSigmaasiakastyytyväisyystehollinen aikaacceptance samplingkorrelaatioluotettava mittaussuorituskykymittaritoperaatiotutkimuslaadunkehittäjäkustannussäästötprosessikuvausSPCparannustoimintaVUTISO 9000ongelmanratkaisudatan laatuerityissyyWheelerjaksoaikastandardointiAsiakastarveparannustoiminnan kehittyminentoleranssiasiakastyytyväisyystoiminnan laitgurutISO 9001Lean Six Sigma Black BeltLean HandbookparannusmenetelmäDOEvaihtelukoulutusohjaussuunnitelmaoeekairyolainalaisuudet8DIATFIATF 16949ryhmittelykaavioKaikakuPDCABalanced ScorecardHall of FameKataparannusmallimuutoksen tuskaryhmätyöskentelyMarkkinointi

  Arkisto