Kuinka löytää ohjelmisto tilastollista analyysiä varten?
Sisu Jylhä
• 4 min lukea
Jotta tietojoukoista tulisi merkityksellisiä, ne on analysoitava, selitettävä, tulkittava ja esitettävä. Tätä käsittelevä matemaattinen kurinalaisuus tunnetaan tilastoina, ja tällä tutkimusalueella käytetty laaja tekniikka tunnetaan yhdessä nimellä tilastollinen analyysi. On epäkäytännöllistä analysoida koko tietojoukko tai niin kutsuttu populaatio. Väestö, kuten esimerkiksi "jokainen hiekkaranta rannalla", on liian valtava. Osa populaatiosta, jota kutsutaan otokseksi, on tarpeen. Sitten näytteestä tulee analyysikohde. Mahdolliset otoksesta tehdyt johtopäätökset voidaan laajentaa populaatioon niin kauan kuin otos edustaa oikein väestöä, johon se kuuluu. Tilastollinen analyysi käytetään kahden yleisen tarkoituksen saavuttamiseen. Yksi on kuvata tietoja ja toinen on tehdä päätelmiä tiedoista.
Tilastot ovat työkalu, jota käytetään monilla aloilla tekniikasta psykologiaan. Erilaisia tilastollisen analyysin menetelmiä on kehitetty. Kaikkia niistä eivät tiukasti muotoilleet puhtaat matemaatikot tai tilastotieteilijät. Jotkut tieteenalat pitävät joitain menetelmiä osuvampina kuin toiset ja käyttävät sitä johdonmukaisemmin. Kolme yleisimmin käytettyä menetelmää ovat regressioanalyysi, tekijäanalyysi ja monimuuttujaanalyysi.
Riippumattomat muuttujat pysyvät vakioina
Regressioanalyysi liittyy mihin tahansa useista tekniikoista, joita käytetään riippuvan muuttujan ja yhden tai useamman itsenäisen muuttujan suhteen ymmärtämiseen. Tavoitteena on selvittää, miten riippuvan muuttujan arvoon vaikuttaa, kun yhtä riippumatonta muuttujaa muutetaan samalla kun kaikki muut riippumattomat muuttujat pysyvät vakioina. Tämä menetelmä on siten hyödyllisin ennusteiden tai ennusteiden tekemiseen.
Tekijäanalyysi on tilastollinen analyysimenetelmä, jota käytetään havaittavien muuttujien taustalla olevien piilotettujen muuttujien paljastamiseen ja selittämiseen. Kahden tai useamman näennäisesti toisistaan riippumattoman muuttujan välillä voidaan paljastaa olevan riippuvuussuhteita. Näitä piilotettuja tai taustalla olevia muuttujia kutsutaan tekijöiksi, ja niiden tuominen esiin vähentää muuttujien määrää ja yksinkertaistaa tutkittavia tietoja.
Monimuuttuja-analyysissä menetelmä viittaa tekniikoihin, joita käytetään tutkimuksessa tiedot, joka on peräisin useamman kuin yhden muuttujan. Realistisiin ongelmiin tuskin liittyy yksittäisiä muuttujia. Saadaksesi selkeän kuvan tilanteesta, sinun on otettava huomioon kaikki asiaankuuluvat tekijät. Monimuuttujaanalyysi käsittelee valtavia tietojoukkoja ja käyttää siten usein tietokantoja tietojen järjestämiseen. Sieltä analyysi voi johtaa tekemään tietoisempia ja älykkäämpiä päätöksiä.
Sisältää kutsutut data-analyysityökalut
Koska tietokoneista on tullut yksi tärkeimmistä työkaluista erilaisissa tutkimuksissa fyysisistä tieteistä yhteiskuntatieteisiin, niin myös tilastollisen analyysin helpottamiseksi on kehitetty ohjelmistojärjestelmiä. Jotkut sovellukset on suunniteltu erityisesti tilastollista työtä varten, kun taas toiset on ehkä suunniteltu pääasiassa tietokanta- tai matemaattisiin operaatioihin, mutta ne pystyvät luonnollisesti suorittamaan tietyntyyppisiä tilastollisia analyyseja. Yksi merkittävä esimerkki tilasto-ohjelmistoista on SAS-järjestelmä. SAS on itse asiassa paketti erilaisia sovelluksia, joista jokaisella on oma painopiste. SAS / STAT on päätuote tilastollisiin analyyseihin ja sitä voidaan käyttää yhdessä SAS / GRAPH: n kanssa, joka on paketin toinen tuote tietojen graafiseen kuvaamiseen. MATLAB on esimerkki matematiikkaohjelmistosta, joka pystyy myös suorittamaan tilastollisia analyysejä, mutta sen toiminnot ovat tietysti laajempia kuin tilastot. Microsoft Excel on tarkalleen ottaen taulukkolaskentaohjelma, mutta se sisältää analyysityökaluja nimeltä Analysis ToolPak, joiden avulla käyttäjät voivat suorittaa useita tilastollisen analyysin menetelmiä.