Statistiek

cursuscode 200300427
2005-2006, blok 2, november-januari


Nieuws

  1. [2006.03.06] Na aanpassing en verbetering zijn dit jullie cijfers geworden.
  2. [2006.02.22] Het tentamen is nagekeken. Je kon er maximaal 60 punten voor halen. Om een "gewoon" cijfer te berekenen moet je je behaalde punten vermenigvuldigen met 10/6 (1.667). Meer dan 33 punten is een voldoende. Een aantal inhoudelijke opmerkingen naar aanleiding van jullie antwoorden is hieronder te vinden. Lees die ook door, en kijk niet alleen naar je cijfers...
  3. [2005.12.15] Het onmogelijke histogram voor het tweede werkstuk is te vinden in het draaiboek hieronder (kijk bij 6 januari 2006), met commentaar.
  4. [2005.12.14] Tijdens het college van vandaag heb ik een fout gemaakt bij het voorbeeld over de pasgeboren jongetjes en meisjes. In een update in het draaiboek kan je lezen wat mijn fout was, en wat het goede antwoord moest zijn.
  5. [2005.11.21] Enkele opmerkingen over jullie antwoorden op de vragenlijst:
    * Twee studenten weten niet of ze een rijbewijs hebben.
    * Eén student heeft geen mobiele telefoon.
    * Er zijn 24 vrouwelijke en 11 mannelijke studenten.
    * De meest populaire beginletter is de M (6 maal geantwoord, allemaal vrouwen).
    * Het aankoopbedrag voor kleding varieert van 7 tot 95 EUR, met een mediaan van 29,95 (en 4 non-responsies).
  6. Tip: De data behorend bij een aantal huiswerk-opgaven zijn ook te vinden op de CD-ROM bij het boek van Devore & Peck! Voor sommige opgaven kan je de data dus meteen importeren in SPSS; zie de Handleiding bij het practicum, Hoofdstuk 4.

Praktische informatie

Docent

Hugo Quené
e-mail Hugo punt Quene at let uu nl,
Trans 10, kamer 1.31,
spreekuur: dinsdag 14:00-15:30 en volgens afspraak

Boeken

We maken gebruik van twee boeken en een web-handleiding:

Rooster

Iedere week zijn er twee werkcolleges, voor beide groepen samen, en een practicum-bijeenkomst per groep.
cursusjaar 2005-2006, blok 2
maandag 13.00-16.00Drift 23, 2.12werkcollege
woensdag14.00-17.00Drift 23, 2.12werkcollege
donderdag11.00-13.00KNG 80, 0.07 CLZpracticum 1
donderdag11.00-13.00KNG 80, 0.13 CLZpracticum 2

Inhoud

Deze cursus heeft tot doel om je de elementaire principes bij te brengen van beschrijvende en toetsende statistiek, en van de rol die deze methoden spelen in het wetenschappelijk onderzoek. Je leert technieken om gegevens te beschrijven, samen te vatten en te presenteren, bv in tabellen, grafieken en statistische kengetallen. Ook de daarvoor vereiste achtergrond komt aan bod: kans en kansrekening, steekproeftheorie, en schatting.
In het wetenschappelijk onderzoek worden gegevens meestal niet alleen beschreven, maar ook gebruikt om een hypothese te toetsen. We gaan in op de algemene principes van zulke toetsing, en je leert de meest gangbare statistische toetsen toe te passen en te interpreteren. Een experiment is een speciale onderzoeksomgeving waarin de relevante variabelen systematisch kunnen variëren; we besteden daarom aandacht aan het ontwerp van een experiment.
In de practica leer je omgaan met SPSS, een computerprogramma voor statistische analyse. Je gebruikt dit pakket om gegevens van jezelf (of van anderen) te beschrijven en te gebruiken voor toetsing.

Onderwijsvorm en toetsing

Deze cursus bestaat uit verschillende componenten. Ten eerste zijn er colleges, op maandag en woensdag. Voorafgaand aan een college moet je leesstof bestudeerd hebben. Na afloop moet je de bijbehorende individuele huiswerkopdrachten maken. Je antwoorden en oplossingen van het huiswerk moet je — in uitgeschreven vorm — meenemen naar het volgende college, waar we e.e.a. zullen bespreken.
Ten tweede zijn er practica op donderdag (groep 1) of vrijdag (groep 2). De invulling daarvan kan variëren: huiswerk bespreken, statistiek "doen" met SPSS, samen werken aan opdrachten, of het resultaat ervan bespreken.

Voor ieder college (tweemaal per week) moet je rekenen op 2u leeswerk vooraf, 2 contacturen, en 4u huiswerk nadien: 16 uur per week. Voor ieder practicum (eenmaal per week) moet je rekenen op 2u zelfstudie, plus 2 contacturen: 4 uur per week. Je wordt dus geacht 20 uur per week aan deze cursus te besteden.

Verslagen en andere teksten moeten electronisch worden ingeleverd via WebCT. Vraag je docent om opheldering als de opdrachten niet duidelijk zijn!

Tijdens de cursus moet je vier werkstukken inleveren. Voor ieder werkstuk kun je maximaal 1 punt verdienen. De cursus wordt afgesloten met een tentamen, waarmee je maximaal 6 punten kunt verdienen. Het eindcijfer bestaat uit de som van de (4x1)+6 behaalde punten.

terug naar begin


Draaiboek

(1) maandag 21 nov: college 1

Variabelen; meetniveau. Empirische cyclus. De rol van statistiek in wetenschappelijk onderzoek. Hypothesen; H1 en H0. Eenheden van analyse.

Lezen: Chapter 1.

Vooraf: Verwijzingen:

(2) woensdag 23 nov: college 2

Eenheden van analyse. Steekproef; sampling. Validiteit. Beschrijvende en toetsende statistiek. Veldwerk, corpus-analyse, experiment.

Lezen: Chapter 2.

Huiswerk vooraf:

(3) don 24 nov: practicum 1

Kennismaking met SPSS. Gegevens invoeren en bewaren.

Zorg dat je een computer-account hebt bij Letteren. Controleer ook of je toegang hebt tot WebCT. Neem je login-gegevens mee naar het practicum!

Lezen: Handleiding, Hoofdstukken 1, 2 en 3.

Benodigde bestanden: vb01.dat, vb02.dat;
maak een directory voor deze cursus op je persoonlijke U-schijf (computerleerzalen CIM); bewaar deze bestanden in dat directory (in de meeste browsers: rechts klikken op hyperlink, kies dan Save target as... om het bestand op te slaan).

(4) maandag 28 nov: college 3

Datareductie. Presentatie. Histogrammen, tabellen, grafieken. Gemiddelde en spreiding.

Lezen: Chapters 3 en 4.

Huiswerk vooraf:

(5) woensdag 30 nov: college 4

Kans, kansrekening; gezamenlijke en onafhankelijke kansen. Binomiaal-verdeling.

Lezen: Chapter 6.

Huiswerk vooraf:
Verwijzingen:

Aanvullingen:

  1. Over de binomiaal-verdeling kan je meer lezen in de Appendix van het boek van Devore & Peck, p.719 e.v.
    De binomiaal-verdeling voor 15 trekkingen is onhandig groot. Hier volgt de uitwerking voor 7 trekkingen, met teruglegging, elk met p=0.38, eerst in formule-vorm (zie p.665), en hieronder uitgeschreven in een tabel:
       P(x klinkers uit 7 trekkingen) =
    1 × p7 + 7 × p6 q + 21 × p5 q2 + 35 × p4 q3 + 35 × p3 q4 + 21 × p2 q5 + 7 × p q6 + 1 × q7 .
    De binomiaal-coëfficienten 1, 7, 21, 35, enz. tref je ook aan in de zgn. Driehoek van Pascal die dit in 1654 heeft bedacht.
aantal
klinkers
mogelijke uitkomsten kans
7 VVVVVVV 1 × (.387) = .001
6 VVVVVVC, VVVVVCV, VVVVCVV, VVVCVVV,
VVCVVVV, VCVVVVVV, CVVVVVV
7 × (.386 .62) = .013
5 VVVVVCC, VVVVCCV, VVVCCVV, VVCCVVV, VCCVVVV, CCVVVVVV,
VVVVCVC, VVVCVVC, VVCVCVV, VCVCVVV, CVCVVVV,
VVVCVVC, VVCVVCV, VCVVCVV, CVVCVVV,
VVCVVVC, VCVVVCV, CVVVCVV,
VCVVVVC, CVVVVCV,
CVVVVVC
21 × (.385 .622) = .064
4 VVVVCCC, VVVCCCV, VVCCCVV, VCCCVVV, CCCVVVV,
VVVCCVC, VVCCVCV, VCCVCVV, CCVCVVV,
VVCCVVC, VCCVVCV, CCVVCVV, VCCVVVC, CCVVVCV, CCVVVVC,
VVVCVCC, VVCVCCV, VCVCCVV, CVCCVVV,
VVCVVCC, VCVVCCV, CVVCCVV, VCVVVCC, CVVVCCV, CVVVVCC,
VVCVCVC, VCVCVCV, CVCVCVV, VCVCVVC, CVCVVCV, CVCVVVC,
VCVVCVC, CVVCVCV, CVVCVVC, CVVVCVC
35 × (.384 .623) = .174
3 CCCCVVV, CCCVVVC, CCVVVCC, CVVVCCC, VVVCCCC,
CCCVVCV, CCVVCVC, CVVCVCC, VVCVCCC,
CCVVCCV, CVVCCVC, VVCCVCC, CVVCCCV, VVCCCVC, VVCCCCV,
CCCVCVV, CCVCVVC, CVCVVCC, VCVVCCC,
CCVCCVV, CVCCVVC, VCCVVCC, CVCCCVV, VCCCVVC, VCCCCVV,
CCVCVCV, CVCVCVC, VCVCVCC, CVCVCCV, VCVCCVC, VCVCCCV,
CVCCVCV, VCCVCVC, VCCVCCV, VCCCVCV
35 × (.383 .624) = .284
2 CCCCCVV, CCCCVVC, CCCVVCC, CCVVCCC, CVVCCCC, VVCCCCCC,
CCCCVCV, CCCVCVC, CCVCVCC, CVCVCCC, VCVCCCC,
CCCVCCV, CCVCCVC, CVCCVCC, VCCVCCC,
CCVCCCV, CVCCCVC, VCCCVCC,
CVCCCCV, VCCCCVC,
VCCCCCV
21 × (.382 .625) = .279
1 CCCCCCV, CCCCCVC, CCCCVCC, CCCVCCC,
CCVCCCCC, CVCCCCC, VCCCCCC
7 × (.38 .626) = .151
0 CCCCCCC 1 × (.627) = .035

(6) don 1 dec: practicum 2

Huiswerk vooraf: Eerste werkstuk: Aanvulling:
Misschien wil je deze opdracht wel heel graag in Microsoft Word maken, en weet je niet hoe je daarvan een PostScript of PDF document kunt maken. Dat is echter niet zo moeilijk. Lees mijn aanwijzingen hiervoor.

(7) maandag 5 dec: college 5

Centraal Limiet Theorema. Normale (gaussische) verdeling. Toetsen op normaliteit. Standard error of the mean.

Lezen: Chapters 7 en 8.

Huiswerk vooraf:

(8) woensdag 7 dec: college 6

Schatting. Betrouwbaarheidsinterval.

Lezen: Chapter 9.

Huiswerk vooraf:

(9) don 8 dec: practicum 3

Huiswerk vooraf:

zondag 11 dec: deadline werkstuk 1

maandag 12 dec:

geen bijeenkomst, i.v.m. gast-optreden van docent elders. LET OP: Besteed wel tijd aan de leesstof en aan het huiswerk, want dat loopt gewoon door!

(10+11) woensdag 14 dec: college 7+8

Principes van hypothese-toetsing. Type-I en Type-II fouten. Significantie en power.

Recapitulatie

Lezen: Chapter 10.

Huiswerk vooraf: Verwijzingen:

Update [2005.12.14]:
Helaas heb ik jullie vandaag in verwarring gebracht met een fout voorbeeld, over de toetsing van een proportie π. We gingen uit van H0: π=.5, in een populatie van levend geboren eenlingen is precies de helft een jongetje. We doen een steekproef bij n=1000 pasgeborenen en observeren in de steekproef dat er 515 jongetjes, en 485 meisjes zijn, dus p=.515. Let op: "p" slaat hier op de proportie in de steekproef, en niet op de significantie. Is deze proportie "significant", d.w.z. afwijkend van wat we op basis van toeval kunnen verwachten?
Gebruik de stappen op p.416 om z te berekenen:
z = 0.015 / sqrt(0.25/1000) = 0.947 ≈ 0.95
Gebruik dan de tabel achterin het boek om de significantie van dit resultaat te bepalen: Hoe groot is de kans (weer "p" genoemd) op deze z als H0 waar is? Dat zoeken we op achterin het boek — en daar ging ik tijdens college de fout in.
In de tabel moet je zoeken naar z*=0.95, d.w.z. rij 0.9 en kolom .05, en je ziet daar p=.8289. Dat is dus (bij benadering) de kans op z≤0.95, ofwel de kans dat de verhouding 515:485 of minder extreem is (meer richting 500:500), als H0 waar is. Deze kans is vrij groot. De kans dat z>0.95, ofwel de kans dat de verhouding meer extreem is dan 515:485, is 1-p=.1711. Als we zouden besluiten H0 te verwerpen, en daarmee concluderen dat dit een "significante" (niet door het toeval voorspelde) verdeling is, dan hebben we dus p=.171 kans op een foute beslissing (Type-I-fout). Dat is een nogal grote kans op een foute beslissing, en daarom is het veiliger om H0 niet te verwerpen. Met andere woorden: dit resultaat is niet in tegenspraak met H0, en er is dus geen overtuigend bewijs om H0 te verwerpen.

Reken nu zelf uit wat de significantie is, als we in de steekproef 541 jongetjes en 459 meisjes zouden vinden.

Lees nog eens door wat de rationale is (het principe) bij de toetsing van hypotheses (p.418 e.v.), zoals geïllustreerd in het voorbeeld hierboven en in het boek.

Vergeet ook niet om Activities 9.1 en 9.2 uit te voeren tijdens het kerst-reces!

(12) don 15 dec: practicum 4

Huiswerk vooraf: Tweede werkstuk:

weken 51 en 52: Kerstvakantie

Tussen 19 en 31 december wordt er geen onderwijs gegeven in onze Faculteit.

week 01: geen bijeenkomsten

De bijeenkomsten in deze onderwijsweek komen te vervallen.
Je kunt wel zelfstandig werken aan je tweede werkstuk. Vergeet ook niet om Activities 9.1 en 9.2 uit te voeren tijdens het kerst-reces!

En als je je mocht vervelen, kijk dan eens naar ongebruikelijk onderzoek, bij www.improbable.com!

vrijdag 6 januari 2006: deadline werkstuk 2

Voor de aardigheid zie je hier een histogram dat wèl voldoet aan de beschrijving van opgave DP.07.43.b, met variërende klasse-intervallen. Je snapt inmiddels dat zo'n histogram niet te maken is met SPSS. Hier heb ik S-Plus gebruikt, en wel de volgende drie commando's:
dp0743 <- read.table( "d:\\cdrom_dp\\manual install\\datasets\\textbook\\chapter 07\\ascii comma\\ex0743.txt", header=T )
hist( dp0743$Body.mass, breaks=c(0,5,10,15,20,25,30,40,50,100,500), xlim=c(0,500), cex=1.5 )
title( "Devore & Peck (2005) Exr.07.43" )
DP0743b histogram
Je ziet dat het niet zo vreemd is dat SPSS zo'n histogram niet wil maken. De oppervlakten van de balkjes zijn immers zeer misleidend. De drie observaties tussen 50 en 100 gram krijgen een disproportioneel grote balk ten opzichte van de 46 observaties tussen 0 en 50 gram. De ene outlier veroorzaakt een balk met extreem grote oppervlakte (weer ten opzichte van de 46 laagste observaties); die grote oppervlakte wekt de visuele indruk dat er veel observaties tussen 100 en 500 zouden zijn, quod non.

(13) maandag 9 januari 2006: college 9

Presentatie en analyse van bivariate data. Correlatie.

Lezen: Chapter 5.

Huiswerk vooraf:

(14) woensdag 11 januari: college 10

Chi2; associatie; goodness-of-fit.

Lezen: Chapter 12.

Huiswerk vooraf:

(15) don 12 jan: practicum 5

Tijdens dit practicum gaan we opgaven 5.12, 5.42 en 5.64 uitwerken in SPSS.

(16) maandag 16 januari 2005: college 11

Vergelijking van 2 gemiddelden. De t-toets.

Lezen: Chapter 11.

Huiswerk vooraf:

Aanvulling:
Bij paarsgewijze vergelijking kan je de zgn. teken-toets (sign test) gebruiken als een eenvoudige verdelingsvrije toets. Deze toets is bijna uit het hoofd toe te passen. Deze toets kijkt alleen naar het teken (richting, positief of negatief) van het verschil d tussen twee condities. Als H0:d=0 waar is, dan heeft de helft van de verschillen een positief teken (plus) en de andere helft een negatief teken (min). De teken-toets gebruikt de binomiaal-verdeling, met kans p=.5 op een "succes" (positief verschil). Zie college 4 voor uitleg van de binomiaal-verdeling.
Bij Example 11.8 (p.484, ook in opgave DP.11.38) zien we dat er een positief verschil is bij 8 van de 8 mannen: de hoeveelheid melkzuur in hun bloed is altijd groter na het sporten dan ervoor. Hoe groot is de kans op dit resultaat als H0 waar is? Dat rekenen we uit met de binomiaal-verdeling (Appendix A.1, p.719 ff):
P(8 successen in 8 pogingen) = 1 · (.5)8 · (.5)0 = 1 · .004 · 1 = .004
Deze kans is kleiner dan de conventionele α=.05, en dus verwerpen we H0. De hoeveelheid melkzuur is significant groter na het sporten dan voor het sporten.
De teken-toets is conservatiever dan de paarsgewijze t-toets. Als een verschil significant is volgens de teken-toets, dan is het ook altijd significant volgens de gevoeliger t-toets.
Voer zelf de teken-toets uit op het probleem in opgave DP.11.36 (p.486).

(17) woensdag 18 jan: college 12

Vergelijking van meer dan 2 gemiddelden. One-way analysis of variance. Post-hoc vergelijkingen.

Lezen: Chapter 15.

Huiswerk vooraf:

(18) don 19 januari: practicum 6

Derde werkstuk: Dit werkstuk telt als een deeltoets voor je eindcijfer.
Maak alle opdrachten en beantwoord alle vragen in hoofdstuk 7 van de Handleiding. Zorg dat je uitwerkingen weer resulteren in een samenhangend, vloeiend betoog waarin eventuele grafieken en tabellen een natuurlijke rol vervullen. Maak dus een verhaal met een kop en midden en staart, met inleiding en conclusies.
Lever je document weer in via Ephorus, met dit formulier. Je werkstuk moet weer bestaan uit een document in PDF, Postscript of als MS Web Archive — geen MS Word!
Je moet je document weer inleveren via Ephorus, een webstek voor plagiaat-detectie, via dit formulier. Vul als inlevercode in Stat0506 Statistiek0506 (met hoofdletter). Je werkstuk wordt dan eerst gecontroleerd op plagiaat, en daarna doorgestuurd.
Als je het werkstuk met een medestudent hebt gemaakt, lever dan allebei hetzelfde (identieke) document in, met daarin de namen en studentnummers van beide auteurs.
Deadline is vrijdag 27 januari! Neem bij vragen contact op met de docent.

Benodigde bestanden: television.sps (syntax), television.dat (data).

Lezen:

(19) maandag 23 jan: college 13

Let op: Dit college is vervallen! De stof is behandeld bij college 12 (woensdag 18 jan).

Two-way analysis of variance. Interactie.

Huiswerk vooraf:

(20) woensdag 25 jan: college 14

De wetenschappelijke methode. Ethische aspecten van onderzoek. Omgang met proefpersonen en informanten. Fraude en plagiaat.

Lezen:
Nederlandse Gedragscode Wetenschapsbeoefening: Principes van goed wetenschappelijk onderwijs en onderzoek, door VSNU, zie download-verwijzing onderaan persbericht.

Huiswerk vooraf: Verwijzingen:

(21) don 26 jan: practicum 7

Vierde werkstuk: Dit werkstuk telt als een deeltoets voor je eindcijfer.
Maak alle opdrachten en beantwoord alle vragen in hoofdstuk 8 van de Handleiding. Zorg dat je uitwerkingen resulteren in een samenhangend, vloeiend betoog waarin eventuele grafieken en tabellen een natuurlijke rol vervullen. Maak dus een verhaal met een kop en midden en staart, met inleiding en conclusies.
Je moet je document weer inleveren via Ephorus, een webstek voor plagiaat-detectie, via dit formulier. Vul als inlevercode in Stat0506 Statistiek0506 (met hoofdletter). Je werkstuk wordt dan eerst gecontroleerd op plagiaat, en daarna doorgestuurd.
Als je het werkstuk met een medestudent hebt gemaakt, lever dan allebei hetzelfde (identieke) document in, met daarin de namen en studentnummers van beide auteurs.
Deadline is donderdag 2 februari!! Neem bij vragen contact op met de docent.

Huiswerk vooraf: Benodigd: bestand enq2005.sav met resultaten van enquete, en het bijbehorende codebook.

vrijdag 27 jan: deadline werkstuk 3

(22) maandag 30 jan: vragenuurtje

Vragen-uurtje.
Deze laatste bijeenkomst is gereserveerd als vragen-uurtje, ter voorbereiding op het eindtentamen. Er zal geen nieuwe stof gepresenteerd worden, maar je kan vragen stellen over alle colleges en practica, of over het boek en andere leesstof.

Vooraf:

woensdag 1 februari 2006: tentamen

14:00 tot 16:30 uur, Drift 23, zaal 2.xx.
Het wordt een open-boek-tentamen, waarbij je gebruik mag maken van:
  1. het boek van Devore & Peck, Statistics etc,
  2. het boek van De Vocht, Basishandboek SPSS 12 etc,
  3. je aantekeningen,
  4. een rekenmachine,
  5. de practicum-handleiding.
Kijk nog eens naar het tentamen.
Vergeet ook niet om de online cursus-evaluatie in te vullen, via www.let.uu.nl/oce, onder Statistiek 2005-06.

donderdag 2 febr: deadline werkstuk 4

post mortem

Naar aanleiding van jullie antwoorden bij het tentamen probeer ik hier nog een paar misverstanden recht te zetten.
Vraag 1:
Sommigen noemden hier begripsvaliditeit, de vertaling van construct validity. Daarmee wordt niet bedoeld of de studenten de stof wel hebben begrepen [deze verwarring lijkt afkomstig te zijn uit een voorbeeld uit een ander boek]. Construct validiteit gaat over de vraag of wat er gemeten/geobserveerd wordt, ook een goede weerspiegeling is van het begrip (construct, concept, onderwerp, grootheid) waarin de onderzoeker geïnteresseerd is. Bijvoorbeeld: ik onderzoek een hypothese over de activatie van woorden in het mentale lexicon; vormen de geobserveerde reactietijden in taak XYZ een goede weerspiegeling van dat theoretische concept?
Vraag 3:
Vraag 3.a ging meestal goed, maar in jullie antwoorden miste ik het begrip "verklaarde variantie". In vraag a. hebben we een outlier, die veel variantie veroorzaakt, omdat deze ver verwijderd is van het centrum van de puntenwolk. Die variantie wordt nauwelijks verklaard door het lineaire model, dus is r (proportie verklaarde variantie) dan ook lager. De meesten hebben dit goed geantwoord, in andere bewoordingen.
In vraag 3.b hebben we een extra observatie dicht bij de regressielijn, maar wel weer ver verwijderd van het centrum. Deze observatie zorgt dus weer voor veel variantie, maar die kan nu wel goed verklaard worden met het lineaire model. Het netto resultaat is dat de correlatie-coëfficiënt r toeneemt, en niet gelijk blijft.
Het is overigens niet het maar de coëfficiënt. En blijf op de spelling letten! Een helling is steil (niet stijl), en langs zo'n helling stijgt iets op (niet steigt). Je kan ook stijgen op een steiger, maar wel in stijl.
Vraag 4.a
Dit is paarsgewijze toetsing. Gebruik de juiste formule (par.11.2), met N=6. We vinden t=2.83, met tweezijdige toetsing, p=.037. Verwerp H0. Voor de meesten was dit geen probleem.
Vraag 4.b
Dit kan op twee manieren, waarvan de eerste is uitgelegd tijdens college, en op deze webpagina, hierboven bij college 11. De tweede methode hebben we niet behandeld maar werd desalniettemin door twee studenten gebruikt.
Eerste methode, exacte berekening, m.b.v. binomiaal-verdeling:
We hebben N=6, waarvan x=5 positieve verschillen, gebruik binomiaalverdeling met p=.5,
P(x=5) = 6 · (.5)5 · (.5)1 = 6 · (.03125) · (.5) = 0.09375,
evenzo P(x=6) = .015625,
dus P(x≥5|H0) = .09375 + .015625 = .109. Deze P>α, dus is er geen reden om H0 te verwerpen.
Tweede methode, asymptotische berekening (Fisher Sign Test), m.b.v. standaard-normaal-verdeling:
Er zijn 5 positieve en 1 negatief verschil, bereken verschil D = 5-1 = 4, bereken Z = (|D|-1) / √N = 3 √6 = 1.225, P(Z>1.225) = .110. (Je ziet dat deze benadering goed in de buurt komt van de exacte waarde hierboven.) Deze P>α, dus is er geen reden om H0 te verwerpen.
Bron: G.A. Ferguson & Y. Takane (1989). Statistical Analysis in Psychology and Education (6th ed.). New York: McGraw Hill. p.435.
Vraag 4.c
In het algemeen ging dit wel goed bij de studenten die vraag 4.b ook goed hadden.
In par.10.5 wordt uitgelegd hoe je de power kan berekenen. Dat kan je ook toepassen op ons voorbeeld (vervang overal x door xd). Laten we aannemen dat het verschil 4 uur huiswerk bedraagt, en dat H0 dus eigenlijk onwaar is.
Met N=6 (df=5) en α=.05 vinden we dat t≥2.57, dus verwerp H0 indien gemiddelde van xd≥3.635. We nemen aan dat het verschil xd normaal is verdeeld, met μ=4 en σ=3.464. De kans om een waarde voor het gemiddelde verschil te vinden die gelijk is aan of groter dan deze kritieke waarde (xd=3.635, Z=-0.105) is dan .54, en dat is dan de power van deze toets. Deze power is onacceptabel laag, omdat de steekproef te klein is, en/of het verschil te klein, en/of de spreiding te groot.
Als we hetzelfde zouden doen bij N=36 (df=35) dan vinden we een acceptabele power van .79.
Op grond van deze fictieve pilot-studie weten we dus dat we minstens 36 proefpersonen nodig hebben in een groter onderzoek, als we het verschil in huiswerk-inspanning willen aantonen.
De power van de teken-toets is niet zo eenvoudig uit te rekenen, maar kan wel gesimuleerd worden. Ik heb de computer 10000 steekproeven van xd laten trekken (met N=6) en analyseren, en vond daarbij een power van .46; dat is inderdaad nog lager dan de power van .54 in de vergelijkbare t-toets.
Voor echte nerds volgen hier de instructies voor mijn simulatie, in S-Plus of in R:
 pv <- NA
 for (i in 1:10000) { d<-rnorm(6,4,3.464); bt<-binom.test(sum(d>0),6); pv<-append(pv,as.numeric(bt[[3]])) }
 pv <- pv[2:length(pv)]
 sum(pv<.05)/length(pv)
Vraag 5:
Het volgende uitstekende antwoord kwam ik een paar keer tegen in vrijwel gelijke bewoordingen (hier enigszins geredigeerd):
* Bij de randomized block test is er slechts één factor van belang voor de onderzoeksvraag, bij two-factor ANOVA zijn dat er twee.
* Bij de randomized block test is er geen interactie tussen factoren [want er is er maar een, HQ], bij two-factor ANOVA is er wel interactie.
* Bij de randomized block test zijn de blocks of deelnemers de eenheden van analyse [en van sampling, HQ] met meerdere observaties per eenheid, terwijl bij two-factor ANOVA de afzonderlijke observaties ook de eenheden van analyse zijn, met één observatie per eenheid.
Vraag 6:
"Wel inlichten" kiezen 5 studenten, "niet inlichten" kiezen 23 studenten, en 5 studenten hebben een zeer genuanceerde of geen heldere mening hierover. De meesten van jullie kwamen tot een eigen afweging, maar je moest ook de criteria uit de Gedragscode Wetenschapsbeoefening van de VSNU (zie college 14 hierboven) gebruiken bij je antwoord.

Verder lezen

Er zijn letterlijk honderden inleidende boeken over statistiek te vinden. Een goede selectie vindt je bij HyperStat Online (gelieerd aan de webstek van het Rice Virtual Lab in Statistics; zie hieronder). Andere suggesties zijn de volgende:

Verder grazen

Je kunt ook een kijkje nemen bij de cursuspagina's van vorige jaargangen: 2002, 2003, 2004.


© 2001-2006 HQ 2006.02.27

Valid HTML 4.01! Valid CSS!