Methoden van Experimenteel Onderzoek

cursuscode 200200305
2002-2003, blok 3, februari-april


Nieuws | Praktisch | Inhoud | Onderwijsvorm en toetsing | Draaiboek | Wat nu?


Nieuws

  1. [2003.04.16] Vandaag heb ik de eindcijfers vastgesteld; je kunt die zien in WebCT onder "Resultaten". Bij de huiswerkopdrachten heb ik alleen een globaal oordeel vastgesteld, op basis van alle uitwerkingen en reviews, en rekening houdend met het niveau van je medestudenten.
    Ik stel nog wel prijs op een formele evaluatie van deze cursus! Meestal doe ik dat bij een tentamen, maar daar kwam het nu niet van. Ik zal wat evaluatieformulieren in mijn postvak leggen (Trans 10, kamer 1.21). Wees zo goed om er daar eentje van in te vullen, met potlood of zwarte pen, en in mijn postvak terug te leggen. Je blijft anoniem.
    Graag wil ik jullie feliciteren met de goede resultaten. Ik heb het erg prettig gevonden om jullie les te geven! Hopelijk tot ziens bij een andere gelegenheid.
  2. [2003.04.08] De tekst van de eindopdracht stond al eerder op WebCT, en nu ook hieronder op deze webpagina. Deadline is maandag 14 april 2003, 23:55 uur.
    Zoals aangekondigd wordt je eindcijfer bepaald door de 8 wekelijkse opdrachten (elk 10%) en de eindopdracht (20%).
  3. [2003.03.28] Bij College 1 heb ik een verwijzing toegevoegd naar een handige webstek vol web-gereedschappen voor statistical computation, by Richard Lowry, Vassar College, Poughkeepsie, NY.
  4. [2003.03.17] Kijk eens naar deze uitwerking van college 3, opdracht 2. Je kunt de Repeated Measures ANOVA het beste doen met het commando MANOVA (en liever niet met het commando GLM). Kijk in de uitwerking naar de juiste vorm van het MANOVA commando in het Syntax venster, en lees mijn poging tot exegese van de uitvoer.
  5. [2003.02.12] Zojuist heb ik het volgende bericht geplaatst op het WebCT prikbord van deze cursus. Dit prikbord zullen we gebruiken om uitwerkingen van opdrachten in te leveren, en elkaars werk te beoordelen.
    beste studenten,
    Dit is een aankondiging (en test) over hoe we opdrachten kunnen inleveren en feedback daarop geven.
    We doen dat via dit prikbord, zodat alle informatie voor iedereen zichtbaar is.
    Plaats je uitwerkingen in 1 document per week op het prikbord, uiterlijk vrijdag 23:55uur. Doe dat in de vorm van een bericht naar het prikbord (Compose Message), met een attachment aan je bericht. Dat moet in 2 stappen (bij paperclip-icoon rechtsonder): 1. Kies bestand met uitwerkingen (Browse), 2. Plak bestand aan bericht (Attach). Kies als onderwerp (Subject) "college N, uitwerking S" waarin je N en S vervangt door het betreffende college-nummer en je naam.
    Bij dit test-bericht plak ik de model-antwoorden van Statistiek als test-aanhangsel.
    Als het allemaal goed gaat kan je ieders uitwerkingen lezen. Probeer dat uit (knop Attachments). Haal het bericht+document op van de student die je gaat reviewen, en schrijf je review in een afzonderlijk document. Plaats je review ook weer op het prikbord (uiterlijk maandag 23:55uur). Kies als onderwerp "college N, uitwerking S1, review S2". Een schema voor wie wie reviewt zal ik snel aankondigen.
    Graag ontvang ik van iedereen een bevestiging dat je dit bericht in WebCT gelezen hebt. Plaats een kort berichtje op het prikbord van de strekking "ja ik ben er", en vermeld daarin ook je favoriete e-mail adres en (mobiel) telefoonnummer. Medestudenten en ondergetekende kunnen dan makkelijk contact met je opnemen als dat nodig is.
    Veel succes!
    Hugo
    PS: Uitwerkingen en reviews mogen van formaten HTML, (Word) DOC, of PDF zijn. Ook ongeformatteerde tekst, "platte ASCII", is uiteraard toegestaan.
    In aanvulling daarop: Wees zo verstandig om je uitwerkingen en reviews in het juiste "topic" te plaatsen, d.w.z. bij het college waarop het betrekking heeft.
  6. In dit overgangsjaar is de cursus wat anders van opzet dan voorheen, en ook anders dan aangekondigd in studiegids en cursuskrant. Er zijn slechts enkele inschrijvingen, van studenten met nogal verschillende programma's en achtergronden. De cursus is daarom vooral gericht op individueel werk, en niet zozeer op klassikaal onderwijs.
    Dit betekent dat we slechts één maal per week bij elkaar zullen komen, op dinsdagmiddag. De eerste bijeenkomst is op 11 februari. De nadruk ligt op zelfstudie, op het uitwerken van opdrachten, en op 'peer review'. Voor iedere bijeenkomst moet je het volgende doen:
    1. opdrachten uitwerken over de stof van de vorige bijeenkomst;
    2. uitwerkingen inleveren bij een collega-student, via WebCT, uiterlijk vrijdag;
    3. uitwerkingen van je collega becommentariëren en beoordelen, uiterlijk maandag;
    4. nieuwe leesstof bestuderen.
    In de werkcolleges zullen we jullie uitwerkingen bespreken aan de hand van elkaars beoordelingen, en de bestudeerde leesstof bespreken.

Praktische informatie

Docent

Hugo Quené
e-mail Hugo.Quene@let.uu.nl,
Trans 10, kamer 2.25,
spreekuur: dinsdag 14:00-15:30 en volgens afspraak

Leesstof

Bij ontstentenis van een geschikt lesboek zullen we hoofdstukken uit verschillende boeken gebruiken. Dit materiaal komt beschikbaar via het secretariaat Taalwetenschap, Trans 10, kamer 1.21.

Rooster

cursusjaar 2002-2003, blok 3
dinsdag 13:00-16:00KNG 80, 1.31werkcollege

Inhoud

Onderwijsvorm en toetsing

Er is slechts één bijeenkomst per week, op dinsdagmiddag. De nadruk ligt op zelfstudie, op het uitwerken van opdrachten, en op 'peer review'.

Voor iedere bijeenkomst moet je het volgende doen:
  1. opdrachten uitwerken over de stof van de vorige bijeenkomst;
  2. uitwerkingen inleveren bij een collega-student, via WebCT, uiterlijk vrijdag;
  3. uitwerkingen van je collega becommentariëren en beoordelen, uiterlijk maandag;
  4. nieuwe leesstof bestuderen.
In de werkcolleges zullen we jullie uitwerkingen bespreken aan de hand van elkaars beoordelingen, en de bestudeerde leesstof bespreken.

Peer review, het becommentariëren en beoordelen van andermans werk, is uiteraard een serieuze zaak. Je kan er meer over leren via de volgende webpagina's: Je eindcijfer wordt bepaald door de 8 wekelijkse opdrachten (elk 10%) en de eindopdracht (20%).

terug naar begin


Draaiboek

(1) dinsdag 11 febr: college 1

Experimenteren. Algemene methodologie. Ontwerp van experiment.
Peer review

Lezen: Vooraf: Opdrachten:
Je uitwerkingen voor opdracht 1-3 moet je inleveren in electronische vorm in WebCT: acceptabele formaten zijn Word (regelafstand 1.5, lettergrootte 11pt, of meer), PDF (idem), of HTML. Schrijf helder, bondig, en foutloos Nederlands (of andere taal in overleg).
  1. Ga naar de Letterenbibliotheek. Neem een recent nummer (2002) van een fonetisch of experimenteel taalwetenschappelijk tijdschrift, bv. Language and Speech, Journal of Phonetics, Speech Communication, Phonetica, enz.
    (a) Welke vragen probeert het onderzoek te beantwoorden?
    (b) Welke onafhankelijke en afhankelijke variabelen zijn bij het onderzoek betrokken?
    (c) Omschrijf het ontwerp (design) van het experiment.
  2. Een onderzoeker wil weten of de klinkerduur in beklemtoonde klinkers langer is dan in onbeklemtoonde klinkers. Er zijn twee groepen proefpersonen, en de onderzoeker is geïnteresseerd in het verschil tussen deze twee groepen (bv. moedertaalsprekers en L2 sprekers). De klinkers komen voor in de eerste danwel derde lettergreep van drielettergrepige woorden. Om te voorkomen dat de sprekers het doel van het experiment ontdekken, mag een spreker geen woordparen met alternerende klemtoon uitspreken, zoals àlmanak – abrikóos: alle woorden die een spreker uitspreekt moeten hetzelfde klemtoonpatroon hebben.
    Omschrijf een mogelijk ontwerp voor dit experiment. Geef daarbij aan welke factoren between-subjects en within-subjects zijn, wat de relaties tussen die factoren zijn, hoe variabelen worden gecombineerd, enz. Maak daarbij een schema om een en ander te verduidelijken.
  3. Beantwoord de volgende opgaven in de leesstof van Maxwell & Delaney, Chapter 1: Exercises 1, 5, 6, 7, 10.
  4. Deze opdracht is niet voor peer review maar voor zelfstudie. Beantwoord (nogmaals) de vragen van het tentamen Statistiek. Bestudeer daarna de model-antwoorden, en stel vast welke onderdelen van de stof je wellicht nog onvoldoende beheerst. Stel een actieplan op om je lacunes bij te spijkeren via zelfstudie, gedurende dit blok.
Verwijzingen:

(2) dinsdag 18 febr: college 2

ANOVA: algemeen, interactie, fixed en random factoren, error terms.

Lezen: Ferguson, G. A., & Takane, Y. (1989). Statistical Analysis in Psychology and Education (6th ed.). New York: McGraw-Hill. Chapter 16 "Analysis of Variance: Two-Way Classification", pp. 272-296.

Opdrachten:
Je uitwerkingen voor onderstaande opdrachten moet je weer inleveren in electronische vorm in WebCT: acceptabele formaten zijn Word (regelafstand 1.5, lettergrootte 11pt, of meer), PDF (idem), HTML, of "platte ASCII" tekst. Schrijf helder, bondig, en foutloos Nederlands (of andere taal in overleg).
  1. Beantwoord de volgende opgaven in de leesstof van Ferguson & Takane, Chapter 16: Exercises 1, 5, 8.
  2. In een studie naar cardiovasculaire risico-factoren werden hardlopers die minstens 15 mijl per week lopen, vergeleken met een controle-groep die als "generally sedentary" wordt omschreven. Zowel mannen als vrouwen namen deel in de studie. Het ontwerp is een 2x2 between-subjects ANOVA, met Groep en Geslacht als factoren. Er waren 200 deelnemers voor iedere combinatie van factoren. Eén van de afhankelijke variabelen is de hartslag van een deelnemer na 6 minuten op een loopband, in slagen-per-minuut.
    Gegevens van dit onderzoek zijn hier beschikbaar in SPSS formaat of als tekst (de eerste regel bevat hier de namen van de variabelen).
    (a) Geef aan welke hulp-theorieën à la Meehl nodig zijn voor deze studie. En hoe zit het met de construct-validiteit?
    (b) Is het toegestaan om variantie-analyse te verrichten op deze gegevens? Geef een gemotiveerd antwoord met relevante statistische overwegingen.
    (c) Verricht een twee-weg ANOVA op deze gegevens.
    (d) Schrijf een samenvatting van de resultaten van dit onderzoek, en trek heldere conclusies.
    (e) Trek uit iedere combinatie van factoren een steekproef van n=20 deelnemers, uit de 200 deelnemers in het gegevensbestand. Leg uit hoe je steekproef tot stand is gekomen. Herhaal de twee-weg ANOVA op deze kleinere gegevensverzameling.
    (f) Bespreek de overeenkomsten en verschillen in uitkomsten tussen (b) en (d).
    Deze opgave is ontleend aan: Moore, D.S., & McCabe, G.P. (2003). Introduction to the Practice of Statistics (4th ed.). New York: Freeman. Example 13.8, pp.813-816.
  3. In een denkbeeldige studie werd het effect van een groeimiddel onderzocht. Het groeimiddel werd toegediend in 5 verschillende doseringen (van 1, 3, 5, 10, en 20 eenheden per dag), aan 10 mannen en aan 10 vrouwen voor iedere dosering, gedurende 15 dagen. De afhankelijke variabele is de toename in lichaamslengte van een deelnemer na 15 dagen, in cm.
    Gegevens van dit denkbeeldige onderzoek zijn hier beschikbaar in SPSS formaat of als tekst (de eerste regel bevat hier de namen van de variabelen).
    (a) Importeer de gegevens in SPSS of een ander statistisch pakket naar keuze. Maak een grafiek van de toename in lichaamslengte voor elk van de 10 condities. (Hint: Kies in SPSS voor een "clustered boxplot".) Bespreek wat je ziet in die grafiek.
    (b) Verricht een twee-weg ANOVA op deze gegevens, met Geslacht en Dosering als twee "fixed" factoren.
    (c) Wat is het bereik van de generalisatie over doseringen, bij de ANOVA uit (b)? Bespreek de externe validiteit van deze factor in het onderzoek.
    (d) Verricht weer een twee-weg ANOVA op deze gegevens, maar nu met Dosering als "random" factor. (Hint: SPSS weet niet goed raad met een "mixed" model zoals dit. Je doet er het beste aan om de F-ratio's met de hand uit te rekenen, op basis van de resultaten bij (b) hierboven.)
    (e) Wat is nu het bereik van de generalisatie over doseringen, bij de ANOVA uit (b)? Bespreek weer de externe validiteit van deze factor in het onderzoek.
    (f) Bespreek de overeenkomsten en verschillen tussen de twee ANOVA's in deze opdracht. Heeft het groeimiddel een verschillend effect op mannen en vrouwen?

(3) dinsdag 25 febr: college 3

ANOVA: Repeated Measures, post-hoc toetsen.

Lezen: Verwijzingen:
Deze lijst bevat aantekeningen uit vergelijkbare cursussen over onderzoeksmethoden, aan andere universiteiten: Opdrachten:
Je uitwerkingen voor onderstaande opdrachten moet je weer inleveren op de gebruikelijke wijze via WebCT.
  1. Beantwoord de volgende opgaven in de leesstof van Ferguson & Takane, Chapter 19, in je eigen woorden: Exercises 5, 8, 9, 11, 12, 14 (beantwoord bij de laatste oefening niet alleen de wat-vragen maar ook de waarom-vraag).
  2. Voor deze opgave moet je het voorbeeld van Ferguson & Takane §19.9 narekenen in SPSS. Voer de gegevens op de juiste wijze in; je hebt in ieder geval een extra kolom nodig voor R = Group. Bedenk zelf een plausibel onderzoek dat deze gegevens zou kunnen hebben opgeleverd, en behandel deze gegevens alsof het resultaten zijn van dat onderzoek. Bespreek alle relevante aspecten, ook eventuele schendingen van assumpties (§19.10). Trek heldere conclusies.

effect size

Als we twee groepen of gemiddelden met elkaar vergelijken, zoals bij een paarsgewijze t-toets, dan is de effect size d gedefinieerd als: d = (m1-m2)/s (Cohen, 1969, p.18; m staat voor mean).

Een waarde van d=.2 wordt beschouwd als klein (small), d=.5 als medium, d=.8 als groot (large). Het is aan de onderzoeker om tussenliggende waarden zelf te classificeren (ibid., p.23-25).
Het verschil in lichaamslengte van meisjes van 15 en 16 jaar heeft een kleine effect size, net als man-vrouw verschillen bij deeltoetsen van een IQ-test. "A medium effect size is conceived as one large enough to be visible to the naked eye," bv. het verschil in lichaamslengte tussen meisjes van 14 en 18 jaar oud. Large effect sizes are "grossly perceptible", bv. het verschil in lichaamslengte tussen meisjes van 13 en 18 jaar oud, of het verschil in IQ tussen gepromoveerden en eerstejaars.

Als we k groepen of gemiddelden met elkaar vergelijken, zoals in een F-toets (ANOVA), dan is de effect size f gedefinieerd als: f = sm/s, waarbij sm op z'n beurt gedefinieerd is als de standaarddeviatie van de k verschillende group means (ibid., p.268). Indien k=2, dan d=2f (ibid., p.278). We nemen aan dat de groepen even groot zijn; anders gelden andere criteria dan hier besproken.

Een waarde van f=.10 wordt beschouwd als klein (small), f=.25 als medium, f=.40 als groot (large). Het is weer aan de onderzoeker om tussenliggende waarden te classificeren (ibid., p.278-281).
Ook kleine effecten kunnen belangwekkend of betekenisvol zijn; soms leiden grotere verschillen tot een kleine effect size door meetfouten, storende bijwerkingen, enz. Medium effect size zien we bv. bij verschillen in IQ tussen huisschilders, automonteurs, timmerlieden, en slagers. Grote effect size zien we bv. bij verschillen in IQ tussen huisschilders, automonteurs, treinmachinisten, en laboranten.

Ontleend aan: Cohen, J. (1969). Statistical Power Analysis for the Behavioral Sciences (1st ed.). New York: Academic Press.

(4) dinsdag 4 maart: college 4

regressie, betrouwbaarheid, [GLM, logistische regressie].

Lezen: Opdrachten:
Je uitwerkingen voor onderstaande opdrachten moet je weer inleveren op de gebruikelijke wijze via WebCT.
  1. Deze opdracht is pas zinvol als je de leesstof goed hebt bestudeerd.
    Maak een tochtje door de Reliability Test Maze; deze bestaat uit 10 vragen. Maak (elektronische) aantekeningen. Houd van iedere vraag bij of je die goed of fout hebt beantwoord. Voor de vragen die je FOUT hebt beantwoord, moet je opschrijven waarom je tot je foute antwoord bent gekomen, en waarom dat fout was. Werk deze aantekeningen uit, voor iedere foute vraag in één alinea. Geef ook aan hoeveel vragen je goed hebt beantwoord.

(5) dinsdag 11 maart: college 5

Signal Detection Theory.

Lezen:
Gelfand, S.A. (1990). Hearing: An Introduction to Psychological and Physiological Acoustics (2nd ed.). New York: Marcel Dekker. Chapter 8 "Theory of Signal Detection", pp. 207-217. [ISBN 0-8247-8368-9].

Verwijzingen: Opdrachten:
Je uitwerkingen voor onderstaande opdrachten moet je weer inleveren op de gebruikelijke wijze via WebCT.
  1. Bij een zgn. "Ja/Nee" perceptie-test worden twee soorten stimuli (N en N+S) beide waargenomen volgens een stochastisch proces met standaard-normaal-verdeling. Hieronder vind je de verdeling van de "ja" en "nee" responsies onder beide stimulus-condities. Bereken d' in Z-eenheden.
    stimulus
    NN+S
    "ja" .10 .80
    "nee" .90 .20
  2. Bij een zgn. "Ja/Nee" perceptie-test worden twee soorten stimuli (N en N+S) beide waargenomen volgens een stochastisch proces met standaard-normaal-verdeling. Uit de resultaten blijkt dat d'=2. Bereken de verwachte proportie van "false alarms", indien bekend is dat P(hit) = 90.15%.
  3. Geef van ieder van de onderstaande uitspraken aan of deze juist danwel onjuist is.
    1. De verschillende punten van één ROC-curve corresponderen met verschillende d'-waarden, bij gelijk beslissings-criterium.
    2. De verschillende punten van één ROC-curve corresponderen met verschillende beslissings-criteria, bij gelijke d'.
    3. De verschillende punten van één ROC-curve corresponderen met verschillende d'-waarden, bij gelijke hit-rate.
  4. We hebben twee zgn. "Ja/Nee" perceptie-toetsen afgenomen, in Experimenten I en II. Hierbij werden twee stimuli, N en N+S, beide waargenomen volgens een standaard-normaal-verdeling. In bijgaande tabel vind je de kansen van "hits" en "false alarms" in beide experimenten.
    Exp.IExp.II
    P(hit) .6915 .9713
    P(false alarm) .3085 .4602
    Laat zien bij welk van de twee experimenten de grootste bias optreedt (verschuiving van criterium). Maak hierbij gebruik van (een) ROC-curve(s).
  5. Als je de perceptie van twee soorten stimuli wilt onderzoeken, dan kan dat ruwweg op twee manieren: via een zgn. "Ja/Nee" oordeel over iedere stimulus, of via paarsgewijze vergelijkingen tussen alle mogelijke paren van stimuli. Omschrijf de voordelen en nadelen van deze twee methoden.

(6) dinsdag 18 maart: college 6

Multipele regressie, multivariate analyses.

Lezen: Opdrachten:
Je uitwerkingen voor onderstaande opdrachten moet je weer inleveren op de gebruikelijke wijze via WebCT.
  1. Beantwoord de volgende opgaven bij de opgegeven leessstof: Moore & McCabe, Chapter 11: Exercises 2, 3, 16, 33.
    Gegevens voor de laatste twee opgaven zijn hier beschikbaar in tekst formaat (de eerste regel bevat de namen van de variabelen).

Forward or Backward?

[2003.03.19]

Gisteren heb ik op college uitgelegd dat de BACKWARD methode bij multipele regressie meestal het beste is. Je begint dan met alle predictoren in het model op te nemen, en gooit er steeds eentje uit, en kijkt dan of het model slechter wordt (bv. of er een significante *afname* van R^2 optreedt).

Maar... voor de opdrachten 16 en 33 kan je beter de FORWARD methode gebruiken. De vragen gaan immers over de *toename* van R^2 als je een extra predictor *toevoegt* aan het model. De benodigde gegevens zijn dan makkelijk in de uitvoer van SPSS terug te vinden.

Je zou ook eens kunnen kijken wat er gebeurt als je case #51 verwijdert uit de data. Voor mensen die alles via het Syntax venster doen is dat een koud kunstje!

HSS, SAT, GPA??

Het hoofdstuk van Moore & McCabe leunt sterk op een paar typisch Amerikaanse begrippen. In de USA draait alles om je prestaties, dus ook in school en studie. Het systeem van beoordeling (grading) loopt van A+ (excellent) tot F (fail).
Bij de toelating tot een universiteit wordt gekeken naar twee zaken: (a) je gemiddelde 'grades' in de laatste jaren van high school (HSM, HSS, HSE), en (b) je score in een landelijk toelatingsexamen (Scholastic Aptitude Test, SAT). Gerenommeerde universiteiten zoals Harvard, Yale, of Stanford, selecteren op beide parameters: je moet bv. de beste van jouw high school zijn (maar dat proberen je klasgenoten natuurlijk ook), èn je moet een SAT van minstens zoveel punten hebben.
Tijdens de studie aan een universiteit dragen al je resultaten bij aan je Grade Point Average (GPA), een soort van gewogen gemiddelde cijfer. Dit is een algemeen gebruikte maat voor je studieprestatie. De auteurs proberen om dit GPA te voorspellen aan de hand van eerder gemeten indicatoren (a) en (b).

(7) dinsdag 25 maart: college 7

Nietnormale gegevens, transformatie, nonparametrische toetsen.

Lezen: Verwijzingen: Opdrachten:
Je uitwerkingen voor onderstaande opdrachten moet je weer inleveren op de gebruikelijke manier in WebCT. Controleer je werk op spelfouten (ik beantwoord, zij beantwoordt, de vraag is beantwoord, enz.).
  1. Beantwoord de volgende opgaven in de leesstof van Ferguson & Takane, Chapter 22: Exercises 1, 2, 4, 5, 9, 10, 11.
  2. Memorine is een niet-bestaande stof die het verbale geheugen zou kunnen versterken. In een fictief experiment werd het effect van memorine op het verbale geheugen onderzocht. Luisteraars (n=100) kregen een tekst van 1000 woorden te horen, en moesten na afloop de woorden opnoemen die ze zich nog konden herinneren van die tekst. Dezelfde proefpersonen werden gemeten in een controle-conditie (eerste kolom, "control") en na toediening van 100 mg memorine ("test"). De aantallen herinnerde woorden per luisteraar zijn te vinden in dit bestand (tekst-formaat, met komma tussen twee metingen).
    (a) Formuleer H0 en Ha voor dit onderzoek. Gebruik α=.05 bij alle statistische toetsen voor deze opdracht.
    (b) Neem aan dat de aantallen herinnerde woorden normaal-verdeeld zijn. Gebruik een paarsgewijze t-toets om te onderzoeken of er een significant verschil is tussen de twee condities. Trek heldere conclusies.
    (c) Onderzoek of de aantallen herinnerde woorden inderdaad normaal-verdeeld zijn. Neem relevante diagnostische statistieken en figuren op in je verslag. Bespreek de validiteit van je conclusies van onderdeel (b).
    NB: Normaliter doe je dit onderdeel voor statistische toetsing, en niet pas daarna! Zoals uitgelegd tijdens college zijn er twee mogelijkheden als de afhankelijke variabele niet normaal-verdeeld is: transformeren, of nonparametrisch toetsen.
    (d) transformeren. Maak twee nieuwe variabelen, met daarin de wortel (square root) van de ruwe metingen. Onderzoek of de nieuwe variabelen normaal-verdeeld zijn. Gebruik een paarsgewijze t-toets op de getransformeerde variabelen, om te onderzoeken of er een significant verschil is tussen de twee condities. Trek weer heldere conclusies.
    (e) non-parametrisch toetsen. Neem aan dat de ruwe aantallen herinnerde woorden niet normaal-verdeeld zijn. Gebruik een nonparametrische, paarsgewijze toets om te onderzoeken of er een significant verschil is tussen de twee condities. Trek weer heldere conclusies.
    (f) Bespreek de overeenkomsten en/of verschillen in de conclusies bij de onderdelen (b), (d) en (e). Gebruik in je bespreking o.a. de begrippen validiteit, toetsing, power, significantie, assumptie.

QQ-plot van normaal-verdeelde data

Tijdens college hebben we gesproken over het gebruik van een Normal Probability plot (NP-plot of QQ-plot) om te verifiëren of een variabele normaal verdeeld is. (Je maakt zo'n NP-plot in SPSS via de menu-opties Analyze > Descriptive Statistics > Explore, of via het commando Examine in een Syntax venster.) Maar wat is eigenlijk "normaal"? Je vindt hier een SPSS script om een QQ-plot te maken van random gegenereerde data die normaal-verdeeld zijn. Voor dat script heb je ook dit dummy databestand nodig. Herhaal de twee gemarkeerde commando's in het script, minstens 5 maal, om te wennen aan QQ-plots van normaal-verdeelde data. Let ook op de gerapporteerde Kolmogorov-Smirnov Test of Normality en de significantie daarvan.

(8) dinsdag 1 april: college 8

logistische regressie, GLM, modellering.

Lezen: Verwijzingen: Opdrachten:
Je uitwerkingen voor onderstaande opdrachten moet je weer inleveren op de gebruikelijke manier in WebCT.
  1. Beantwoord de volgende opgaven in de leesstof van Moore & McCabe, Chapter 15: Exercises 8, 10, 12, 25.
    Om het werk aan opgave 15.25 via SPSS te vergemakkelijken heb ik de data daarvan vast op het web gezet, in een bestand in tekst formaat. De eerste regel bevat de namen van de variabelen. Data (N=2900) beginnen op regel 2, en zijn als volgt gecodeerd (met voor mij intuïtief inzichtelijke codes):
    hospital:  0=hosp.A, 1=hosp.B;
    outcome:   0=died, 1=survived;
    condition: 0=poor, 1=good.
    
    Variabelen in dit bestand worden gescheiden door een komma.
    Houd er bij je logistische regressies rekening mee dat de variabelen hospital en condition beschouwd moeten worden als categorische variabelen. En ik vind het handiger om (gezien bovenstaande coderingen) de codes met nul als referentie of baseline te beschouwen (d.w.z. de eerste in rangorde van codes, kies in SPSS voor Reference: First).
    SPSS geeft je geen 95% betrouwbaarheidsintervallen; die moet je zelf met de hand uitrekenen. De Wald statistic in de uitvoer van SPSS is hetzelfde als de test statistic voor β zoals gedefinieerd op p.46 in de leesstof.

(9) dinsdag 8 april: toetsweek

Als eindopdracht moet je een *herziene* ofwel verbeterde versie inleveren van een werkstuk dat je tijdens de cursus (als huiswerk-opdracht) hebt gemaakt. Je mag zelf kiezen welk werkstuk je wilt herzien.
Je herziene versie moet (voor zover mogelijk) een vloeiend betoog zijn, dus geen brokstukken zinnen en statistische uitvoer.
In de herziene versie moet je het commentaar van de reviewer van je eerste versie verwerken -- voor zover je het daarmee eens bent uiteraard. Maak ook gebruik van de leesstof en eventuele web-verwijzingen bij je onderwerp.
Je mag het commentaar van de reviewer bespreken in de tekst van je verbeterde versie. Maar misschien vind je het handiger om een vloeiend betoog te schrijven waarin je niet expliciet ingaat op dat commentaar. Schrijf in dat geval een afzonderlijke tekst waarin je aangeeft welk commentaar je wel/niet hebt overgenomen, en waarom, en hoe. (Zo'n afzonderlijke tekst waarin je ingaat op commentaar van reviewers heet in het jargon een "cover letter to the Editor").
Let op: Je verbeterde werkstuk moet je in twee stappen inleveren. Eerst moet je het/de document(en) uploaden naar de WebCT server (knop Student files). Daarna druk je op de knop Submit assignment om alles definitief in te leveren. Het lijkt me aardig als je je verbeterde werkstuk ook op het prikbord plaatst, zoals we tijdens de cursus hebben gedaan.
De tekst van deze opdracht is ook te vinden via WebCT, onder "eindopdracht".

Deadline is maandag 14 april 2003, 23:55 uur.

Terug naar het begin


2003.04.16 HQ