Statistiek

cursuscode 200300427
2004-2005, blok 2, november-januari


Nieuws

  1. [2005.03.01] Eindelijk zijn ook de laatste opdrachten nagekeken, met excuses voor de vertraging. Al je cijfers moeten nu zichtbaar zijn in WebCT. Binnenkort zal ik de eindcijfers doorgeven aan Osiris. Neem snel contact op als er iets (nog) niet klopt. Dekking en Moreau moeten nog werkstukken inleveren.
    Als je een eindcijfer hebt tussen 5,0 en 5,5, neem dan contact met me op voor aanvullend werk.
    Helaas is het tentamen minder goed gemaakt dan ik had verwacht (dat bleek al uit de evaluaties). Ook de opgave ontleend aan het proeftentamen ging niet altijd goed. Kijk ter lering nog eens naar wat het goede antwoord had moeten zijn.
    Dank voor jullie inzet tijdens de cursus!
  2. [2005.02.01] Je werkstukken kan je ook opnemen in je eigen portfolio, onder Producten. Daarmee laat je zien wat je geleerd hebt. Je kan er ook over schrijven bij je zelfreflectie; wat vond je er moeilijk/ makkelijk/ leuk/ interessant aan?
    Het is het handigste om zo'n werkstuk op je eigen web-schijf W:\ te zetten. In het eigenlijke portfolio neem je dan alleen een verwijzing (URL) op naar dat bestand ergens op jouw webstek. Dat doe je door bij "soort product" te kiezen voor "URL" en dan de juiste URL in te vullen.

Praktische informatie

Docent

Hugo Quené
e-mail Hugo punt Quene at let uu nl,
Trans 10, kamer 1.31,
spreekuur: dinsdag 14:00-15:30 en volgens afspraak

Boeken

We maken gebruik van twee boeken en een web-handleiding:

Rooster

Deze cursus bestaat uit twee practicum-groepen. De precieze indeling zullen we vaststellen in de eerste bijeenkomst. Kijk vast in onderstaand rooster welke tijden jou beter of slechter uitkomen.
Iedere week zijn er twee werkcolleges, voor beide groepen samen, en een practicum-bijeenkomst per groep.
cursusjaar 2004-2005, blok 2
maandag 15.00-17.30Trans 10, 0.17werkcollege
woensdag09.00-12.00KNG 80, 0.06werkcollege
donderdag11.00-13.00KNG 80, 0.07 CLZpracticum 1
vrijdag09.00-11.00KNG 80, 0.07 CLZpracticum 2

Inhoud

Deze cursus heeft tot doel om je de elementaire principes bij te brengen van beschrijvende en toetsende statistiek, en van de rol die deze methoden spelen in het wetenschappelijk onderzoek. Je leert technieken om gegevens te beschrijven, samen te vatten en te presenteren, bv in tabellen, grafieken en statistische kengetallen. Ook de daarvoor vereiste achtergrond komt aan bod: kans en kansrekening, steekproeftheorie, en schatting.
In het wetenschappelijk onderzoek worden gegevens meestal niet alleen beschreven, maar ook gebruikt om een hypothese te toetsen. We gaan in op de algemene principes van zulke toetsing, en je leert de meest gangbare statistische toetsen toe te passen en te interpreteren. Een experiment is een speciale onderzoeksomgeving waarin de relevante variabelen systematisch kunnen variëren; we besteden daarom aandacht aan het ontwerp van een experiment.
In de practica leer je omgaan met SPSS, een computerprogramma voor statistische analyse. Je gebruikt dit pakket om gegevens van jezelf (of van anderen) te beschrijven en te gebruiken voor toetsing.

Onderwijsvorm en toetsing

Deze cursus bestaat uit verschillende componenten. Ten eerste zijn er colleges, op maandag en woensdag. Voorafgaand aan een college moet je leesstof bestudeerd hebben. Na afloop moet je de bijbehorende individuele huiswerkopdrachten maken. Je antwoorden en oplossingen van het huiswerk moet je — in uitgeschreven vorm — meenemen naar het volgende college, waar we e.e.a. zullen bespreken.
Ten tweede zijn er practica op donderdag (groep 1) of vrijdag (groep 2). De invulling daarvan kan variëren: huiswerk bespreken, statistiek "doen" met SPSS, samen werken aan opdrachten, of het resultaat ervan bespreken.

Voor ieder college (tweemaal per week) moet je rekenen op 2u leeswerk vooraf, 2 contacturen, en 4u huiswerk nadien: 16 uur per week. Voor ieder practicum (eenmaal per week) moet je rekenen op 2u zelfstudie, plus 2 contacturen: 4 uur per week. Je wordt dus geacht 20 uur per week aan deze cursus te besteden.

Verslagen en andere teksten moeten electronisch worden ingeleverd via WebCT. Vraag je docent om opheldering als de opdrachten niet duidelijk zijn!

Tijdens de cursus moet je vier werkstukken inleveren. Voor ieder werkstuk kun je maximaal 1 punt verdienen. De cursus wordt afgesloten met een tentamen, waarmee je maximaal 6 punten kunt verdienen. Het eindcijfer bestaat uit de som van de (4x1)+6 behaalde punten.

terug naar begin

Draaiboek

(1) maandag 22 nov: college 1

Variabelen; meetniveau. Empirische cyclus. De rol van statistiek in wetenschappelijk onderzoek. Hypothesen; H1 en H0. Eenheden van analyse.

Lezen: Chapter 1.

Vooraf: Verwijzingen:

(2) woensdag 24 nov: college 2

Eenheden van analyse. Steekproef; sampling. Validiteit. Beschrijvende en toetsende statistiek. Veldwerk, corpus-analyse, experiment.

Deze bijeenkomst is afgelast; de stof zullen we behandelen in het eerstvolgende college, op maandag 29 november.

Lezen: Chapter 2.

Huiswerk vooraf:

(3) don/vrij 25/26 nov: practicum 1

Kennismaking met SPSS. Gegevens invoeren en bewaren.

Zorg dat je een computer-account hebt bij Letteren. Controleer ook of je toegang hebt tot WebCT. Neem je login-gegevens mee naar het practicum!

Lezen: Handleiding, Hoofdstukken 1, 2 en 3.

Benodigde bestanden: vb01.dat, vb02.dat.

(4) maandag 29 nov: college 3

Datareductie. Presentatie. Histogrammen, tabellen, grafieken. Gemiddelde en spreiding.

Lezen: Chapters 3 en 4.

Huiswerk vooraf:

(5) woensdag 1 dec: college 4

Kans, kansrekening; gezamenlijke en onafhankelijke kansen. Binomiaal-verdeling.

Lezen: Chapter 6.

Huiswerk vooraf:
Verwijzingen:

Aanvullingen:

  1. Over de binomiaal-verdeling kan je meer lezen in de Appendix van het boek van Devore & Peck, p.663 e.v.
    De binomiaal-verdeling voor 15 trekkingen is onhandig groot. Hier volgt de uitwerking voor 7 trekkingen, met teruglegging, elk met p=0.38, eerst in formule-vorm (zie p.665), en hieronder uitgeschreven in een tabel:
       P(x klinkers uit 7 trekkingen) =
    1 × p7 + 7 × p6 q + 21 × p5 q2 + 35 × p4 q3 + 35 × p3 q4 + 21 × p2 q5 + 7 × p q6 + 1 × q7 .
    De binomiaal-coëfficienten 1, 7, 21, 35, enz. tref je ook aan in de zgn. Driehoek van Pascal die dit in 1654 heeft bedacht.
aantal
klinkers
mogelijke uitkomsten kans
7 VVVVVVV 1 × (.387) = .001
6 VVVVVVC, VVVVVCV, VVVVCVV, VVVCVVV,
VVCVVVV, VCVVVVVV, CVVVVVV
7 × (.386 .62) = .013
5 VVVVVCC, VVVVCCV, VVVCCVV, VVCCVVV, VCCVVVV, CCVVVVVV,
VVVVCVC, VVVCVVC, VVCVCVV, VCVCVVV, CVCVVVV,
VVVCVVC, VVCVVCV, VCVVCVV, CVVCVVV,
VVCVVVC, VCVVVCV, CVVVCVV,
VCVVVVC, CVVVVCV,
CVVVVVC
21 × (.385 .622) = .064
4 VVVVCCC, VVVCCCV, VVCCCVV, VCCCVVV, CCCVVVV,
VVVCCVC, VVCCVCV, VCCVCVV, CCVCVVV,
VVCCVVC, VCCVVCV, CCVVCVV, VCCVVVC, CCVVVCV, CCVVVVC,
VVVCVCC, VVCVCCV, VCVCCVV, CVCCVVV,
VVCVVCC, VCVVCCV, CVVCCVV, VCVVVCC, CVVVCCV, CVVVVCC,
VVCVCVC, VCVCVCV, CVCVCVV, VCVCVVC, CVCVVCV, CVCVVVC,
VCVVCVC, CVVCVCV, CVVCVVC, CVVVCVC
35 × (.384 .623) = .174
3 CCCCVVV, CCCVVVC, CCVVVCC, CVVVCCC, VVVCCCC,
CCCVVCV, CCVVCVC, CVVCVCC, VVCVCCC,
CCVVCCV, CVVCCVC, VVCCVCC, CVVCCCV, VVCCCVC, VVCCCCV,
CCCVCVV, CCVCVVC, CVCVVCC, VCVVCCC,
CCVCCVV, CVCCVVC, VCCVVCC, CVCCCVV, VCCCVVC, VCCCCVV,
CCVCVCV, CVCVCVC, VCVCVCC, CVCVCCV, VCVCCVC, VCVCCCV,
CVCCVCV, VCCVCVC, VCCVCCV, VCCCVCV
35 × (.383 .624) = .284
2 CCCCCVV, CCCCVVC, CCCVVCC, CCVVCCC, CVVCCCC, VVCCCCCC,
CCCCVCV, CCCVCVC, CCVCVCC, CVCVCCC, VCVCCCC,
CCCVCCV, CCVCCVC, CVCCVCC, VCCVCCC,
CCVCCCV, CVCCCVC, VCCCVCC,
CVCCCCV, VCCCCVC,
VCCCCCV
21 × (.382 .625) = .279
1 CCCCCCV, CCCCCVC, CCCCVCC, CCCVCCC,
CCVCCCCC, CVCCCCC, VCCCCCC
7 × (.38 .626) = .151
0 CCCCCCC 1 × (.627) = .035

(6) don/vrij 2/3 dec: practicum 2

Huiswerk vooraf: Werkstuk: Aanvulling:
Misschien wil je deze opdracht wel heel graag in Microsoft Word maken, en weet je niet hoe je daarvan een PostScript of PDF document kunt maken. Dat is echter niet zo moeilijk. Lees mijn aanwijzingen hiervoor.

(7) maandag 6 dec: college 5

Centraal Limiet Theorema. Normale (gaussische) verdeling. Toetsen op normaliteit. Standard error of the mean.

Lezen: Chapters 7 en 8.

Huiswerk vooraf:

(8) woensdag 8 dec: college 6

Schatting. Betrouwbaarheidsinterval.

Lezen: Chapter 9.

Huiswerk vooraf:

(9) don/vrij 9/10 dec: practicum 3

Huiswerk vooraf:

zondag 12 dec: deadline werkstuk 1

Meer informatie en procedure voor inleveren is te vinden bij WebCT Vista.

(10) maandag 13 dec: college 7

Principes van hypothese-toetsing. Type-I en Type-II fouten. Significantie en power.

Lezen: Chapter 10.

Huiswerk vooraf: Verwijzingen:

(11) woensdag 15 dec: college 8

Recapitulatie. Tussenstand.

Lezen: Chapters 6, 7, 8, 9, 10.

Huiswerk vooraf:

Verwijzingen: mijn beknopte Statistics tutorial (PowerPoint, 12 november 2003).

(12) don/vrij 16/17 dec: practicum 4

Huiswerk vooraf: Werkstuk:

(13) maandag 20 dec: college 9

Presentatie en analyse van bivariate data. Correlatie.

Lezen: Chapter 5.

Huiswerk vooraf:

(14) woensdag 22 dec: college 10

Presentatie en analyse van bivariate data. Correlatie. [uitloop college 9]

Lezen: Chapter 5.

Huiswerk vooraf:

(15) don/vrij 23/24 dec: practicum 5

Tijdens dit practicum gaan we (weer) werken aan werkstuk 2 (zie practicum 4 hierboven), voor zover je dat nog niet afgerond hebt.
Bovendien gaan we tijdens het practicum opgaven 5.14, 5.44 en 5.63 uitwerken in SPSS.

vrijdag 24 dec: deadline werkstuk 2

Je werkstuk moet weer bestaan uit een document in PDF, Postscript of als MS Web Archive &mdash geen MS Word!
De procedure van inleveren is gewijzigd. Je moet nu je document inleveren via Ephorus, een webstek voor plagiaat-detectie. Dat moet via dit formulier. Vul als inlevercode in Statistiek0405 (met hoofdletter). Je werkstuk wordt dan eerst gecontroleerd op plagiaat, en daarna doorgestuurd.
Als je het werkstuk met een medestudent hebt gemaakt, lever dan allebei hetzelfde (identieke) document in, met daarin de namen en studentnummers van beide auteurs.

weken 53 en 01: Kerstvakantie

Tussen 25 december en 7 januari wordt er geen onderwijs gegeven.

(16) maandag 10 januari 2005: college 11

Chi2; associatie; goodness-of-fit.

Lezen: Chapter 12.

(17) woensdag 12 januari 2005: college 12

Vergelijking van 2 gemiddelden. De t-toets.

Lezen: Chapter 11.

Huiswerk vooraf:

Aanvulling:
Bij paarsgewijze vergelijking kan je de zgn. teken-toets (sign test) gebruiken als een eenvoudige verdelingsvrije toets. Deze toets is bijna uit het hoofd toe te passen. Deze toets kijkt alleen naar het teken (richting, positief of negatief) van het verschil d tussen twee condities. Als H0:d=0 waar is, dan heeft de helft van de verschillen een positief teken (plus) en de andere helft een negatief teken (min). De teken-toets gebruikt de binomiaal-verdeling, met kans p=.5 op een "succes" (positief verschil). Zie college 4 voor uitleg van de binomiaal-verdeling.
Bij opgave DP.11.37 zien we dat er een positief verschil is in 9 van de 9 observaties: de opbrengst is altijd groter met Sundance dan met Manitou. Hoe groot is de kans op dit resultaat als H0 waar is? Dat rekenen we uit met de binomiaal-verdeling (Appendix, p.665):
P(9 successen in 9 pogingen) = 1 · (.5)9 · (.5)0 = 1 · .002 · 1 = .002
Deze kans is kleiner dan de vastgestelde α=.05, en dus verwerpen we H0. De opbrengst is significant groter met Sundance tarwe dan met Manitou tarwe.
De teken-toets is conservatiever dan de paarsgewijze t-toets. Als een verschil significant is volgens de teken-toets, dan is het ook altijd significant volgens de gevoeliger t-toets.
Voer zelf de teken-toets uit op het probleem in opgave DP.11.43 (p.436).

(18) don/vrij 13/14 januari 2005: practicum 6

Werkstuk: Dit werkstuk telt als een deeltoets voor je eindcijfer.
Maak alle opdrachten en beantwoord alle vragen in hoofdstuk 7 van de Handleiding. Zorg dat je uitwerkingen weer resulteren in een samenhangend, vloeiend betoog waarin eventuele grafieken en tabellen een natuurlijke rol vervullen. Maak dus een verhaal met een kop en midden en staart, met inleiding en conclusies.
Lever je document weer in via Ephorus, met dit formulier. Gebruik als inlevercode weer Statistiek0405 (met hoofdletter). Je werkstuk wordt dan eerst gecontroleerd op plagiaat, en daarna doorgestuurd.
Als je het werkstuk met een medestudent hebt gemaakt, lever dan allebei hetzelfde (identieke) document in, met daarin de namen en studentnummers van beide auteurs.
Deadline is vrijdag 21 januari! Neem bij vragen contact op met de docent.

Benodigde bestanden: television.sps (syntax), television.dat (data).

Lezen:

(19) maandag 17 jan: college 13

Vergelijking van meer dan 2 gemiddelden. One-way analysis of variance. Post-hoc vergelijkingen.

Lezen: Chapter 15.

Huiswerk vooraf:

(20) woensdag 19 jan: college 14

Two-way analysis of variance. Interactie. (Chapter 15)

Huiswerk vooraf:

(21) don/vrij 20/21 jan: practicum 7

Werkstuk: Dit werkstuk telt als een deeltoets voor je eindcijfer.
Maak alle opdrachten en beantwoord alle vragen in hoofdstuk 8 van de Handleiding. Zorg dat je uitwerkingen resulteren in een samenhangend, vloeiend betoog waarin eventuele grafieken en tabellen een natuurlijke rol vervullen. Maak dus een verhaal met een kop en midden en staart, met inleiding en conclusies.
Lever je document weer in via Ephorus, met dit formulier. Gebruik als inlevercode weer Statistiek0405 (met hoofdletter). Je werkstuk wordt dan eerst gecontroleerd op plagiaat, en daarna doorgestuurd.
Als je het werkstuk met een medestudent hebt gemaakt, lever dan allebei hetzelfde (identieke) document in, met daarin de namen en studentnummers van beide auteurs.
Deadline is vrijdag 28 januari!! Neem bij vragen contact op met de docent.

Huiswerk vooraf:

vrijdag 21 jan: deadline werkstuk 3

Meer informatie en procedure voor inleveren is te vinden bij de beschrijving van de opdracht, hierboven.

(22) maandag 24 jan: college 15

De wetenschappelijke methode. Ethische aspecten van onderzoek. Omgang met proefpersonen en informanten. Fraude en plagiaat.

Lezen: NNB

Huiswerk vooraf: Verwijzingen:

(23) woensdag 26 jan: vragenuurtje

Vragen-uurtje.
Deze laatste bijeenkomst is gereserveerd als vragen-uurtje, ter voorbereiding op het eindtentamen. Er zal geen nieuwe stof gepresenteerd worden, maar je kan vragen stellen over alle colleges en practica, of over het boek en andere leesstof.

Vooraf:

vrijdag 28 jan: deadline werkstuk 4

Volg de instructies hierboven in het draaiboek.

maandag 31 januari 2005: tentamen

15:00 tot 17:30 uur, Trans 10, zaal 0.17.
Het wordt een open-boek-tentamen, waarbij je gebruik mag maken van:
  1. het boek van Devore & Peck, Statistics etc,
  2. het boek van De Vocht, Basishandboek SPSS 12 etc,
  3. je aantekeningen,
  4. een rekenmachine.
[2005.02.16] Kijk nog eens naar het tentamen, en bestudeer ook de antwoorden daarbij.

Verder lezen

Er zijn letterlijk honderden inleidende boeken over statistiek te vinden. Een goede selectie vindt je bij HyperStat Online (gelieerd aan de webstek van het Rice Virtual Lab in Statistics; zie hieronder). Andere suggesties zijn de volgende:

Verder grazen

Je kunt ook een kijkje nemen bij de cursuspagina's van vorige jaargangen: 2002, 2003.


© 2001-2005 HQ 2005.03.01

Valid HTML 4.01! Valid CSS!