Statistiek

cursuscode 200300427
2003-2004, blok 2, november-januari


Nieuws

  1. [2004.02.15] Het tentamen heb ik eindelijk nagekeken. Je vindt hier de antwoorden en je resultaten. Je kunt ook de samenvatting van jullie evaluatie bekijken.
  2. [2004.01.27] Deze cursus wordt niet alleen afgesloten met een tentamen, maar ook met een evaluatie. We gebruiken daarvoor een nieuw online evaluatie-systeem. Je kunt het vinden op het volgende adres: http://www.let.uu.nl/oce. Breng daar zo snel mogelijk een bezoek, en wees dan zo goed om de 20 vragen die je daar aantreft in te vullen. Bij voorbaat dank voor je moeite!
  3. [2003.12.03] Hoe wijzig ik het aantal balkjes in een histogram in SPSS?
    Antwoord: Zie het Basishandboek van De Vocht, §7.5.1, p.115 e.v. Dubbelklik op het histogram. Er verschijnt een SPSS Chart Object venster. Kies Chart > Axis > Interval, kies Intervals: Custom en dan knop Define.... Vul het invulscherm in (Afb. 7.10). Je kunt hier bv. het aantal balkjes opgeven, of de breedte van de balkjes.
  4. De data behorend bij een aantal huiswerk-opgaven zijn ook te vinden op de CD-ROM bij het boek van Devore & Peck! Voor sommige opgaven kan je de data dus meteen importeren in SPSS; zie de Handleiding bij het practicum, Hoofdstuk 4.

Praktische informatie

Docent

Hugo Quené
e-mail Hugo punt Quene at let uu nl,
Trans 10, kamer 2.25,
spreekuur: dinsdag 14:00-15:30 en volgens afspraak

Boeken

We maken gebruik van de volgende twee boeken:

Rooster

cursusjaar 2003-2004, blok 2
maandag 13.00-16.00KNG 80, 1.31werkcollege
woensdag09.00-12.00KNG 80, 1.31werkcollege
woensdag13.00-15.00KNG 80, 0.12 CLZpracticum

Inhoud

Deze cursus heeft tot doel om je de elementaire principes bij te brengen van beschrijvende en toetsende statistiek, en van de rol die deze methoden spelen in het wetenschappelijk onderzoek. Je leert technieken om gegevens te beschrijven, samen te vatten en te presenteren, bv in tabellen, grafieken en statistische kengetallen. Ook de daarvoor vereiste achtergrond komt aan bod: kans en kansrekening, steekproeftheorie, en schatting.
In het wetenschappelijk onderzoek worden gegevens meestal niet alleen beschreven, maar ook gebruikt om een hypothese te toetsen. We gaan in op de algemene principes van zulke toetsing, en je leert de meest gangbare statistische toetsen toe te passen en te interpreteren. Een experiment is een speciale onderzoeksomgeving waarin de relevante variabelen systematisch kunnen variëren; we besteden daarom aandacht aan het ontwerp van een experiment.
In de practica leer je omgaan met SPSS, een computerprogramma voor statistische analyse. Je gebruikt dit pakket om gegevens van jezelf (of van anderen) te beschrijven en te gebruiken voor toetsing.

Onderwijsvorm en toetsing

Deze cursus bestaat uit verschillende componenten. Ten eerste zijn er colleges, op maandag en woensdag. Voorafgaand aan een college moet je leesstof bestudeerd hebben. Na afloop moet je de bijbehorende individuele huiswerkopdrachten maken. Je antwoorden en oplossingen van het huiswerk moet je — in uitgeschreven vorm — meenemen naar het volgende college, waar we e.e.a. zullen bespreken.
Ten tweede zijn er practica op woensdag. De invulling daarvan kan variëren: huiswerk bespreken, statistiek "doen" met SPSS, samen werken aan opdrachten, of het resultaat ervan bespreken.

Voor ieder college (tweemaal per week) moet je rekenen op 2u leeswerk vooraf, 2 contacturen, en 4u huiswerk nadien: 16 uur per week. Voor ieder practicum (eenmaal per week) moet je rekenen op 2u zelfstudie, plus 2 contacturen: 4 uur per week. Je wordt dus geacht 20 uur per week aan deze cursus te besteden.

Verslagen en andere teksten moeten electronisch worden ingeleverd via WebCT. Vraag je docent om opheldering als de opdrachten niet duidelijk zijn!

Tijdens de cursus moet je vier werkstukken inleveren. Voor ieder werkstuk kun je maximaal 1 punt verdienen. De cursus wordt afgesloten met een tentamen, waarmee je maximaal 6 punten kunt verdienen. Het eindcijfer bestaat uit de som van de (4x1)+6 behaalde punten.

terug naar begin

Draaiboek

(1) maandag 17 nov: college 1

Variabelen; meetniveau. Empirische cyclus. De rol van statistiek in wetenschappelijk onderzoek. Hypothesen; H1 en H0. Eenheden van analyse.

Lezen: Chapter 1.

Vooraf: Verwijzingen:

(2) woensdag 19 nov: college 2

Empirische cyclus. Hypothesen; H1 en H0. Eenheden van analyse. Steekproef; sampling. Validiteit. Beschrijvende en toetsende statistiek. Veldwerk, corpus-analyse, experiment.

Lezen: Chapter 2.

Huiswerk vooraf:

(3) woensdag 19 nov: practicum 1

Kennismaking met SPSS. Gegevens invoeren en bewaren.

Zorg dat je een computer-account hebt bij Letteren. Controleer ook of je toegang hebt tot WebCT. Neem je login-gegevens mee naar het practicum!

Lezen: Handleiding, Hoofdstukken 1, 2 en 3.

Benodigde bestanden: vb01.dat, vb02.dat.

(4) maandag 24 nov: college 3

Datareductie. Presentatie. Histogrammen, tabellen, grafieken. Gemiddelde en spreiding.

Lezen: Chapters 3 en 4.

Huiswerk vooraf:

(5) woensdag 26 nov: college 4

Kans, kansrekening; gezamenlijke en onafhankelijke kansen. Binomiaal-verdeling.

Lezen: Chapter 6.

Huiswerk vooraf:
Verwijzingen:

Aanvullingen:

  1. Naar aanleiding van opgave DP.04.18 spraken we over een gemiddelde per groep of per student, en daarna over een gemiddelde per tijdseenheid of per afstandseenheid. Dit komt neer op een onderscheid tussen een "gewoon" gemiddelde (rekenkundig gemiddelde, arithmetic mean) en "harmonisch" gemiddelde (harmonic mean). Voor de liefhebbers enkele webpagina's daarover:
    MathWorld, Cut The Knot.
  2. Over de binomiaal-verdeling kan je meer lezen in de Appendix van het boek van Devore & Peck, p.663 e.v.
    De binomiaal-verdeling voor 15 trekkingen is onhandig groot. Hier volgt de uitwerking voor 7 trekkingen, met teruglegging, elk met p=0.38, eerst in formule-vorm (zie p.665), en hieronder uitgeschreven in een tabel:
       P(x klinkers uit 7 trekkingen) =
    1 × p7 + 7 × p6 q + 21 × p5 q2 + 35 × p4 q3 + 35 × p3 q4 + 21 × p2 q5 + 7 × p q6 + 1 × q7 .
    De binomiaal-coëfficienten 1, 7, 21, 35, enz. tref je ook aan in de zgn. Driehoek van Pascal die dit in 1654 heeft bedacht.
aantal
klinkers
mogelijke uitkomsten kans
7 VVVVVVV 1 × (.387) = .001
6 VVVVVVC, VVVVVCV, VVVVCVV, VVVCVVV,
VVCVVVV, VCVVVVVV, CVVVVVV
7 × (.386 .62) = .013
5 VVVVVCC, VVVVCCV, VVVCCVV, VVCCVVV, VCCVVVV, CCVVVVVV,
VVVVCVC, VVVCVVC, VVCVCVV, VCVCVVV, CVCVVVV,
VVVCVVC, VVCVVCV, VCVVCVV, CVVCVVV,
VVCVVVC, VCVVVCV, CVVVCVV,
VCVVVVC, CVVVVCV,
CVVVVVC
21 × (.385 .622) = .064
4 VVVVCCC, VVVCCCV, VVCCCVV, VCCCVVV, CCCVVVV,
VVVCCVC, VVCCVCV, VCCVCVV, CCVCVVV,
VVCCVVC, VCCVVCV, CCVVCVV, VCCVVVC, CCVVVCV, CCVVVVC,
VVVCVCC, VVCVCCV, VCVCCVV, CVCCVVV,
VVCVVCC, VCVVCCV, CVVCCVV, VCVVVCC, CVVVCCV, CVVVVCC,
VVCVCVC, VCVCVCV, CVCVCVV, VCVCVVC, CVCVVCV, CVCVVVC,
VCVVCVC, CVVCVCV, CVVCVVC, CVVVCVC
35 × (.384 .623) = .174
3 CCCCVVV, CCCVVVC, CCVVVCC, CVVVCCC, VVVCCCC,
CCCVVCV, CCVVCVC, CVVCVCC, VVCVCCC,
CCVVCCV, CVVCCVC, VVCCVCC, CVVCCCV, VVCCCVC, VVCCCCV,
CCCVCVV, CCVCVVC, CVCVVCC, VCVVCCC,
CCVCCVV, CVCCVVC, VCCVVCC, CVCCCVV, VCCCVVC, VCCCCVV,
CCVCVCV, CVCVCVC, VCVCVCC, CVCVCCV, VCVCCVC, VCVCCCV,
CVCCVCV, VCCVCVC, VCCVCCV, VCCCVCV
35 × (.383 .624) = .284
2 CCCCCVV, CCCCVVC, CCCVVCC, CCVVCCC, CVVCCCC, VVCCCCCC,
CCCCVCV, CCCVCVC, CCVCVCC, CVCVCCC, VCVCCCC,
CCCVCCV, CCVCCVC, CVCCVCC, VCCVCCC,
CCVCCCV, CVCCCVC, VCCCVCC,
CVCCCCV, VCCCCVC,
VCCCCCV
21 × (.382 .625) = .279
1 CCCCCCV, CCCCCVC, CCCCVCC, CCCVCCC,
CCVCCCCC, CVCCCCC, VCCCCCC
7 × (.38 .626) = .151
0 CCCCCCC 1 × (.627) = .035

(6) woensdag 26 nov: practicum 2

Huiswerk vooraf: Werkstuk: Aanvulling:
Misschien wil je deze opdracht wel heel graag in Microsoft Word maken, en weet je niet hoe je daarvan een PostScript of PDF document kunt maken. Dat is echter niet zo moeilijk.
  1. Er is bij je computer al een PostScript printer geïnstalleerd? Kies dan in Word voor de optie File > Print..., kies deze printer, en zorg dat het vakje Print to file aangevinkt is. Geef het resulterende bestand de extensie .PS. Je kunt dit PostScript bestand ook bekijken, bv met het programma GhostView (en daarmee kan je er ook nog een PDF bestand van maken). Het PostScript of PDF bestand kan je nu inleveren.
  2. Er is op je computer nog geen PostScript printer geïnstalleerd? Je moet dan zelf een virtuele printer installeren (een nep-printer dus, die niet echt bestaat, maar dat weet Windows niet). Surf daarvoor naar www.adobe.com en ga naar Support > Downloads > Postscript printer drivers. Kies de goede uit, en download en installeer deze volgens de aanwijzingen van de fabrikant. (NB: Gebruikers van Windows NT, 2000 en XP hebben hiervoor Administrator privileges nodig.) Ga dan terug naar stap 1 hierboven.
  3. Een derde mogelijkheid is om een HTML document te maken. Kies dan in Word voor de optie File > Save As..., en kies in het veld "Save as type" voor Web Page. Maar: dit levert je een Microsoft document dat niet voldoet aan de HTML standaard. (Zo is het resulterende web-document veel te groot, o.a. omdat allerlei Word instellingen bewaard worden in dit web-document: wie er aan gewerkt heeft, hoe lang, layout-instellingen, enz.)
    In Word 2000 kun je van je document toch valide, standaard HTML maken door eerst een Office 2000 HTML Filter te installeren. Dit filter vind je via www.microsoft.com/downloads > Search > Product: Office, Keywords: HTML. Download en installeer dit filter volgens de aanwijzingen van de fabrikant. Kies dan in Word 2000 voor de optie File > Export As... > Compact HTML.
    Inspecteer je web-document grondig in een web-browser (liefst niet eentje van MicroSoft). Als alles er goed uitziet, kun je dit document inleveren.
  4. Een vierde mogelijkheid is om een web archive aan te maken. Dat is een HTML document inclusief plaatjes. Kies dan in Word 2000 voor de optie File > Save As web page..., en kies in het veld "Save as type" voor Web Archive (*.mht).
    Inspecteer je web-document grondig in een web-browser (liefst niet eentje van MicroSoft). Als alles er goed uitziet, kun je dit document inleveren. Deze methode werkt goed in de computerleerzalen van het CIM.
Verwante ideeën kun je ook vinden in deze uitleg.

Je kunt ook LaTeX gebruiken om een PostScript of PDF document te maken. Hoe moet je dan je figuren invoegen? Zorg dat je de figuren bewaart als Encapsulated PostScript (.EPS). Er bestaat eventueel een programma om figuren te converteren van Windows (WMF) naar EPS: WMF2EPS.
Vanuit SPSS kun je heel eenvoudig figuren exporteren naar EPS: klik eenmaal binnen de figuur, klik met de rechter muisknop, kies Export... en vul alle velden goed in (charts only, selected charts, EPS file type, etc.).
Installeer het graphicx package, en neem het commando \usepackage{graphicx} op in de preamble van je document.
Gebruik in je document het commando \includegraphics{hist10bars.eps} om de afbeelding in te voegen.
Compileer je LaTeX bestand enkele malen (driemaal is scheepsrecht) om alles goed te krijgen.
In het resulterende DVI bestand zijn de EPS figuren helaas niet zichtbaar. Je kunt het DVI bestand converteren naar PostScript (met dvips) en vandaar eventueel naar PDF (met Adobe Acrobat). In de PostScript en PDF versies zijn de afbeeldingen wel zichtbaar.

Hieronder zie je dit alles in een voorbeeld-document. Let ook op de handige dwarsverwijzing in de laatste alinea.
\documentclass[a4paper]{article}
\usepackage{graphicx}
...
\begin{document}

Lorem ipsum dolor sit amet, consectetuer adipiscing elit.
Aenean molestie velit a libero. Etiam ut libero.
Praesent at lectus. Fusce sapien.

\begin{figure}[hb]
% don't place figure at the TOP of this page,
% only Here or Bottom
\caption{Distribution of Survival Times.}
\label{fig:hist10bars}
\includegraphics{hist10bars.eps}
\end{figure}

Vestibulum purus dui, ullamcorper quis, tincidunt ac,
dignissim eu, neque, vide Figura~\ref{fig:hist10bars}.
Aliquam id libero sed purus luctus pharetra.

\end{document}
Je vindt hier ook het resultaat van dit voorbeeld.

(7) maandag 1 dec: college 5

Centraal Limiet Theorema. Normale (gaussische) verdeling. Toetsen op normaliteit. Standard error of the mean.

Lezen: Chapters 7 en 8.

Huiswerk vooraf:

(8) woensdag 3 dec: college 6

Schatting. Betrouwbaarheidsinterval.

Lezen: Chapter 9.

Huiswerk vooraf:

(9) woensdag 3 dec: practicum 3

Huiswerk vooraf:

(10) maandag 8 dec: college 7

Principes van hypothese-toetsing. Type-I en Type-II fouten. Significantie en power.

Lezen: Chapter 10.

Huiswerk vooraf: Verwijzingen:

(11) woensdag 10 dec: college 8

Recapitulatie. Tussenstand.

Lezen: Chapters 6, 7, 8, 9, 10.

Huiswerk vooraf:

Verwijzingen: mijn beknopte Statistics tutorial (PowerPoint, 12 november 2003).

(12) woensdag 10 dec: practicum 4

Huiswerk vooraf: Werkstuk:

(13) maandag 15 dec: college 9

Presentatie en analyse van bivariate data. Correlatie.

Lezen: Chapter 5.

Huiswerk vooraf:

(14) woensdag 17 dec: college 10

Presentatie en analyse van bivariate data. Correlatie. [uitloop college 9]

Lezen: Chapter 5.

Huiswerk vooraf:

(15) woensdag 17 dec: practicum 5

Tijdens dit practicum gaan we (weer) werken aan werkstuk 2 (zie practicum 4 hierboven), voor zover je dat nog niet afgerond hebt.
Bovendien gaan we tijdens het practicum opgaven 5.14, 5.44 en 5.63 uitwerken in SPSS.

vrijdag 19 dec: deadline werkstukken 1 en 2

Meer informatie en procedure voor inleveren is te vinden bij WebCT Vista.

weken 52 en 01: Kerstvakantie

Tussen 22 december en 2 januari wordt er geen onderwijs gegeven.

(16) maandag 5 januari 2004: college 11

Chi2; associatie; goodness-of-fit.

Lezen: Chapter 12.

(17) woensdag 7 januari 2004: college 12

Vergelijking van 2 gemiddelden. De t-toets.

Lezen: Chapter 11.

Huiswerk vooraf:

Aanvulling:
Bij paarsgewijze vergelijking kan je de zgn. teken-toets (sign test) gebruiken als een eenvoudige verdelingsvrije toets. Deze toets is bijna uit het hoofd toe te passen. Deze toets kijkt alleen naar het teken (richting, positief of negatief) van het verschil d tussen twee condities. Als H0:d=0 waar is, dan heeft de helft van de verschillen een positief teken (plus) en de andere helft een negatief teken (min). De teken-toets gebruikt de binomiaal-verdeling, met kans p=.5 op een "succes" (positief verschil). Zie college 4 voor uitleg van de binomiaal-verdeling.
Bij opgave DP.11.37 zien we dat er een positief verschil is in 9 van de 9 observaties: de opbrengst is altijd groter met Sundance dan met Manitou. Hoe groot is de kans op dit resultaat als H0 waar is? Dat rekenen we uit met de binomiaal-verdeling (Appendix, p.665):
P(9 successen in 9 pogingen) = 1 · (.5)9 · (.5)0 = 1 · .002 · 1 = .002
Deze kans is kleiner dan de vastgestelde α=.05, en dus verwerpen we H0. De opbrengst is significant groter met Sundance tarwe dan met Manitou tarwe.
De teken-toets is conservatiever dan de paarsgewijze t-toets. Als een verschil significant is volgens de teken-toets, dan is het ook altijd significant volgens de gevoeliger t-toets.
Voer zelf de teken-toets uit op het probleem in opgave DP.11.43 (p.436).

(18) woensdag 7 januari 2004: practicum 6

Werkstuk: Dit werkstuk telt als een deeltoets voor je eindcijfer.
Maak alle opdrachten en beantwoord alle vragen in hoofdstuk 7 van de Handleiding. Zorg dat je uitwerkingen weer resulteren in een samenhangend, vloeiend betoog waarin eventuele grafieken en tabellen een natuurlijke rol vervullen. Maak dus een verhaal met een kop en midden en staart, met inleiding en conclusies.
Je uitwerking moet je weer inleveren als een PDF document van max. 6 pagina's, regelafstand minimaal 1.5, lettergrootte minimaal 11pt. Je uitwerking moet je weer inleveren als een PDF of PostScript document (geen Word document) van max. 6 pagina's, regelafstand minimaal 1.5, lettergrootte minimaal 11pt. Dit werkstuk moet je electronisch inleveren via WebCT Vista. Log daar in met je Solis account-gegevens, kijk onder Taalwetenschap - Statistiek > werkstuk practicum 6. Voeg je document eerst toe met de knop Browse, en lever het dan in met de knop Submit. Deadline is vrijdag 23 januari! Neem bij vragen contact op met de docent.

Benodigde bestanden: television.sps, television.dat.

Lezen:

(19) maandag 12 jan: college 13

Vergelijking van meer dan 2 gemiddelden. One-way analysis of variance. Post-hoc vergelijkingen.

Lezen: Chapter 15.

Huiswerk vooraf:

(20) woensdag 14 jan: college 14

Two-way analysis of variance. Interactie. (Chapter 15)

Huiswerk vooraf:

(21) woensdag 14 jan: practicum 7

Werkstuk: Dit werkstuk telt als een deeltoets voor je eindcijfer.
Maak alle opdrachten en beantwoord alle vragen in hoofdstuk 8 van de Handleiding. Zorg dat je uitwerkingen resulteren in een samenhangend, vloeiend betoog waarin eventuele grafieken en tabellen een natuurlijke rol vervullen. Maak dus een verhaal met een kop en midden en staart, met inleiding en conclusies.
Je uitwerking moet je weer inleveren als een PDF of PostScript document van max. 6 pagina's, regelafstand minimaal 1.5, lettergrootte minimaal 11pt. Dit werkstuk moet je electronisch inleveren via WebCT Vista. Log daar in met je Solis account-gegevens, kijk onder Taalwetenschap - Statistiek > werkstuk practicum 7. Voeg je document eerst toe met de knop Browse, en lever het dan in met de knop Submit. Deadline is vrijdag 23 januari!! Neem bij vragen contact op met de docent.

Huiswerk vooraf:

(22) maandag 19 jan: college 15

De wetenschappelijke methode. Ethische aspecten van onderzoek. Omgang met proefpersonen en informanten. Fraude en plagiaat.

Lezen: NNB

Huiswerk vooraf: Verwijzingen:

vrijdag 23 jan: deadline werkstukken 3 en 4

Meer informatie en procedure voor inleveren is te vinden bij WebCT Vista.

(23) maandag 26 jan, 14:00 tot 16:00: vragenuurtje

Vragen-uurtje.
Deze laatste bijeenkomst is gereserveerd als vragen-uurtje, ter voorbereiding op het eindtentamen. Er zal geen nieuwe stof gepresenteerd worden, maar je kan vragen stellen over alle colleges en practica, of over het boek en andere leesstof.

Vooraf:

woensdag 28 januari: tentamen

Tijd: 09:00 tot 12:00 uur
Plaats: Kromme Nieuwegracht 80, zaal 0.06

Het wordt een open-boek-tentamen, waarbij je gebruik mag maken van:
  1. het boek van Devore & Peck, Statistics etc,
  2. het boek van De Vocht, Basishandboek SPSS 11 etc,
  3. je aantekeningen,
  4. een rekenmachine: geen grafische rekenmachine, eventueel wel statistische functies.
Je kunt het tentamen nog eens bekijken. Bovendien vindt je hier de antwoorden en je resultaten.

Verder lezen

Er zijn letterlijk honderden inleidende boeken over statistiek te vinden. Een goede selectie vindt je bij HyperStat Online (gelieerd aan de webstek van het Rice Virtual Lab in Statistics; zie hieronder). Andere suggesties zijn de volgende:

Verder grazen

Je kunt ook een kijkje nemen bij de cursuspagina's van vorige jaargangen: 2002, 2003.


© 2001-2004 HQ 2004.06.21

Valid HTML 4.01! Valid CSS!