Statistiek

cursuscode 200300427
2011-2012, blok 4, april-juni


Nieuws

 

  1. Hier zijn de antwoorden van het hertentamen. De cijfers komen volgende week in Osiris (moet door Hugo Quené worden gedaan).
  2. Het hertentamen wordt afgenomen op vrijdag 31 augustus tussen 13-15 uur in Drift 23, zaal 2.12. Het hertentamen gaat over de hele stof, en vervangt de cijfers van het eerste en tweede deeltentamen.
  3. Allemaal een prettige zomervakantie gewenst.
  4. De cijfers van het tweede tentamen zijn bekend, en daarmee ook de eindcijfers; alle behaalde cijfers staan in het cijferoverzicht. 52 deelnemers (73%) hebben de cursus gehaald, 19 (27%) kunnen nog deelnemen aan een hertentamen - over de hele stof - in de laatste week van augustus (datum en tijd komen hier nog op de site). Wie absoluut eerder een herkansing moet doen, moet contact met mij opnemen. Hier zijn de antwoorden van het tweede tentamen; het is door een aantal van jullie bijzonder goed gemaakt, maar helaas zijn er ook lage cijfers behaald.
  5. Op verzoek zijn hier de antwoorden van de opgaven die op het sommencollege zijn behandeld.
  6. De cijfers van het derde verslag zijn hier te zien.
  7. De cijfers van het tweede verslag zijn hier te zien (BI = betrouwbaarheidsinterval).
  8. Op 20 juni is er een extra sommencollege. De te behandelen opgaven staan hieronder. Vrijdag 22 juni is een vragencollege zoals gepland.
  9. Op 1 juni kunnen na het college de eerste tentamens ingezien worden (Trans 10, kamer 2.13)
  10. De cijfers van het eerste verslag zijn hier te zien. Met daarbij steekwoorden met aandachtspunten (TRM = trimmed mean, BP = box plot).
  11. De cijfers van het eerste tentamen zijn hier te zien. 50% van de deelnemers heeft een voldoende behaald. Bekijk ook de grafische weergave met de relatie tussen verwachte en behaalde cijfers. Hier zijn de antwoorden.
  12. De inlevercode Statistiek1112 is actief, dus je kunt je practicumverslag inleveren. Dat moet via dit formulier.
  13. De stof voor het deeltentamen is P&D hoofdstuk 1 t/m 8 en appendix A, minus hoofdstuk 5 en paragraaf 7.4
  14. De Statistiek weblectures van 2008 (docent Hugo Quené) zijn te vinden op Omega. Kies
    - geavanceerd zoeken, zoekterm (in alle velden): statistiek
    - selecteer soorten documenten
    - vink weblectures aan
    - vul publicatiejaar in: 2008 -2008
    - ZOEK
  15. Er komt geen blackboard site van de cursus omdat de weblectures ook direct te vinden zijn, zie boven.
  16. De practicumhandleiding van 2010-2011 is hier nu ook als .pdf file te zien (als 1 bestand met handleiding 1 t/m 8). Bevat nog de verwijzingen naar De Vocht SPSS 16.
  17. De website van 2010-11 is hier als .pdf file te zien. Daar kun je de equivalenties tussen opgaven in Edities 6 en 7 van Peck & Devore in zien.
  18. De cursus Statistiek wordt dit jaar door Gerrit Bloothooft gegeven. Anne van Leeuwen zal de practica begeleiden.

Praktische informatie

Docenten

Gerrit Bloothooft
e-mail: g punt bloothooft at uu nl,
adres: Trans 10, kamer 2.13,
spreekuur: volgens afspraak

Anne van Leeuwen
e-mail: a punt r punt vanleeuwen1 at uu nl

 

Boeken    

We maken gebruik van twee boeken en een web-handleiding:

Rooster

Elke week begint voor iedereen met een (werk)college van Gerrit Bloothooft op woensdag (helaas erg laat van 17.15-19 uur), gevolgd door een werkcollege op vrijdagmorgen (9-10.45).  Op vrijdag worden de deelnemers daarna verdeeld over 4 practicumgroepen. De practica op vrijdag zullen worden begeleid door Anne van Leeuwen en Gerrit Bloothooft.

cursusjaar 2012-13, blok 4
woensdag 17:15-19:00 KNG 80, zaal 0.06 (werk)college (GB)
vrijdag 09:00-10:45 ADD, zaal 2.02 (werk)college (GB)
vrijdag 11:00-12:45 KNG 80, zaal 1.13 practicum 1 (AvL)
vrijdag 13.15-15:00 KNG 80, zaal 1.13 practicum 2 (AvL)
vrijdag 15:15-17.00 KNG 80, zaal 1.13 practicum 4 (AvL)
vrijdag 15:15-17:00 KNG 80, zaal 0.12 practicum 3 (GB)

Inhoud

Deze cursus heeft tot doel om je de elementaire principes bij te brengen van beschrijvende en toetsende statistiek, en van de rol die deze methoden spelen in het wetenschappelijk onderzoek. Je leert technieken om gegevens te beschrijven, samen te vatten en te presenteren, bv in tabellen, grafieken en statistische kengetallen. Ook de daarvoor vereiste achtergrond komt aan bod: kans en kansrekening, steekproeftheorie, en schatting.
In het wetenschappelijk onderzoek worden gegevens meestal niet alleen beschreven, maar ook gebruikt om een hypothese te toetsen. We gaan in op de algemene principes van zulke toetsing, en je leert de meest gangbare statistische toetsen toe te passen en te interpreteren. Een experiment is een speciale onderzoeksomgeving waarin de relevante variabelen systematisch kunnen variëren; we besteden daarom aandacht aan het ontwerp van een experiment.
In de practica leer je omgaan met SPSS, een computerprogramma voor statistische analyse. Je gebruikt dit pakket om gegevens van jezelf (of van anderen) te beschrijven en te gebruiken voor toetsing.

Onderwijsvorm en toetsing

Deze cursus bestaat uit verschillende componenten. Ten eerste zijn er (werk)colleges, op woensdag en vrijdag. Voorafgaand aan een college moet je leesstof bestudeerd hebben. Na afloop moet je de bijbehorende individuele huiswerkopdrachten maken. Je antwoorden en oplossingen van het huiswerk moet je in uitgeschreven vorm meenemen naar het volgende college, waar we e.e.a. zullen bespreken.

Ten tweede zijn er practica op vrijdag. De invulling is vooral statistiek "doen" met SPSS; daarnaast kunnen jullie samen werken aan opdrachten, of het resultaat ervan bespreken.

Voor ieder college (tweemaal per week) moet je rekenen op 2u leeswerk vooraf, 2 contacturen, en 4u huiswerk nadien: 16 uur per week. Voor ieder practicum (eenmaal per week) moet je rekenen op 2u zelfstudie, plus 2 contacturen: 4 uur per week. Je wordt dus geacht 20 uur per week aan deze cursus te besteden.

Verslagen en andere teksten moeten elektronisch worden ingeleverd via Ephorus (plagiaat-detectie), uitsluitend in PDF (zie Hugo's pagina over open-source document formaat). Vraag je docent om opheldering als de opdrachten niet duidelijk zijn!

Tijdens de cursus moet je drie werkstukken inleveren, waarmee je in totaal maximaal 4 punten kunt verdienen (1+1,5+1,5). Halverwege de cursus wordt een tussentoets gegeven, die goed is voor maximaal 2 punten. De cursus wordt afgesloten met een tentamen waarmee je maximaal 4 punten kunt verdienen. Het eindcijfer bestaat uit de som van de behaalde punten.


Draaiboek

woensdag 25 april: werkcollege 1      inleiding / steekproeven

>slides (inleiding)

Variabelen; meetniveau. Empirische cyclus. De rol van statistiek in wetenschappelijk onderzoek. Hypothesen; H1 en H0. Eenheden van analyse.

Lezen: Chapter 1.

>slides (steekproeven)

Eenheden van analyse. Steekproef; sampling. Validiteit. Beschrijvende en toetsende statistiek. Veldwerk, corpus-analyse, experiment.

Lezen: Chapter 2.

 

Vooraf: Verwijzingen:

vrijdag 27 april: practicum 1     kennismaking met spss

Kennismaking met SPSS 20. Gegevens invoeren en bewaren.

Neem je solis login-gegevens mee naar het practicum, zodat je kunt inloggen in de computer-leerzalen bij Letteren.

Lezen:
Handleiding1-3, Hoofdstukken 1, 2, en 3.
Basishandboek SPSS
: bestudeer de hoofdstukken 1, 2, 3, 4, 5, 7, 23 — liefst achter een computer met SPSS!

Taak: uitvoeren van de opdrachten uit Handleiding1-3

Benodigde bestanden: vb01.dat, vb02.dat
Maak een directory /statistiek voor deze cursus op je persoonlijke schijf (computerleerzalen CIM); bewaar deze bestanden in die directory (in de meeste browsers: rechts klikken op hyperlink, kies dan Save target as... om het bestand op te slaan).

Liever R dan SPSS?

Voor deze cursus is het niet verplicht om gebruik te maken van SPSS. Een interessant open-source alternatief is het pakket R, beschikbaar via http://www.r-project.org/. R is een stuk krachtiger dan SPSS, en is dan ook lastiger om mee te leren werken. Je kunt meer leren over R in Hugo's tutorial daarover. R wordt verder in de cursus niet behandeld of ondersteund.

vrijdag 27 april: werkcollege 2       presentatie van informatie

>slides (presentatie van informatie)

Datareductie. Presentatie. Histogrammen, tabellen, grafieken. Gemiddelde en spreiding.

Lezen: Chapters 3 en 4.

Huiswerk vooraf:

Aanvulling:

Voor de liefhebbers is er achtergrond-informatie beschikbaar over variantie, o.a. over het verschil tussen populatie-variantie en steekproef-variantie, en over het verschil in berekening (N danwel N-1 in de noemer).
 

Grote of kleine standaarddeviatie? (Zie ook P&D opgave 4.31)

Is de gevonden standaarddeviatie groot of klein? Zit er veel of weinig variantie in de data? Deze vragen zijn niet a priori te beantwoorden; het antwoord hangt af van wat de "gebruikelijke" standaarddeviatie is voor de geobserveerde variabele. Een veel gebruikte maat is de "coefficient of variation" Cv. Dat is een relatieve maat van een steekproef: de standaarddeviatie gedeeld door het gemiddelde. Hieronder zie je die Cv uitgerekend voor enkele gegevens uit een eerdere vragenlijst (voor een steekproef van N=42 studenten). Het gemiddelde en de standaarddeviatie zijn uitgedrukt in dezelfde eenheden als de gemeten variabele (resp. jaar, schoenmaat, cm). De Cv is onafhankelijk van die eenheden, en kan dus vergeleken worden tussen variabelen.

Studiejaar Schoenmaat Lengte (cm)
gemiddelde 1.97 39.93 173.12
s.d. 1.246 3.15 8.37
Cv 0.63 0.08 0.05
IQR 2 4 10

Hieruit zou je kunnen afleiden dat de studenten in deze steekproef relatief meer van elkaar verschillen in studiejaar, dan in schoenmaat of in lichaamslengte. Aan bovenstaande gegevens zie je trouwens al dat de variabele Studiejaar niet normaal verdeeld is (vergelijk maar met de Empirical Rule, p.191). De spreiding kan je in zo'n geval vaak beter uitdrukken met de interquartile range.

Bereken eens, met behulp van de tabellen in het boek, wat de IQR is van de standaard-normaalverdeling. Is die IQR groter of kleiner dan de standaarddeviatie?


woensdag 2 mei: werkcollege 3   kansrekening

>slides (kansrekening)

Kans, kansrekening; gezamenlijke en onafhankelijke kansen. Binomiaal-verdeling.

Lezen: Chapter 6. (het woord Binomiaal verdeling komt in dit hoofdstuk niet voor, maar merk op dat example 6.6 er wel in resulteert, en example 6.11 ook). Appendix A.

Huiswerk vooraf: (wordt mogelijk deels doorgeschoven naar volgende week woensdag)

Verwijzingen:

Aanvullingen binomiaal verdeling:

  1. Over de binomiaal-verdeling kan je meer lezen in het boek van Peck & Devore, Appendix A, p730 ff.
  2. Hieronder volgt de uitwerking van de binomiaal-verdeling, voor 7 trekkingen met teruglegging, elk met p=0.38 (de kans op een klinker in scrabble), in formule-vorm (zie p.732), en uitgeschreven in een tabel:|

    P(k klinkers uit 7 trekkingen; k=1,..,7) = (p+q)7 =
    1 × p7 + 7 × p6q+ 21 × p5q2 + 35 × p4q3 + 35 × p3q4 + 21 × p2q5 + 7 × pq6 + 1 × q7 .
    De binomiaal-coëfficienten 1, 7, 21, 35, enz. tref je ook aan in de zgn. Driehoek van Pascal die dit in 1654 heeft bedacht.

    De binomiaal-coëfficienten geven het aantal verschillende mogelijkheden om k successen (klinkers) uit 7 trekkingen te behalen. Dat is gelijk aan

         7!                          waarbij 7! = 1.2.3.4.5.6.7   (spreek uit: zeven faculteit)
    k! (7-k)!

    7! drukt het aantal verschillende volgordes uit waarin je 7 verschillende letters kunt trekken. Als daarvan k klinker zijn, dan kunnen die onderling k! verschillende volgordes hebben. Evenzo zijn er voor 7-k medeklinkers onderling  (7-k)! volgordes mogelijk. Die laatste twee volgordes (van klinkers en van medeklinkers) zijn ons hier niet van belang, en daarom wordt er door gedeeld.  
     
aantal
klinkers
mogelijke uitkomsten kans
7 VVVVVVV 1 × (.387) =.001
6 VVVVVVC, VVVVVCV, VVVVCVV, VVVCVVV,
VVCVVVV, VCVVVVVV, CVVVVVV
7 × (.386) (.62) =.013
5 VVVVVCC, VVVVCCV, VVVCCVV, VVCCVVV, VCCVVVV, CCVVVVVV,
VVVVCVC, VVVCVCV, VVCVCVV, VCVCVVV, CVCVVVV,
VVVCVVC, VVCVVCV, VCVVCVV, CVVCVVV,
VVCVVVC, VCVVVCV, CVVVCVV,
VCVVVVC, CVVVVCV,
CVVVVVC
21 × (.385) (.622) =.064
4 VVVVCCC, VVVCCCV, VVCCCVV, VCCCVVV, CCCVVVV,
VVVCCVC, VVCCVCV, VCCVCVV, CCVCVVV,
VVCCVVC, VCCVVCV, CCVVCVV, VCCVVVC, CCVVVCV, CCVVVVC,
VVVCVCC, VVCVCCV, VCVCCVV, CVCCVVV,
VVCVVCC, VCVVCCV, CVVCCVV, VCVVVCC, CVVVCCV, CVVVVCC,
VVCVCVC, VCVCVCV, CVCVCVV, VCVCVVC, CVCVVCV, CVCVVVC,
VCVVCVC, CVVCVCV, CVVCVVC, CVVVCVC
35 × (.384) (.623) =.174
3 CCCCVVV, CCCVVVC, CCVVVCC, CVVVCCC, VVVCCCC,
CCCVVCV, CCVVCVC, CVVCVCC, VVCVCCC,
CCVVCCV, CVVCCVC, VVCCVCC, CVVCCCV, VVCCCVC, VVCCCCV,
CCCVCVV, CCVCVVC, CVCVVCC, VCVVCCC,
CCVCCVV, CVCCVVC, VCCVVCC, CVCCCVV, VCCCVVC, VCCCCVV,
CCVCVCV, CVCVCVC, VCVCVCC, CVCVCCV, VCVCCVC, VCVCCCV,
CVCCVCV, VCCVCVC, VCCVCCV, VCCCVCV
35 × (.383) (.624) =.284
2 CCCCCVV, CCCCVVC, CCCVVCC, CCVVCCC, CVVCCCC, VVCCCCCC,
CCCCVCV, CCCVCVC, CCVCVCC, CVCVCCC, VCVCCCC,
CCCVCCV, CCVCCVC, CVCCVCC, VCCVCCC,
CCVCCCV, CVCCCVC, VCCCVCC,
CVCCCCV, VCCCCVC,
VCCCCCV
21 × (.382) (.625) =.279
1 CCCCCCV, CCCCCVC, CCCCVCC, CCCVCCC,
CCVCCCCC, CVCCCCC, VCCCCCC
7 × (.38) (.626) =.151
0 CCCCCCC 1 × (.627) =.035

vrijdag 4 mei: practicum 2    beschrijvende statistiek

Huiswerk vooraf:

Taak: uitvoeren van de opdrachten uit Handleiding4

Werkstuk 1:
Maak opgave 4.72 uit het boek van Peck & Devore, p209.
Dit werkstuk telt als een deeltoets voor je eindcijfer.
 
Zorg dat je uitwerking resulteert in een vloeiend betoog.  Maak een verhaal met een inleiding (uitleg van het probleem), midden (gegevens en analyses) en staart (conclusies), met inleiding en conclusies. Alles in eigen woorden, niets direct copiëren uit de opgave.

Naast de behandeling van de vragen in de opgave: bespreek ook de spreiding in de gegevens, en maak een boxplot. Kortom, karakteriseer de gegevens zo goed mogelijk.
 
Zorg dat grafieken en tabellen een natuurlijke rol vervullen in je verhaal. Uit SPSS mogen in werkstukken overigens alleen grafieken worden overgenomen (gecopieerde tabeluitvoer van SPSS zie je vrijwel nooit in publicaties). Eventuele tabellen maak je zelf.

De data voor deze opgave kun je ook online vinden.

Je uitwerking moet je inleveren als een PDF document van maximaal 5 pagina's (minder mag ook!). Volg ook Hugo's  aanwijzingen voor taalgebruik, stijl en opmaak.

Je moet dit document inleveren via Ephorus, een webstek voor plagiaat-detectie. Dat moet via dit formulier. Vul als inlevercode in Statistiek1112 (met hoofdletter). Je werkstuk wordt dan eerst gecontroleerd op plagiaat, en daarna doorgestuurd naar de docent.

Deadline is dinsdag 15 mei 23:59u! Neem bij vragen contact op met de docent.

vrijdag 4 mei: werkcollege 4    de centrale limietstelling

>slides (centrale limiet theorie)

Er zal meer gezegd worden over de binomiaal verdeling. Centrale Limiet Theorema. Normale (Gaussische) verdeling. Standard error of the mean.

Bekijk:

Lezen: Chapters 7 [7.4 is geen tentamenstof] en 8.

Huiswerk vooraf:


woensdag 9 mei: werkcollege 5    betrouwbaarheid

>slides (schattingen, betrouwbaarheidsinterval)

Schatting. Betrouwbaarheidsinterval voor populatieproportie

Lezen: Chapter 9.

Lees ook als achtergrond de extra uitleg over variantie van populatie en van steekproef (bij college 3).

Let op! De tabel met de kritieke waarden van t (7e editie, binnenkaft boek) heeft fouten in de kop.
Bij Central area captured moet staan:  .80      .90    .95     .98    .99     .998    .999
Bij Confidence level moet staan:           80%   90%  95%  98%  99%  99.8% 99.9%
 

Huiswerk vooraf:

vrijdag 11 mei:

practicum 3    dobbelen en simuleren

Huiswerk vooraf:

Taak: uitvoeren van de opdrachten uit Handleiding5

practicum 4    de normale verdeling

Huiswerk vooraf:

Taak: uitvoeren van de opdrachten uit Handleiding6

vrijdag 11 mei: werkcollege 6     hypothese toetsing

>slides (testen van hypothesen)

Principes van hypothese-toetsing. Type-I en Type-II fouten. Significantie.

Lezen: Chapter 10   [p499-501 zijn geen tentamenstof]

Let op! In Example 10.7 [Ed7, p465] staat de tekens  verkeerd om.
De hypothesen moeten zijn: H0: μ = 15 versus Ha: μ < 15
Dat H0 impliceert de gevallen μ > 15 (dwz teveel lood in het water). Een type 1 fout (dwz H0 onterecht verwerpen) zou tot de conclusie leiden dat het water veilig zou zijn, terwijl het in werkelijkheid vervuild is. Een type 2 fout (dwz H0 onterecht niet verwerpen) betekent dat de conclusie zou zijn dat het water vervuild is, terwijl dat in werkelijkheid niet zo is.

Huiswerk vooraf:

Verwijzingen:


dinsdag 15 mei : deadline werkstuk 1

woensdag 16 mei:    tussentoets

Over de stof van hoofdstuk 1 t/m 8 en appendix A, minus hoofdstuk 5 en paragraaf 7.4.

Plaats: Educatorium, zaal ALPHA, 17-19 uur
 

Het wordt een open-boek-toets, waarbij je gebruik mag maken van:

  1. het boek van Peck & Devore, Statistics etc,
  2. het boek van De Vocht, Basishandboek SPSS etc,
  3. je aantekeningen,
  4. een (grafische) rekenmachine,
  5. de practicum-handleiding.

     
Hier zijn de eerste tentamens van 2011 en 2012 - maak die eerst! -, met de antwoorden: 2011 en 2012.

vrijdag 18 mei: geen onderwijs



woensdag 23 mei: werkcollege 7     hypothese toetsing - vervolg
                                     
Over de power van een toets.

Huiswerk vooraf:

Maak je uitwerkingen op papier.

Onderstaande tabel vat de terminologie samen die bijvoorbeeld in opgave 10.12 wordt gebruikt.


Let goed op hoe "positive" ten opzichte van H0 en Ha wordt geïnterpreteerd!
Dwz wel kanker = "positive"
H0 : geen kanker
Ha : wel kanker

 

beslissing over hypothese

H0 accepteren
 
H0 verwerpen
(Ha accepteren)
 
werkelijkheid H0 is waar correct
(negative)
H0 onterecht verworpen
(false positive)
(type-I fout, α)
H0 is onwaar
(Ha is waar)
H0 onterecht geaccepteerd
(false negative)
(type-II fout, β)
correct
(positive)

vrijdag 25 mei: practicum 5    regressie en correlatie

Huiswerk vooraf:

Handleiding7. Correlatie en regressie

Taak: uitvoeren van de opdrachten uit Handleiding7

Benodigde bestanden: television.sav, OF television.sps (syntax), television.dat (data).

Werkstuk 2: Dit werkstuk telt als een deeltoets voor je eindcijfer.

Neem aan dat je werkt als onderzoeker bij een grote school, waar van alle leerlingen het IQ wordt bepaald.
Na vele jaren weet je dat het gemiddelde gemeten IQ 98 punten is voor deze leerlingen. Vandaag komt er een ouder van een ADHD-kind op je spreekuur. Zij beweert dat het IQ van ADHD-kinderen eigenlijk hoger is dan gemiddeld, en eist daarom een meer uitdagend programma voor ADHD-ers. Om haar bewering te  toetsen selecteer je geheel willekeurig negentien ADHD-leerlingen.
De IQ-scores van deze ADHD-ers zijn:
78, 92, 95, 96, 96, 97, 99, 100, 101, 102, 102, 103, 104, 104, 107, 108, 110,112,130.

Ga er vanuit dat de ouder gelijk heeft wanneer de IQ=98 buiten het 95% betrouwbaarheidsinterval  van het gemiddelde van de IQ-scores van de ADHD kinderen ligt. Controleer dat. Het schoolbestuur  snapt echter niets van statistiek, maar moet wel een gemotiveerde beslissing kunnen nemen over de eis van de ouder. Schrijf daarom een compleet verslag, waarin je ook moet uitleggen welke redeneringen ten grondslag liggen aan de analyse van de onderzoeksresultaten, en aan je conclusie.

Ontleend aan: S.E. Maxwell & H.D. Delaney (2004). Designing Experiments and Analyzing Data: A Model Comparison Perspective.
Mahwah, NJ: Lawrence Erlbaum. ISBN 0-8058-3718-3. Numerical example, Table 3.1, p.78.

Uiteraard moet je uitwerking resulteren in een vloeiend betoog waarin eventuele grafieken en tabellen (tabellen niet copieren uit SPSS!) een natuurlijke rol vervullen. Maak dus weer een verhaal met een kop en midden en staart, met inleiding en conclusies.

Je uitwerking moet je inleveren als een PDF document (dus geen Word) van maximaal 2 pagina's. Volg ook weer Hugo's aanwijzingen voor taalgebruik, stijl en opmaak.


Je moet dit document inleveren via Ephorus, een webstek voor plagiaat-detectie. Dat moet via dit formulier.
Vul als inlevercode in Statistiek1112 (met hoofdletter). Je werkstuk wordt dan eerst gecontroleerd op plagiaat, en daarna doorgestuurd naar de docent.

Deadline is dinsdag 5 juni 23:59u! Neem bij vragen contact op met de docent

vrijdag 25 mei: werkcollege 8   regressie en correlatie

>slides (regressie en correlatie)

Presentatie en analyse van bivariate data. Correlatie.

Lezen: Chapter 5    [5.4 en 5.5 zijn geen tentamenstof]

Hier is een plaatje van gegevensverzamelingen met correlatiecoefficiënten tussen 0.3 en 0.9 en tussen -0.3 en -0.9

Huiswerk vooraf:


woensdag 30 mei: werkcollege 9   goodness of fit

>slides (Chi2)

Chi2 goodness-of-fit test. Test voor associatie (homogeniteit) en onafhankelijkheid.

Lezen: Chapter 12.

Huiswerk vooraf:

vrijdag 1 juni: practicum 6    toetsende statistiek

Huiswerk vooraf:

Taak: uitvoeren van de opdrachten uit Handleiding 8.1-8.3

Benodigde bestanden: enq2008.sav met resultaten van enquete uit het eerste werkcollege van 2008, en het bijbehorende codebook. De gegevens zijn voor de afhankelijke variabele jaar behoorlijk rechtsscheef, maar je mag ze voor deze gelegenheid toch voor de verschillende groepen als normaal verdeeld  - met voldoende gelijke variantie -beschouwen.

Werkstuk 3: Dit werkstuk telt als een deeltoets voor je eindcijfer.

Maak alle opdrachten en beantwoord alle vragen in secties 8.3, 8.4 en 8.5 van de Handleiding (dus die van vandaag en van volgende week!). Zorg dat je uitwerkingen weer resulteren in een samenhangend, vloeiend betoog waarin eventuele grafieken en tabellen een natuurlijke rol vervullen. Maak dus een verhaal met een kop en midden en staart, met inleiding en conclusies. Je verslag mag maximaal 5 pagina's lang zijn!

Je werkstuk moet weer bestaan uit een document in PDF! Je moet je document weer inleveren via Ephorus, een webstek voor plagiaat-detectie, via dit formulier. Vul als inlevercode in Statistiek1112 (met hoofdletter). Je werkstuk wordt dan eerst gecontroleerd op plagiaat, en daarna doorgestuurd naar de docent.

Deadline is vrijdag 15 juni 23:59u. Neem bij vragen contact op met de docent

vrijdag 1 juni: werkcollege 10    de vergelijking van twee gemiddelden 

>slides (t-toets)

Vergelijking van 2 gemiddelden of proporties. De t-toets.

Lezen: Chapter 11.

Huiswerk vooraf:


dinsdag 5 juni: deadline werkstuk 2


woensdag 6 juni: werkcollege 11   variantie analyse  1

>slides (one-way ANOVA)

Vergelijking van meer dan 2 gemiddelden. One-way analysis of variance. Post-hoc vergelijkingen.

Lezen: Chapter 15 (sections 15.1 en 15.2).

Huiswerk vooraf:

 

vrijdag 8 juni: practicum 7   variantie analyse

Huiswerk vooraf:

Taak: uitvoeren van de opdrachten uit Handleiding8.4 en 8.5

Benodigde bestanden:
1) enq2008.sav met resultaten van enquete uit het eerste werkcollege van 2008,
en het bijbehorende codebook.  De gegevens zijn voor de afhankelijke variabele jaar behoorlijk rechtsscheef, maar je mag ze voor deze gelegenheid toch voor de verschillende groepen als normaal verdeeld  - met voldoende gelijke variantie -beschouwen.
2) iq.txt met IQ waarden voor 1000 personen in verschillende groepen psychische aandoeningen (inclusief  controlegroep), naar geslacht.

 

vrijdag 8 juni: werkcollege 12   variantie analyse 2

>slides (two-way ANOVA)

Two-way analysis of variance. Interactie.

Lezen:
Peck & Devore, Ch.15, sections 15.3 t/m 15.5, te vinden via de book companion website. [geen tentamenstof]

Huiswerk vooraf:


woensdag 13 juni: werkcollege 13    finale

>slides (finale)

De wetenschappelijke methode. Ethische aspecten van onderzoek. Omgang met proefpersonen en informanten. Fraude en plagiaat.

Lezen:
Nederlandse Gedragscode Wetenschapsbeoefening: Principes van goed wetenschappelijk onderwijs en onderzoek (2004, PDF), door VSNU.

Huiswerk vooraf:

Verwijzingen:

vrijdag 15 juni: geen les, deadline werkstuk 3!


woensdag 20 juni: sommen maken


We behandelen de opgaven: 5.1(p220), 5.28 (p234), 5.79 (p294, LET OP, bij c moet de vraag zijn r < -0.5, om consistent te zijn met het antwoord achter in het boek), 9.47(p444), 10.64(p502), 10.72(p509), 11.11(p532), 11.28(p546), 11.51(p559), 12.4(p583), 12.31(p601),
15.10(p716) (data staan op p717 niet op p847; voer hier ook eens Tukey-Kramer uit)

In de 6e editie zijn dit: 5.1, 5.35, NA, 9.39, 10.70, 10.72, 11.4, NA, NA, NA, 12.33, 15.5 (NA = niet aanwezig).

vrijdag 22 juni: vragenuur 9.00-10.45



woensdag 27 juni:  tentamen, 17-19 uur
Educatorium, zaal Theta

Het wordt een open-boek-tentamen over de stof van
hoofdstukken 5 (minus 5.4 en 5.5), 9, 10, 11, 12, 15  t/m 15.2 

Je mag gebruik maken van:

  1. het boek van Peck & Devore, Statistics,
  2. het boek van De Vocht, Basishandboek SPSS,
  3. je aantekeningen,
  4. een (grafische) rekenmachine,
  5. de practicum-handleiding.

Maak ter voorbereiding deze oude tentamen2003-04, tentamen2004-05, tentamen2005-06, tentamen2008-09, tentamen2009-10, tweede tentamen2010-11 en — nadat je dat voltooid hebt — kun je de antwoorden2003-04antwoorden2004-05, antwoorden2008-09, antwoorden2009-10 en antwoorden2010-11 bekijken.


Vergeet ook niet om de online cursus-evaluatie in te vullen.

 


Verder lezen

Er zijn letterlijk honderden inleidende boeken over statistiek te vinden. Een goede selectie vindt je bij HyperStat Online (gelieerd aan de webstek van het Rice Virtual Lab in Statistics; zie hieronder). Andere suggesties zijn de volgende:

Verder grazen

Je kunt ook een kijkje nemen op Hugo's beknopte Statistics tutorial (PDF, november 2007).