Hvad man skal ignorere for at forstå dit barns testresultater

Nu hvor den første skolemåned er forbi, kan forældre gøre sig klar til den næste milepæl i skoleåret - de vil snart få rapporter om de statstest, deres børn tog sidste år.

Mine estimater viser, at cirka 26 millioner elever i offentlige skoler tog statsdækkende test i læsning og matematik sidste år. Mange af dem tog også statsdækkende test i naturvidenskab. Disse tests giver vigtig information til forældre om, hvor godt deres børn klarer sig i skolen.

Men min forskning viser også, at når forældre modtager deres barns testresultatrapport, kan de have svært ved at adskille den vigtige information fra det statistiske sludder.

Hvad mere er, giver resultaterne dem måske ikke engang nøjagtige oplysninger om deres barns akademiske vækst.

Er dit barn 'dygtig'?

No Child Left Behind-loven, der blev vedtaget i 2002, krævede, at alle stater skulle sætte "præstationsniveaustandarder" i læsning og matematik for klassetrin tre til otte og for én klasse i gymnasiet, typisk 10. eller 11. klasse. Stater var også forpligtet til at udvikle tests til at måle elevernes niveau af "færdighed" på hver test.


indre selv abonnere grafik


Den nye føderale lov vedtaget i december 2015, den Hver studerende lykkes med lov (ESSA), vil fortsætte denne praksis.

Som et resultat klassificerer testrapporterne, forældre modtager, børn i præstationsniveauer som "grundlæggende" eller "dygtige". Hver stat bestemmer, hvad disse klassifikationer kaldes, men mindst én kategori skal betyde "dygtig".

Disse præstationsniveaukategorier er beskrevet i testresultatrapporterne, og derfor er denne information let at forstå af forældre. For eksempel finder jeg det nyttigt hvert år at se, om mine sønner når færdigheder inden for hvert fagområde.

Men børns testresultater i et givet år og deres præstationsniveau er ikke de eneste oplysninger, der rapporteres i nogle stater. Et nyt statistisk indeks, kaldet en "studerende vækstpercentil", er ved at finde vej ind i rapporterne sendt hjem til forældre i 11 stater. Syvogtyve stater bruger også dette indeks til at evaluere lærere.

Selvom et mål for elevernes "vækst" eller fremskridt lyder som en god idé, er elevvækstpercentiler endnu ikke understøttet af forskning. Faktisk flere undersøgelser antyder de giver ikke nøjagtige beskrivelser af elevernes fremskridt og lærerens effektivitet.

Hvad betyder det?

Hvad er egentlig "elev vækstpercentiler"?

De er indekser foreslået i 2008 af Damian W. Betebenner, en statistiker, der foreslog, at de skulle bruges som et beskrivende mål for studerendes "akademiske vækst" fra det ene skoleår til det andet. Idéen var at beskrive elevernes fremskridt i forhold til deres kammerater.

Ligesom de vækstdiagrammer, børnelæger bruger til at beskrive børns højde og vægt, varierer elevvækstpercentiler fra et lavpunkt på en til et maksimum på 99. Deres beregning involverer dog meget flere fejl end fysiske mål, såsom højde og vægt. Vores forskning ved University of Massachusetts Amherst indikerer væsentlig fejl i deres beregning.

Studerendes vækstpercentiler er afledt af testresultater, som ikke er helt præcise beskrivelser af elevernes akademiske færdigheder: Testresultater er påvirket af mange faktorer, såsom spørgsmålene stillet på en bestemt dag, elevernes temperament, deres engagementsniveau, når de tager testen eller blot de metoder, der bruges til at score deres svar.

Hver elevs vækstpercentil beregnes ved hjælp af mindst to forskellige testresultater, typisk med et års mellemrum eller mere. De seneste testresultater for en elev sammenlignes derefter med de seneste testresultater for elever, der havde lignende score i tidligere år. Dette er for at se, hvem af disse elever, der havde højere eller lavere score i år.

Problemet er imidlertid, at hver af beregningerne har en eller anden målefejl. Yderligere beregninger forstærker kun denne fejl. Så meget, at resultaterne ender med dobbelt så meget fejl. Ingen statistisk sofistikering kan slette denne fejl.

Spørgsmålet er, hvorfor så mange stater bruger en så upålidelig målestok?

Bruger det til ansvarlighed

Brugen af ​​elevvækstpercentiler skyldes til dels et ønske om at se, hvor meget eleverne lærer i et bestemt år, og at knytte disse fremskridt til ansvarlighedssystemer såsom lærerevaluering.

I 2010 den Race-to-the-Top tilskudskonkurrence inviterede stater til at komme med innovative måder at bruge testresultater til at evaluere lærere på, hvilket banede vejen for, at dette nye mål for "vækst" hurtigt kunne anvendes i mange stater.

Brugen af ​​elevvækstpercentiler begyndte dog, før der blev forsket i deres nøjagtighed. Først nu er der tilstrækkeligt med forskning til at evaluere dem, og alle undersøgelser peger på den samme konklusion – de indeholder en masse fejl.

Ud over vores forskning ved University of Massachusetts Amherst, er forskning i nøjagtigheden af ​​studerendes vækstpercentiler blevet udført af nonprofitorganisationer på uddannelsesområdet som f.eks. WestEd, Uddannelsesprøvningstjeneste , andre forskningsinstitutioner. Forskere JR Lockwood , Katherine E. Castellano for nylig afsluttet at "Et betydeligt forskningsgrundlag bemærker allerede, at estimater for studerendes vækstpercentil for individuelle studerende har store fejl."

Imidlertid ser mange stater ud til at være uvidende om disse forskningsresultater. Massachusetts går endda så langt som til klassificere børn med vækstpercentiler mindre end 40 som "lavere vækst" og børn med vækstpercentiler større end 60 som "højere vækst".

Måling af lærerens præstation

Som jeg nævnte tidligere, bruger 27 stater elevvækstpercentiler til at klassificere lærere som "effektive" eller "ineffektive." Forskning i brugen af ​​vækstpercentiler til dette formål indikerer, at de kunne undervurdere præstationen af de mest effektive lærere, og overvurdere præstationen af de mindst effektive lærere – det stik modsatte af, hvad disse stater forsøger at gøre med deres lærerevalueringssystemer.

En nylig rapport fra WestEd evaluerede brugen af ​​elevvækstpercentiler til evaluering af lærere og indgået de "opfyldte ikke et stabilitetsniveau", som ville være nødvendigt for sådanne beslutninger med stor indsats.

Lad os gå tilbage til traditionelle foranstaltninger

Jeg mener, at elevvækstpercentiler har taget os et skridt tilbage i brugen af ​​pædagogiske tests for at forbedre elevernes læring.

Traditionelle mål for børns præstationer på uddannelsesprøver, såsom om de er "dygtige" i et givet år og deres faktiske testresultater, giver en god idé om, hvor godt de klarede sig i matematik eller læsning i et bestemt år.

Disse traditionelle percentilrækker rapporteres stadig på mange uddannelsesprøver, ligesom de var, da vi som forældre gik i skole. Traditionelle percentilrækker sammenlignede os med en national eller statslig gruppe i et givet år i stedet for at sammenligne os med, hvordan andre børn i nationen eller staten "voksede" på tværs af forskellige test, de tog i forskellige år, som elevvækstpercentiler forsøger at gøre.

I betragtning af, hvad vi nu ved om elevvækstpercentiler, er mit råd til forældre ikke kun at ignorere dem på deres børns testresultatrapporter, men også at kontakte deres statslige uddannelsesministerium og spørge, hvorfor de rapporterer en så upålidelig statistik.

At udvikle mål for, hvor meget eleverne har lært i løbet af et år, er et godt mål. Desværre gør studerende vækstpercentiler ikke et godt stykke arbejde med at måle det.

Om forfatteren

Stephen Sireci, professor i uddannelsespolitik, University of Massachusetts Amherst

Denne artikel blev oprindeligt offentliggjort den The Conversation. Læs oprindelige artikel.

Relaterede Bøger:

at InnerSelf Market og Amazon