2019. október 20., vasárnap , Vendel

1055 Bp., Szalay u. 10–14.

Tel.: (+36-1) 235-7200

Fax: (+36-1) 235-7202

magyar english
Elfelejtett jelszó

Intézeti folyóiratok

Köznevelés
Új Pedagógiai Szemle
Educatio
Könyv és nevelés
Kattintson ide a rendeléshez!
Tudástár >> Új Pedagógiai Szemle 2002 január

Helyzetjelentés a teljes körű pedagógiai mérések nemzetközi gyakorlatáról

2009. június 17.

A tanulmány a közelmúltban lezajlott első hazai képességmérés kapcsán összefoglalja a teljes körű tudásszint- és képességmérések történetét. Részletesen bemutatja, hogy az egyes európai országokban milyen célokat követnek a mérések, és milyen módszereket alkalmaznak a mérések során. A szerző elemzi a nemzetközi mérési szakirodalomban használt fogalmakat, s kísérletet tesz egy egységes magyar terminológia megalkotására.

Mihály Ildikó

Helyzetjelentés a teljes körű pedagógiai mérések nemzetközi gyakorlatáról

Az oktatómunka eredményességének kérdései régóta foglalkoztatják az embereket. Pedagógiatörténeti érdekességként tartják számon például azt, hogy időszámításunk előtt már jó kétezer évvel Kínában szigorú vizsgáztatásnak vetették alá az állami tisztviselők korábbi ismeretszerzésre alapozott szakértelmét; Szókratészről is feljegyezték, hogy a tanulók szóbeli értékelését a tanulási folyamat részének tekintette.1 Az Amerikai Egyesült Államok ún. Szövetségi Oktatási Hivatala már a 19. század közepén megbízást kapott arra, hogy "mutassa fel, melyek a különféle készségekben tanúsított előrehaladás feltételei".2 1883-ban pedig megjelent két olyan könyv is, amely sok szempontból a pedagógiai mérések tudományos megalapozásának tekinthető; G. Stanley Hall és Sir Francis Galton munkáit3 ugyanis az azóta eltelt több mint egy évszázad alatt is szüntelenül idézik a szakemberek.

A pedagógiai értékelés történetének ugyancsak meghatározó állomásaként tekinthető 1905-ben a francia Binet és Simon által kifejlesztett intelligenciavizsgálatok bevezetése.4 A 20. század további történeti adatai is jelzik, hogy a kutatókat változatlanul foglalkoztatta az értékelés feladata és az elvégzett értékelés megbízhatósága; 1913-ban például átfogó elemzés készült a matematika érdemjegyekkel jelzett minősítéseinek tapasztalatairól, 1936-ra pedig - hasonló tantárgyvizsgálati témákban - összejött egy egész kötetnyi5 kutatási beszámoló is, elsősorban angol-amerikai országok szakembereitől.

A korai harmincas években megkezdte működését a chicagói egyetemen Ralph W. Tyler, akit a szakma mindmáig a pedagógiai értékelési gyakorlat megalapítójának tekint. Munkája során nemcsak a tanulók kognitív teljesítményeire terjedt ki a figyelme, hanem az ezeket nagymértékben befolyásoló szociális jellemzőkre is. A hatvanas évektől a német nyelvű országokban is hozzákezdtek a szakemberek a pedagógiai diagnosztikai értékelési módszerek népszerűsítéséhez. 1967-ben jelent meg Amerikában Michael Scriven munkája, amelyben megfogalmazta a klasszikus különbségtételt a szummatív és a formatív értékelés között.6 1975-ben pedig egy szakmai dokumentumában maga az Európa Tanács is szót emelt a tanulási teljesítmény vizsgálatának szükségességéért.7 S ehhez az elkötelezettségéhez a szervezet a további évtizedekben is ragaszkodott. (1993-ban például az Európa Tanács szervezte az oktatáskutatási eredményeket áttekintő finnországi konferenciát, és ennek anyagát kötetben is megjelentette. Két évvel később pedig egy tankönyvekkel foglalkozó konferenciával tette ugyanezt.)

Az Amerikai Egyesült Államok 1965-ben hatályba lépett oktatási törvénye a jog eszközeivel elsőként adott hangot annak az elvárásnak, hogy mind az általános, mind a középfokú oktatásban meghatározó szerephez kell juttatni a pedagógiai-szakmai értékelés folyamatát. E döntésüket követően a pedagógia illetékesei már 1966-ban önálló szakmai-publikációs fórumot is teremtettek a pedagógiai értékelési tevékenységnek: útjára indították az azóta évente négy alkalommal megjelenő Journal of Educational Measurement című periodikájukat, melynek szerkesztésében jelenleg a kaliforniai egyetem szakemberei töltik be a vezető szerepet. (Természetesen a folyóirat európai és más országok oktatási vizsgálatairól is közöl beszámolókat.) Az sem véletlen, hogy Amerikában a jóval később, 1992-ben létrehozott ún. "Országos felmérés a tanulmányi haladásról" program az alkalmazott vizsgálati módszerekről - a hátrahagyott évtizedekre visszatekintve - már azt is megállapíthatta, hogy azok általában kedvező hatással voltak az amerikai iskolákban végzett értékelési folyamatok pedagógiai hatékonyságára8 is.

A teljes körű pedagógiai értékelés gyakorlatának kialakítása az európai országokban

A 20. század utolsó évtizedeiben - az amerikai példák hatására - Európában is mind több országban váltak rendszeressé a különböző korosztályokra vonatkozó, egész országra kiterjedő pedagógiai értékelő vizsgálatok. Az Egyesült Királyságban e folyamat első és meghatározó állomásaként tartják számon az 1976-os esztendőt, mert az oktatási minisztériumon belül ekkor hoztak létre egy önálló teljesítményértékelő szervezeti egységet (rögtön voltak természetesen olyanok, akik kijelentették: "az értékelési eljárások politikai eszközök a kormány kezében!").9 Az 1988-as brit oktatási reformtörvény a korábban csak alternatív eljárásként számon tartott, a nemzeti alaptanterv tudásfelmérő tesztjeire alapozott felméréseket évenkénti országos, azaz teljes körű gyakorlatként kötelezővé tette minden 7, 11, 14 és 16 éves gyerek számára. Skóciában 1977-ben fogadták el az "Assessment for All" (azaz "az értékelést mindenkinek") programot, melynek folytatásaként - alig hét esztendővel később - meg is kezdték az egy-egy korcsoportot, illetve iskolafokozatot érintő "Standard Grade" vizsgálatok rendszeresítését is. E felmérések a mindenkori célcsoportok matematika- és angoltudásának, ez utóbbi vonatkozásában pedig az olvasás-, írás- és beszédkészség szintjének leírására vállalkoztak olyan kritériumok figyelembevételével, amelyek lehetővé tették a korosztályok egyes tagjai közötti különbségtételt is.

Hollandiában 1986-ban született meg az a kormánydöntés, amely az alapfokú iskolai tanulmányok befejezésekor kötelező jelleggel előírta egy minden tanulóra kiterjedő diagnosztikus teszt elvégeztetését és - a további tanulságok levonása céljából - országos kiértékelését. Két évvel később az érettségi vizsgákat is országos követelmények alapján kezdték megszervezni. Ez a gyakorlat mindmáig érvényben van.

Svédországban már a hetvenes években kidolgoztak különféle, mérésre és értékelésre alkalmas teszteket, skálákat10, és az 1978/1979-es tanév során javaslatot tettek egy országos méretű vizsgálat lefolytatására is. Erre 1989-ben került sor, amikor is a második, illetve az ötödik osztályos tanulók körében az anyanyelv, a matematika és az idegen nyelv, azaz az angol nyelv oktatásának hatékonyságát mérték. Ettől az évtől számítják annak az országos értékelő programnak a megindítását, amely azóta is folyamatosan a viták kereszttüzében áll. Egyes ellenzői szerint a felmérések feladatai nagyon nehezek, ezért túlságosan megterhelik a gyerekeket, és így nem tekinthető hitelesnek az eredmények alapján kialakított kép. (Az 1993/1994-es tanévben egy majdnem teljes körű - az ország 286 településére kiterjedő - felmérés keretében az oktatás eredményessége és a ráfordított erőforrások nagysága közötti arányokat tárták fel.)

Írország is országos méretű értékelési programba kezdett 1989-ben, amelybe minden tizenkét, illetve tizenöt esztendős tanulót bevontak. Finnország is ekkor kerített sort eddigi egyetlen, a közoktatásban tanulók bizonyos korcsoportjaira vonatkozó teljes körű vizsgálatára. A finn szakemberek azt azonban nem szűnő büszkeséggel emlegetik, hogy náluk már több mint százéves múltra tekint vissza az - a helsinki egyetem által kidolgozott, az egyetemi felvételi eljárás során alkalmazott - érettségi teszt, amely anyanyelvből és matematikából vizsgálja meg a jelentkezők intellektuális érettségét egy nagyon alapos, hatórai munkát igénylő felmérés segítségével.

Franciaországban egyes állítások szerint11 a pedagógiai értékelések kérdése komoly szerepet játszott az 1968 májusában kitört diákzavargásokban. A tüntető, sztrájkoló és még a barikádokra is felmenő diákok ugyanis a megkezdett oktatási reformok ellenében - egyebek között - a hagyományos osztályozási-értékelési gyakorlat visszaállítását követelték a közép- és felsőfokú oktatási intézményekben. Ezért Franciaországban ezután sokáig nem adtak teret a másutt már mind jobban népszerűsödő értékelési módszereknek. A nemzetközi gyakorlat hatására azonban a pedagógiai értékelés itt is egyre inkább a társadalmi változások egyfajta jelzőberendezésévé vált, és 1989 óta polgárjogot kapott az évenkénti rendszerességgel elvégzett, nagy populációkat érintő felmérések tapasztalatainak tudományos igényű elemzése.12

Egy-egy ilyen franciaországi felmérés - például az, amelyet mindjárt az indulás évében az alapfok második évfolyamán, illetve a középfok kezdő, azaz hatodik évfolyamára belépő tanulók körében végeztek -, 1,7 millió tanulóra terjedt ki. Azóta évről évre bővítik a vizsgálatokba bevont tanulók körét; a felmérések már nem csupán az általánosan képző ágazatok diákjait érintik, hanem fokozatosan sorra kerülnek a szakmai líceumok különböző évfolyamai is, és az anyanyelvi, matematikai, történelmi ismeretek mellett újabban rákérdeznek az ipari technológiák, a gazdaságtan és a természettudományok egyes kiválasztott témáival kapcsolatos, illetve a szakmai képzettség részeként számon tartott ismeretekre is. A felmérések elvégzésekor minden alkalommal hangsúlyozzák, hogy a tájékozódás nem a tanulók szelektálására szolgál.13 A cél elsősorban az, hogy az iskolák, a pedagógusok az így nyert információkat a továbbiakban messzemenően figyelembe vehessék a szakmai munkájukban.

A thaiföldi Yomtienben 1990-ben megtartott, sok helyütt, sok vonatkozásban idézett Oktatást mindenkinek című világkonferencia határozatai között is szerepel a tanulási eredmények megismerése jelentőségének megfogalmazása. Az itt hivatkozott beszámoló14 szerzője elismerőleg szól az India Andra Pradesh államában elvégzett, minden alapfokú oktatási intézményt érintő, teljes körű mérésről, melynek határozott célja az országos és helyi döntéshozók szakszerű tájékoztatása volt az oktatás helyzetéről, a pedagógiai gyakorlat eredményeiről, hiányosságairól, és amely jó alapot teremtett a regionális oktatási rendszerek átszervezésének megkezdéséhez. A tartományban e vizsgálat tapasztalatai alapján vezettek be néhány évvel később új tankönyveket, alakították át a pedagógusképzés intézményrendszerét és gyakorlatát stb.

Ez a példa is jól szemlélteti az értékelési szakemberek azon megállapítását, mely szerint az iskolai rendszer átalakítása céljából hozott intézkedések első lépését igen gyakran a pedagógiai értékelés jelenti, mert ennek segítségével lehet az adott helyzet pontos leírására vállalkozni.15

A rendszerváltás után nem sokkal, 1991-ben Romániában is országos méretű értékelési programot indítottak el az oktatási minisztérium irányításával. A programba először minden iskola 8. és 12. évfolyamon tanuló diákját vonták be, később ezek a felmérések kiterjedtek az 5. és a 9. évfolyamok tanulóira is.

A Szlovák Köztársaság oktatási minisztériuma 1992-ben kidolgozott egy olyan tervezetet, amely az ország oktatási rendszerének 2000. évig történő átalakítása során mind az alap-, mind a középfokú oktatásban meghatározó szerepet szán a tanulók teljes körű értékelésének, illetve az itt nyert tapasztalatok országos szintű összegzésének. (Ennek egyik eredményeként például nemrégiben a szlovákiai magyar pedagógusok és szülők lapjában16 megjelent egy beszámoló, a magyar iskolákban már második éve folytatott, ún. KALIBRO-féle tanulói tudásszintmérésről, melyet népszerűsítői szeretnének országos méretűvé tenni. A módszer igénybevételéért azonban az iskoláknak egyszeri részvételi díjat kell fizetniük. Az érdekeltek ezzel magyarázzák azt, hogy sok iskola nem vállalja e sok eredményt ígérő gyakorlat alkalmazását.)

1993 júniusában a finnországi Yyväskyläben, az Európa Tanács által szervezett, az oktatásban végzett kutatásokkal foglalkozó konferencián a különböző országokból érkezett résztvevők összegezték17 a korábbi évtizedek értékeléssel kapcsolatos tapasztalatait. Itt fogalmazták meg azt az akkor már általánosnak mondható észrevételt is, hogy az értékelés gyakorlatában egyre inkább tért hódítanak a diagnosztikus és a formatív értékelés módszerei, melyek egyértelműen a tanítás és a tanulás segítésére törekednek és kifejezték azt az elvárást, hogy az ilyesfajta értékelési tevékenység megismertetését mielőbb be kell építeni a tanító- és tanárképzés anyagába.

Az értékelési folyamatok fogalom- és eszköztáráról

Az értékelési programok jelölésére a nemzetközi pedagógiai szakirodalomban három kifejezést is használnak: evaluation, measurment, assessment. E három kifejezés jelentéstartalma sok tekintetben megegyezik egymással, több vonatkozásban azonban jól érzékelhetőek a közöttük lévő különbségek is. Az evaluation kifejezést elsősorban a hagyományos iskolai, számokban is kifejezhető értékelés jelentésben alkalmazzák; a measurement (felmérés) kifejezés jelentésébe általában beleértik a tapasztalati megfigyelések, észrevételek valamilyen szintű és eszközrendszerrel történő szervezettségét is, míg az assessment kifejezés alkalmazója az egyes egyének vagy adott rendszerek bizonyos jellemzőinek értékelésére is vállalkozni kíván.18 Hasonló jelentésben idesorolható még az examining (tanulmányozás, illetve vizsgáztatás), valamint a teszt kifejezés is. (Ez utóbbi fogalmat általában a nagy megbízhatóságot nyújtó formatív eljárásokkal végzett értékelések leírására alkalmazzák.19) Sőt, az értékelés témakörében már egy új, máshol egyáltalán nem használt, így nehezen azonosítható fogalom is megszületett; ez a docimológia, amely használói magyarázata szerint a különféle vizsgálati és osztályozási eljárásokkal elvégzett tudásmérések pontosságának tudományos tanulmányozását, illetve kiértékelését jelenti.20 E bőség ismeretében érdekes nyomon követni a pedagógiai értékelés történetében e fogalmak sajátos dinamikáját is.

Kezdetben és azóta is még mindig nagyon gyakran az értékeléssel elsősorban mint az evaluation fogalommal jelölt tevékenységeknek a példáival találkoztunk/találkozunk a szakirodalomban. E fogalommal általában a tanulók (más esetekben az oktatók) tanulmányi teljesítményének valamilyen szempontú értékelésére utalnak; az értékelő tevékenység valamilyen tananyag, intézmény vagy szervezet alapos átvizsgálatára is utalhat.21 Figyelemre méltó, hogy használói a fogalomba beleért(het)ik az értékeléssel kapcsolatos tudományos, illetve igen gyakran nyilvánvalóan politikai tevékenység egyes elemeit is.

A képzési módszerek és azok hatékonyságának felmérésére újabban egyre szívesebben alkalmazzák a szakmában az assessment kifejezést. Ehhez a fogalomtartalomhoz ugyanis mintha könnyebben hozzákapcsolhatók lennének - a módszerre jellemző speciális kritériumok között - a tapasztalt jelenségek és az adott társadalom bizonyos jelenségei közötti összefüggésekre vonatkozó megállapítások is. Egyes vélemények szerint22 ez a kifejezés újabban háttérbe szorítja az evaluationt. Az assessment kifejezéssel jelzett értékelési tevékenység kapcsán is el kell mondani, hogy - akár az evaluation - az is elvégezhető az oktatási folyamatban részt vevő tanárok által a saját területükön éppúgy, mint átfogóan, akár egy egész országra vonatkozó távlatok kialakításához szükséges információk megszerzésének igényével. Annál is inkább, mert egy-egy ország oktatási, illetve értékelési rendszere között kétségkívül létezik kapcsolat, ha ez az összefüggés nem is annyira egyértelmű, mint amilyennek azt a teoretikusok szeretik feltételezni.23

Az értékeléselmélet más szakemberei24 viszont ez utóbbit, vagyis az assessment fogalmat az előbbinél bizonyos értelemben "keskenyebb", a harmadik, gyakran használt fogalomnál, a measurmentnél viszont jóval szélesebb jelentésűnek tekintik. Sokak szerint az is növeli a használhatóságát, hogy többdimenziós mátrix-mintavételi technikát alkalmaz, s a felvétel során elsősorban a minőségi tényezőkre fokuszál, mindig pontosan megfogalmazza, hogy a vizsgált program elérte-e az általa kitűzött célokat, és jelzi a szükséges továbblépés irányát is.25 A tesztmódszereket alkalmazó felmérések emlegetése esetében viszont általában az evaluation kifejezéssel találkozunk26, mint ahogy az értékelési funkciókat megjelölő diagnosztikus, formatív és szummatív minősítések is túlnyomórészt az evaluation kifejezéshez kapcsolódnak. Mivel pedig a diagnosztikus értékeléseket minden esetben valamilyen csoportosítás szerint végzik, a szakemberek annak külön jelentőséget tulajdonítanak, hogy ezek a csoportok iskolák közöttiek, iskolán vagy osztályon belüliek-e. Amikor viszont a kutatók a diagnosztikus jelzőt az assessment kifejezéshez kapcsolják27, akkor - láthatóan - a széles vagy teljes körű felméréseknek azon feladataira hivatkoznak, amelyek segítségével pontosan meg lehet állapítani az elvárt és a valós eredmények közötti eltéréseket, és fel lehet ismerni ezen eltérések okait is.

A teljes körű értékelések hatékonyságának biztosítása sem a munka megszervezése szempontjából, sem szakmailag-módszertanilag nem egyszerű feladat. A sok-sok szempont között az alábbi nyolcat például minden esetben be kell tartani:28

  • figyelni kell a felmérés várható következményeire (tanulók és tanárok vonatkozásában egyaránt);
  • biztosítani kell a vizsgálatok korrektségét;
  • számításba kell venni a teljesítménynek a feladatokra gyakorolt hatását, vagyis a transzfer és a generalizáció jelenségét;
  • a lehetőség szerint kognitív teljességre kell törekedni;
  • a feladatoknak összhangban kell lenniük a tantervi anyaggal;
  • a feladatoknak megfelelő minőséget kell képviselniük;
  • a kérdéseknek értelmeseknek kell lenniük;
  • szem előtt kell tartani a költség és a hatékonyság összefüggéseit is.

Tudomásul kell venni ugyanakkor azt is, hogy az országos méretű információszerzést biztosító pedagógiai-szakmai programok mindenütt egyre inkább az általános érdeklődés középpontjában állnak. A politikacsinálók, az adófizetők, az üzleti élet irányítói ugyanis nemcsak kíváncsiak az ilyen felmérések eredményeire, hanem határozott elképzeléseik, elvárásaik vannak az általuk szükségesnek ítélt normákkal, azaz a kívánatos teljesítménnyel kapcsolatban is29 a tapasztalatok alapján elkezdendő jobbítás szándékával.

 

A honlapon található tanulmányok, egyéb szellemi termékek, illetve szerzői művek (a továbbiakban: művek) jogtulajdonosa az Oktatáskutató és Fejlesztő Intézet. A jogtulajdonos egyértelmű forrásmegjelölés mellett felhasználást enged a művekkel kapcsolatban oktatási, tudományos, kulturális célból. A jogtulajdonos a művekkel kapcsolatos anyagi haszonszerzést azonban kifejezetten megtiltja.