Den svenska bedömningskulturen har vuxit fram i mötet mellan pedagogiska, vetenskapliga, byråkratiska och politiska behov och traditioner. Genom historien har betyg och bedömning använts för att frigöra individer genom att ge meriter förtur framför socialt arv.
År 1983 skrev bedömningsforskaren Ingmar Wedman en rapport med titeln Den eviga betygsfrågan. Wedman pekade på att betygsfrågan var infekterad och ständigt ledde till polarisering och debatt. Det som är intressant är att den betygsreform som nu genomförs och som är den sämst förberedda betygsreformen i modern tid inte varit föremål för särskilt livliga debatter, vare sig i riksdagen eller bland pedagoger. Det sätt på vilket vi debatterar eller accepterar en betygsreform är uttryck för en specifik bedömningskultur. Jag ska därför diskutera den svenska bedömningskulturen och hur den har vuxit fram.
Den svenska utbildningshistorien kännetecknas av att betyg och bedömning använts för att frigöra individer genom att ge meriter förtur framför socialt arv. Samtidigt begränsas rörligheten för dem som saknar meriter. Denna spänning är avgörande om vi vill förstå de olika sätt på vilka betyg och bedömning får legitimitet från tid till annan. Tankar om social mobilitet uppstod tidigt i Sverige och rätten till utbildning har spelat en central roll. Sverige fick genom reformationen av kyrkan under 1500-talet meritokratiska inslag som understöddes av att den lutherska protestantismen inte accepterade predestinationstanken. Gud visar tecken på vad man är skapt för, det är inte något som är givet på förhand. Alla (pojkar) var i grunden välkomna till skolan, men skolan skulle löpande avläsa ”tecken” på om de var lämpliga för studier. Därför infördes examinationen, undersökningen.
Samtidigt närmade sig universiteten också meritokratiska tankegångar. Renässansmän vid de europeiska universiteten hade under 1500-talet börjat intressera sig för den antika temperamentsläran som vetenskaplig grund för att utläsa studielämplighet. Koleriker och melankoliker var lämpade för högre studier medan flegmatiker och sangviniker ansågs ha för vattniga hjärnor för att komma ihåg saker.
Detta tankegods nådde Sverige ungefär samtidigt som intresset för temperamentsläran svalnade ute i Europa. En privatlärare vid namn Gustaf Ruder publicerade 1737 sitt livsverk: Anledning til snille-walet. Ruder skapade i sin bok lämplighetstabeller baserade på de fyra temperamenten och utvecklar olika tester för att avläsa vilket temperament ungdomen har, såväl utifrån hårfärg och kroppsform som utifrån minnesprov och läsprov. Ruder kan kallas vår första studievägledare. Han hade som oäkting själv fått möjlighet att studera genom en rik herres nåd, och hans drivkraft var förmodligen den självupplevda insikten att även fattiga kunde vara begåvade och lyckas.
Ruders tanke var att ta ifrån lärarna rätten att avgöra vilka som var lämpliga för studier och i stället mer objektivt fastställa detta genom en oberoende Snilleväljare. Förslaget gick på remiss. Även om landets läroverk inte hade något att invända mot temperamentsläran som teoretisk grund för bedömning, motsatte sig samtliga tio läroverk som yttrade sig att någon annan än lärarna själva kunde bedöma lärjungarnas begåvning. Dessutom menade läroverken att bedömningar måste ske kontinuerligt då lärjungarna utvecklas på oförutsebara sätt. Växjö gymnasielektorer skrev i sitt yttrande 1740: ”Alla dagar ser man väl det att den ene lärjungen är qvickare än den andre, har bättre minne och kan nu fortare göra reda för sin lexa än dess kamrat, som fast trögare, dummare, långsammare, ofta med full börd seglar den förre förbi, då dess judicium [omdöme] kommer till större mognad.”
Gustaf Ruder ville rationalisera och organisera själv och inte bara invänta Guds tecken. I det representerade han moderniteten. Läroverkens ideal var ett annat som innebar holistiska bedömningar, att tålmodigt och nära följa lärjungens utveckling. Ruders ideal kom över det följande seklet att vinna i allt fler sektorer, men särskilt i skolans värld finns spänningen kvar mellan dessa två olika ideal: Hur mycket ska vi forma och justera det växande barnet och hur mycket ska vi låta det följa sin egen fria utveckling?
Fridtjuv Berg lyfte fram Ruder som en pionjär för social mobilitet genom utbildning i diskussionerna kring bottenskolan under 1880. Ett steg mot allmän skolgång var införandet av skolplikten 1878 även om det egentligen var först i och med skärpta regler mot användningen av minderåriga (under tolv år) i industrierna 1900 som den fick genomslag. Industrierna fick inte anställa barn som saknade avgångsbetyg. Därmed kom också krav på att folkskolans avgångsbetyg formaliserades. Det intressanta är att betygen inte skulle ge arbetsgivaren en bild av elevernas kunskaper utan hindra arbetsgivare från att anställa barn som inte fått möjlighet till studier. Först senare kommer betyg från folkskolan att få betydelse som urvalsinstrument, men då till realskolan. I sammanhanget är det värt att betona att de flesta länder som i dag ger betyg i årskurs sex gör det för att det är då grundskolan (primary school) tar slut. Betygen är ett avgångsdiplom av mer rituell betydelse inför påbörjandet av den sekundära utbildningen (secondary school), undantaget Tyskland, Österrike och Nederländerna där betyg från årskurs 4 till 6 är urvalsgrundande. Grundprincipen i de flesta länder i Europa är att betygen sätts i slutet av grundskolan, må den sedan vara sex- eller nioårig.
I takt med att allt större andelar av en årskull avslutade folkskolan ökade trycket på realskolan att anta fler elever. Realskolan hade länge tillämpat inträdesprov med argumentet att lärarna själva var bäst lämpade att se vilka som hade vad som behövdes. Under 1930- och1940-talen började det påverka arbetet i folkskolan negativt då folkskolan lade mycket tid på att preparera eleverna inför en prövning som de flesta ändå inte gjorde. I stället började man från statens sida att förorda användningen av betyg som inträdesinstrument. Läroverkens representanter menade dock att det inte gick att lita till folkskollärarnas betyg. Carita Hassler-Göransson och Frits Wigforss hade under 1930-talet utvecklat så kallade standardiserade prov. De ryckte nu in och menade att om lärarna använde dessa prov så skulle de kunna sätta mer jämförbara betyg. Standardprov infördes på försök 1943 för att sedan användas i full skala 1955. Då hade Frits Wigforss varit död i ett par år och Torsten Husén vid Lärarhögskolan i Stockholm, mätpsykologiskt utbildad för mönstringstesterna av rekryter under andra världskriget, hade axlat manteln. Nya prov, nu mer mätteoretiskt förankrade än de Wigforss arbetat fram, började produceras i läsning, skrivning och räkning. Om Wigforss haft som vision för sina prov att stärka lärarnas kompetens i bedömning, tog Husén och hans kolleger proven i en helt annan riktning. De skrev i boken Standardprov 1956: ”[F]ördelarna med de objektiva testen är betydande. Bedömarens subjektiva värdering kan helt elimineras eller begränsas. Uppgifterna kan tillrättaläggas och arrangeras så att de blir tillräckligt många och lagom svåra på varje område man vill täcka.”
Citatet är typiskt för den typ av kunskapsmätning som växte med armétesten som förlaga. Testen skulle vara enkla att administrera till en stor mängd rekryter och de syftade till att vaska fram skillnader. Samtidigt som detta sätt att mäta tog sig in i skolan fanns det också en hel del övrigt att önska både av folkskolans och av läroverkens bedömningar. Lärarna hade varit relativt autonoma i sin bedömningspraktik som till stor del byggde på förhör, lappskrivningar och examinationer. Den typen av bedömning rimmade illa med efterkrigssamhällets önskemål om självständiga och kritiska individer. Inte minst ville statsmakterna motarbeta lärarnas moraliska bedömningar av elevernas flit och personlighet, särskilt på gymnasiet. Sverige behövde inte en kuvad ungdom. Men var det ändå så klokt att ”eliminera” lärarnas bedömningar och ersätta dem med centrala prov och relativa betyg?
Redan i utvärderingsarbetet kring grundskolans tillkomst under 1950-talet noterade forskare att det man mäter och de sätt på vilket man mäter kunskaper får oönskade bieffekter. I arbetena kring det relativa betygssystemet betraktas därför prov och betyg som ett nödvändigt ont och det gällde att minimera dess effekter genom att bara mäta och värdera sådana kunskaper som inte kunde ta skada av att värderas. Det visade sig emellertid snart att den hållningen ledde till att det enkelt mätbara blev dominerande i undervisningen.
1970-talet kan beskrivas som ett generellt auktoritetsuppror. Betyg och de centrala proven sågs som orsakerna till både social reproduktion och att lärare och elever upplevde skolan grå och trist. Betygsutredningen 1973 kom efter fyra års arbete fram till att betygens roll i kommunikationen mellan hem och skola skulle minska och ersättas med bland annat kvartssamtal. I Lgr80 betonades skolans och lärarnas maktposition och att det var viktigt att motverka social och ideologisk reproduktion. Skolöverstyrelsen undersökte möjligheterna att utveckla målstyrning och under 1980-talet påbörjades försök med nationella utvärderingar med bredare resultatmått än enbart elevprestationer.
Under 1980-talet kom betyg och centrala prov att betraktas som ett nödvändigt ont. Staten gjorde vissa mildringar i sina regleringar, men annars lämnades frågan åt sitt eget öde. Inte heller någon egentlig forskning bedrevs kring bedömning. Ingen blivande lärare fick någon undervisning att tala om kring bedömning vid lärarutbildningen. I stället för att ta nya initiativ kring bedömning etablerades ett dödläge, där nya lärare bedömde elever så som de blivit bedömda när de själva var elever. Det innebar att bruket av konventionella och standardprovsliknande bedömningar kom att dominera. Trots att både Lgy70 och Lgr80 strävade mot att tona ned utantillkunnandet var det vad som premierades hos eleverna som en konsekvens av att lärarna inte visste hur de skulle utvärdera eleverna annorlunda.
Redan i 1946 års skolkommissions arbete fanns en vision om en decentraliserad skola fri från onödig byråkrati. I ljuset av att utvecklingen gått trögt med implementeringen av Lgy70 och Lgr80 och utifrån den massiva kritik som både Riksrevisionsverket och pedagogiska forskare riktat mot Skolöverstyrelsen, blev det runt 1990 dags att realisera visionerna från 1940-talet. En förutsättning för decentralisering var att kommunerna idkade självkontroll och att staten kunde samla in resultat på nationell nivå och följa utvecklingen. Både stat och kommun skulle kunna rikta insatser baserade på resultat. Men vad var då skolans resultat? I allt utredningsarbete fick den frågan egentligen inget bra svar. Om resultatstyrning ska fungera behöver man information om vilka olika mål elever och skolor uppnår, varför de presterar som de gör, och hur andra processer och resurser kan leda till resultatförbättringar.
Det har varit svårt att ta fram ett brett resultatbegrepp som kan knytas till processer i skolan på ett sådant sätt att mål och resultatstyrning fungerar. Skolverket har strävat efter att få ett robust resultat och då är meritvärden och genomströmning lättillgängliga data. I en PM från 2001 skriver myndigheten: ”Även om vi mot förmodan skulle kunna skapa en modell som förklarar mer av de strukturella förutsättningarna på skolnivå, så skulle den bli alltför komplex, svår och kostsam att försörja med nödvändiga data.”
Skolverket visste att enkla resultatredovisningar kunde påverka lärarna negativt, men myndigheten betraktade vid sin tillblivelse medborgarnas rätt till insyn i skolan som ett överordnat behov. Det är ett svårt val: genomskinlighet eller ökad kvalitet? Båda målen tycks inte kunna uppnås samtidigt. Den prestigefulla konsultfirman McKinsey har visat att skolor, regioner och länder som hamnat i en negativ spiral blir allt sämre av att resultaten publiceras, medan de som går framåt inte påverkas alls av resultatpublicering. Resultaten måste tolkas och förklaras om de ska göra någon skillnad.
Ett problem är att skolans resultat är ytterst svårtolkade. Ju längre ifrån klassrummet man kommer desto svårare blir det dessutom. Politiker och skolbyråkrater försöker hitta enkla och övergripande svar, när det oftast handlar om vad man gör i klassrummet. Det som fungerar för vissa elever och lärare fungerar inte för andra. En grundidé med reformerna i början på 1990-talet var att lärarna skulle ges ett större utrymme att fatta professionella beslut. Inte minst ifråga om betygsättning och bedömning. När Skolverket 1994/95 skulle implementera det nya betygssystemet fanns emellertid inga tidigare erfarenheter att bygga på och i det närmaste ingen forskning om bedömning. Lärarkåren fick ett stort ansvar i sitt knä utan vidare stöd och med en helt annan tradition kring bedömningsmetoder än det som efterfrågades. Återigen blev bedömning något som kom i andra hand.
2011 realiseras så det betygssystem som 1992 års parlamentariska betygsutredning lagt fram. Utredningen slog fast att det av utvecklingspsykologiska skäl var olämpligt att betygsätta elever tidigare än i årskurs 7, så den borgerliga regeringen lade en proposition, som senare socialdemokraterna reviderade, för ett bokstavsbetyg från årskurs 7 i sex steg. Dessa steg följde Blooms taxonomi. I dag har man dock valt att inte använda kunskapskvaliteter som grund för betygsnivåerna utan infört ett mer kvantitativt sätt att se på prestationer där graderbara adverb styr vilka olika betyg eleverna kan få; på vad sätt eleven kan (välutvecklat) eller i vilken grad (viss). Både det nya och det gamla synsättet har sina brister och förtjänster men det är svårt att förstå hur ökad relativitet ska bidra till ökad likvärdighet som lyfts fram som ett viktigt motiv till de nya betygen. Och förmodligen är det inte det som det nya betygssystemet har som yttersta funktion. Nej, vinsten med att byta betygssystem är nog främst politisk. Regeringen kan framstå som handlingskraftig och ansvarstagande för en skola regeringen själv valt att sätta en krisstämpel på.
Betyg och bedömning är i högsta grad något det går att göra politik av. Skillnaderna mellan blocken är tydliga, om än små. I grunden ligger skilda uppfattningar om betyg och prov som pedagogiska redskap. Det borgerliga blocket har av tradition ansett att betyg, konkurrens och krav på resultat är motivations-höjande, medan vänsterblocket som fram till 1970-talet främst sett betyg som jämlikhetsskapande under 1980- och 1990-talet mer började peka på betyg som stigmatiserande och klassreproducerande. I betygen vilar flera moraliska ställningstaganden som faller tillbaka på två frågor: i vilken grad ska vi forma barnen som vi vill ha dem och i vilken grad kan vi bestämma vilka kunskaper som är viktiga att ha i framtiden? Dessa frågor delar inte bara politiker utan också lärare och föräldrar i olika läger. När och hur man anser att betyg ska sättas kan ses som en uppfattning om svaret.
Den svenska bedömningskulturen har vuxit fram i mötet mellan pedagogiska, vetenskapliga, byråkratiska och politiska behov och traditioner. Frånvaron av diskussion kring det nya betygssystemet kan förstås mot bakgrund av en bedömningskultur som betraktat betygen som något nödvändigt ont, oavsett om betygen behövs för att möjliggöra studier, skapa karriärvägar eller användas för kontroll. Betyg har ansetts ha positiva jämlikhetsskapande konsekvenser men negativa effekter på lärandet. Genom att i första hand betona betygens jämlikhetsskapande potential har den borgerliga regeringen fått legitimitet för det nya betygssystemet. Det är ett argument som har en djup förankring i den svenska bedömningskulturen. Ett annat typiskt drag i vår bedömningskultur är fixeringen vid betyg. Även om jag efterlyser en diskussion om de nya betygen hoppas jag att vi i framtiden intresserar oss mer för bedömning för lärande.
Christian Lundahl