AI-betygssättning i stor skala: Lärdomar från universitet

Praktiska arbetsflöden som skolor kan låna från högre utbildning

En universitetslärare och en skollärare som tillsammans går igenom instrumentpaneler för AI-stödd betygssättning

Från pilotprojekt till policy

Universitet gick först när det gäller AI-stödd betygssättning, främst av nödvändighet. Gruppstorlekarna ökade, förväntningarna på återkoppling steg och personalens arbetsbelastning nådde ohållbara nivåer. Samtidigt gjorde stora språkmodeller det plötsligt möjligt att automatisera delar av bedömningsprocessen som tidigare krävde mänskligt omdöme.

Tidiga pilotprojekt fokuserade ofta på låg-stakes-bedömningar: veckovisa quiz, labbrapporter, kortsvarsfrågor. Dessa försök syftade till att besvara två frågor. För det första: kunde AI-genererad återkoppling vara korrekt och pedagogiskt välgrundad? För det andra: kunde den spara personal tid utan att undergräva akademiska standarder?

När institutioner såg att AI pålitligt kunde förbedöma eller generera utkast till återkoppling började ledningen formalisera praktiken. Policys växte fram som beskrev AI som “bedömningsstöd” snarare än “automatisk betygssättning”. I nästan alla fall förblev människor de slutliga beslutsfattarna kring betyg, men AI började ta hand om det tunga arbetet med första genomläsning, utkast till återkoppling och konsekvenskontroller.\n För skolor är denna utveckling från små pilotprojekt till policy lärorik. Ni behöver inte börja med hög-stakes-prov. I stället kan ni starta med läxor, övningsuppsatser eller interna bedömningar, och först senare överväga mer formell användning när ni har evidens för att era processer är robusta.

Hur AI-stödd betygssättning ser ut

Inom högre utbildning ligger AI-stödd betygssättning vanligtvis inbäddad i befintliga lärplattformar snarare än att ersätta dem. Ett återkommande mönster har vuxit fram.

En lärare laddar upp en bedömningsmatris och en uppsättning modelllösningar eller kommenterade exempel. Studenter lämnar in arbeten som vanligt. AI analyserar sedan varje inlämning, stämmer av den mot matrisen och genererar:

  • Ett preliminärt betyg eller betygsintervall
  • Strukturerade kommentarer för varje kriterium
  • Förslag på feedforward: nästa steg eller riktad träning

Den mänskliga bedömaren ser en översiktsvy. I stället för att börja från ett tomt dokument granskar hen och redigerar AI:ns föreslagna kommentarer och betyg. Hen kan helt åsidosätta AI:n, men i många fall handlar det bara om att finslipa formuleringar eller justera gränsfall.

Vissa universitet använder AI för att “bedöma bedömningen”. AI jämför bedömares beslut inom en hel kursomgång och flaggar avvikelser, såsom ovanligt generös eller hård bedömning eller inkonsekvent tillämpning av kriterier. Detta hjälper kursansvariga att avgöra var moderering bör fokuseras.

Skolor kan spegla detta mönster i mindre skala. AI kan föreslå kommentarer på en uppsättning uppsatser i årskurs 9 eller 10, medan läraren behåller full kontroll över slutbetyget. Eller så kan den skanna en klassuppsättning labbrapporter i NO och lyfta fram de arbeten som kan behöva en närmare granskning eftersom de avviker från matrisen på oväntade sätt.

Styrning och kvalitetssäkring

Universitet har varit noga med att behålla människor i förarsätet, och de har byggt styrningsstrukturer som visar detta. Policys anger vanligtvis:

  • AI får utarbeta återkoppling och preliminära betyg
  • Mänskliga bedömare måste granska och godkänna alla betyg
  • AI-verktyg måste dokumenteras, godkännas och granskas regelbundet

Vissa lärosäten genomför studier med “parallell bedömning”. Ett urval tentor bedöms två gånger: en gång med AI-stöd och en gång utan. Skillnaderna analyseras för att upptäcka systematiska bias eller kvalitetsproblem. Där AI presterar sämre skalas dess roll tillbaka eller så omkonfigureras den.

Kvalitetssäkringskommittéer kräver också tydlig dokumentation: hur AI:n är konfigurerad, vilken data den använder och hur personalen utbildas. Externa examinatorer informeras ofta om AI:s roll så att de kan granska resultaten på ett adekvat sätt.

För skolor gäller liknande principer, även om strukturerna kan vara enklare. En intern policy kan tydliggöra att AI stödjer lärarens omdöme snarare än ersätter det. Ni kan knyta detta till er bredare policy för acceptabel AI-användning, så att personalen förstår var bedömningsstöd passar in i ert övergripande arbetssätt.

Moderering, kalibrering och bias

Universitetens bedömningsteam har upptäckt att AI fungerar bäst när den integreras i befintliga rutiner för moderering och kalibrering, inte bultas på i efterhand.

Innan storskalig användning genomför bedömare ofta kalibreringsövningar. De bedömer ett mindre urval arbeten, jämför sina beslut och ser sedan hur AI skulle ha bedömt samma arbeten. Denna trevägsjämförelse (bedömare A, bedömare B, AI) synliggör skillnader och hjälper till att förfina både mänskliga och AI-baserade tolkningar av matrisen.

Bias är en ständig oro. Vissa universitet anonymiserar arbeten innan AI-behandling, och tar bort namn och demografiska uppgifter. Andra testar systemet på olika typer av exempel för att kontrollera om arbeten av likvärdig kvalitet får liknande återkoppling oavsett kontext eller skrivstil.

Skolor kan anta enklare varianter av detta. Till exempel kan en ämnesgrupp:

  • Enas om ett set ankarexempel med överenskomna betyg
  • Köra dem genom AI:n och se var den avviker
  • Justera prompts, matriser eller användningsregler utifrån detta

Denna medvetna kalibrering hjälper till att säkerställa att AI förstärker – snarare än undergräver – er gemensamma förståelse av kunskapskrav och nivåer.

Elevernas tillit och transparens

Där universitet har lyckats har de varit ovanligt transparenta mot studenterna. De förklarar att AI kan hjälpa till att generera återkoppling, men att personalen har kvar ansvaret för betyg. Vissa lärosäten visar till och med vyer sida vid sida: AI:ns utkast och lärarens slutversion, för att demonstrera mänsklig kontroll.

Studenter blir vanligtvis lugnade när de ser att AI används för att ge mer snabb och detaljerad återkoppling, inte för att fuska med kvaliteten. De är mindre bekväma om de upplever att beslut fattas av en “svart låda”.

I skolor gäller samma princip. Var tydlig mot elever och vårdnadshavare om:

  • Var AI används (till exempel för att utarbeta formativ återkoppling)
  • Var den inte används (till exempel för slutbetyg på nationella prov)
  • Hur lärare granskar och justerar AI:s förslag

Att koppla detta till bredare samtal om när AI hjälper och när den skadar lärandet kan vara kraftfullt. Ni kan till exempel använda idéer från den här genomgången av AI:s påverkan på lärande för att rama in diskussionerna.

Arbetsbelastning, välmående och fackliga frågor

Personalens arbetsbelastning och välmående har varit centrala teman i universitetens införande. Många akademiker var initialt skeptiska, av rädsla för att deras expertis skulle automatiseras bort. Fackförbund lyfte ofta oro kring jobbsäkerhet, övervakning och avprofessionalisering.

Framgångsrika lärosäten tog tag i detta direkt. De positionerade AI som ett verktyg för att minska administrativ börda, inte ersätta akademiskt omdöme. De involverade personalen i utformningen av pilotprojekt, samlade in ärlig återkoppling och tillät möjligheter att avstå under de tidiga faserna. Vissa förhandlade fram formella överenskommelser med facken, där man slog fast att AI inte skulle användas för prestationsmätning eller för att ersätta tjänster.

För skolor, särskilt där fackförbund har starkt inflytande, är tidig dialog avgörande. Visa att AI-betygsstöd syftar till att:

  • Frigöra tid för rikare återkopplingssamtal
  • Minska repetitiv kommentering
  • Stödja likvärdighet, särskilt för lärare i början av sin karriär

Involvera personalrepresentanter i val av verktyg, utformning av arbetsflöden och definiering av röda linjer. Detta gemensamma ägarskap kommer att vara viktigare än någon enskild teknisk funktion.

Redo att revolutionera din undervisningsupplevelse?

Upptäck kraften i Automatiserad Utbildning genom att gå med i vårt community av lärare som tar tillbaka sin tid samtidigt som de berikar sina klassrum. Med vår intuitiva plattform kan du automatisera administrativa uppgifter, personifiera elevinlärning, och engagera dig med din klass som aldrig förr.

Låt inte administrativa uppgifter överskugga din passion för att undervisa. Registrera dig idag och förvandla din utbildningsmiljö med Automatiserad Utbildning.

🎓 Registrera dig GRATIS!

Att översätta praxis till skolornas arbetsflöden

Den viktigaste lärdomen från universiteten är att bädda in AI i befintliga bedömningssystem, inte bygga parallella processer.

I en typisk högstadie- eller gymnasieskola kan ni börja med tre arbetsflöden:

För det första, AI-stödd formativ återkoppling. Lärare laddar upp en bedömningsmatris och några exempeltexter. Elever lämnar in utkast till uppsatser eller rapporter. AI genererar strukturerad återkoppling, som läraren snabbt granskar och redigerar innan den delas. Betygen sätts fortfarande helt och hållet av läraren.

För det andra, AI-stödd moderering. Efter att lärarna har bedömt en klassuppsättning arbeten kör de anonymiserade versioner genom AI:n för att belysa potentiella inkonsekvenser. Detta ändrar inte betyg automatiskt, men ger ämnesansvariga en riktad lista över arbeten att dubbelkolla.

För det tredje, AI för standardkommentarer. AI hjälper till att generera en bank av ofta använda kommentarer som är kopplade till era matriser. Lärare väljer sedan och anpassar dessa vid bedömning, vilket snabbar upp processen samtidigt som den personliga prägeln behålls.

Varje arbetsflöde kan pilottestas i ett ämne eller en årskurs och sedan förfinas innan det rullas ut bredare.

Att utforma AI-anpassade matriser och mallar

Universitet har lärt sig att vaga matriser förvirrar AI-modeller lika mycket som de förvirrar studenter. Kriterier som “god förståelse” är svåra att tolka konsekvent. I stället använder man i allt högre grad mer specifika beskrivningar kopplade till observerbara drag i arbetet.

Skolor kan göra likadant genom att utforma AI-anpassade matriser som också gynnar mänskliga bedömare. En skrivmatris kan till exempel skilja mellan “använder en variation av meningsbyggnader korrekt” och “använder mest enkla meningar med vissa fel”. Dessa konkreta beskrivningar ger AI något att haka upp sig på och gör modereringen enklare.

Återkopplingsmallar spelar också roll. Många universitet strukturerar numera återkoppling under rubriker som “Det här gjorde du bra”, “Det här kan förbättras” och “Nästa steg”. AI kan fylla dessa avsnitt med utkast till kommentarer som läraren sedan förfinar. Denna struktur är lika hjälpsam i skolor, särskilt för elever som har svårt att agera på ostrukturerad återkoppling.

Om ni ändå håller på att omforma bedömningar kan ni också fundera på hur ni gör dem mer motståndskraftiga mot AI-genererat elevarbete, med stöd av idéer från att utforma AI-resilienta bedömningar.

Elevskydd, data och provbanker

Universitetens system är vanligtvis inbäddade i robusta ramverk för datastyrning, men skolor måste vara särskilt försiktiga. Flera begränsningar påverkar vad som är möjligt.

För det första elevskydd: elevers arbeten kan innehålla känslig personlig information. Alla AI-verktyg ni använder för bedömning måste hantera data säkert, med tydliga personuppgiftsbiträdesavtal och utan att elevdata används för modellträning utan uttryckligt samtycke.

För det andra dataskydd: säkerställ att all överföring av arbeten till AI-tjänster följer lokala dataskyddslagar. Pseudonymisering eller anonymisering är ofta klokt, särskilt för hög-stakes-arbeten.

För det tredje provbanksregler: i många system har externa prov och kontrollerade bedömningar strikta regler kring användning av digitala verktyg. AI-stödd betygssättning kan vara fullt acceptabel för interna bedömningar men förbjuden för vissa moment. Skolor behöver en tydlig karta över var AI får och inte får användas, och detta bör återspeglas i era policys och i personalens utbildning.

Dessa skyddsåtgärder bör ligga sida vid sida med er bredare etiska hållning till AI i bedömning, inklusive hur ni förhåller er till frågor som AI-detektering, vilket diskuteras i den här artikeln om etik kring AI-detektering.

En stegvis färdplan för skolor

Med utgångspunkt i universitetens erfarenheter kan en pragmatisk färdplan för skolor se ut så här.

Fas ett fokuserar på utforskning. En liten grupp intresserade lärare experimenterar med AI-stödd återkoppling på låg-stakes-uppgifter, med anonymiserade arbeten där det är möjligt. De dokumenterar fördelar, problem och elevers reaktioner.

Fas två går över till strukturerade pilotprojekt. En eller två ämneslag antar överenskomna arbetsflöden, såsom AI-utkastad återkoppling eller modereringsstöd, med tydliga framgångskriterier och möjlighet att avstå. Ledningen samlar in underlag om tidsbesparing, återkopplingens kvalitet och personalens välmående.

Fas tre formaliserar policyn. Skolan definierar var AI får användas i bedömning, hur mänsklig kontroll säkerställs och vilken utbildning personalen får. Denna policy linjerar med bredare digitala strategier och AI-strategier och kommuniceras tydligt till elever och vårdnadshavare.

Fas fyra handlar om skala. Framgångsrika arbetsflöden utökas till fler årskurser och ämnen, alltid med respekt för provbanksregler och krav på elevskydd. Regelbundna uppföljningar kontrollerar om det uppstår glidning, bias eller oönskade konsekvenser, och skolan är beredd att justera eller backa från arbetssätt som inte gynnar eleverna.

Genom allt detta är den vägledande principen densamma som på universiteten: AI ska förstärka professionellt omdöme, inte ersätta det. När den används genomtänkt kan den hjälpa lärare att lägga mindre tid på repetitiv rättning och mer tid på det rika relationsarbete som bara människor kan göra.

Lycka till med rättningen!
The Automated Education Team

Innehållsförteckning

Kategorier

Bedömning

Taggar

Artificiell intelligens Bedömning Utbildning

Senaste

Alternativa språk