DeepSeek, Claude och AI-upphandling

En skolköpares guide till datalinje, leverantörsförtroende och avtalsmässiga röda linjer

En skolledare som granskar AI-upphandlingsdokument och leverantörsförsäkringar om träningsdatats ursprung

Påståendet att DeepSeek kan ha tränats på utdata från Claude kommer för vissa lärare att låta som ett gräl mellan teknikföretag. Men för skolor, högskolor och skolkoncerner är det en användbar varningssignal. När en AI-leverantör inte tydligt kan förklara hur dess modell tränades, var dess data kom ifrån eller om utdata från ett annat system samlades in i stor skala, stannar risken inte hos leverantören. Den kan påverka upphandlingsbeslut, granskningar av skydd och säkerhet, juridisk exponering och långsiktigt beroende. Därför behöver skolor ett starkare inköpsperspektiv för AI, ungefär som de redan har för integritet, säkerhet och tillgänglighet. Om ert team ser över AI-styrning mer brett ger vår artikel om EU:s AI Act och skolupphandling ett användbart vidare perspektiv.

Varför detta spelar roll

En skola köper sällan ett AI-system för att den beundrar modellarkitekturen. Den köper ett därför att någon vill ha snabbare rapportskrivning, stöd för lektionsplanering, repetitionsresurser eller automatisering av administration. I praktiken innebär det att upphandlingsteam ofta fokuserar på pris, funktioner och om verktyget verkar säkert för elevdata. De frågorna är viktiga, men de är inte tillräckliga. Om en leverantörs kärnmodell byggdes på omtvistade eller dåligt dokumenterade källor kan skolan ärva instabilitet i tjänsten, juridisk osäkerhet eller plötsliga produktförändringar om leverantören ifrågasätts.

Föreställ dig att en avdelning inför en AI-skrivassistent för rapporter. Den fungerar bra under en termin, personalen blir beroende av den, och sedan tar leverantören bort nyckelfunktioner medan den hanterar en licenstvist. Det omedelbara problemet är då inte abstrakt immaterialrätt. Det är missade deadlines, omskolning, förvirrad personal och ännu en akut upphandlingsrunda. Vi har sett liknande beroenderisker uppstå i andra sammanhang, inklusive förändrade åtkomstmodeller och pristryck i vanliga verktyg, som diskuteras i den här genomgången av AI-beroenderisk.

Data laundering förklarat

“Data laundering” låter dramatiskt, men grundidén på enkel svenska är enkel. Det beskriver en situation där material som kan vara begränsat, upphovsrättsskyddat eller avtalsmässigt skyddat omvandlas eller passerar genom andra system på ett sätt som får det att se renare ut än det egentligen är. I den nuvarande AI-kontexten kan det innebära att utdata som genererats av en modell används som träningsmaterial för en annan och att man sedan hävdar att den andra datamängden bara är “syntetisk” eller “modellgenererad” utan att ta upp var dessa utdata ursprungligen kom ifrån.

För skolor är huvudpoängen inte om varje anklagelse visar sig vara sann. Det är att “syntetiska data” eller “offentligt tillgängliga utdata” inte är magiska uttryck som undanröjer alla farhågor. Om en leverantör säger: “Vi skrapade inte skyddat innehåll direkt; vi tränade på genererade utdata”, är en rimlig följdfråga: genererade av vem, under vilken licens och i vilken skala? Ett problem med ursprung försvinner inte bara för att ytterligare ett steg har lagts in i kedjan.

Den saknade frågan

Många AI-inköp i skolan hoppar fortfarande över den mest avslöjande frågan: kan leverantören förklara modellens och träningsdatats linje på ett sätt som en icke-specialiserad köpare kan förstå? Skolor får ofta välpolerade uttalanden om säkerhet, innovation och produktivitet. De får mer sällan en tydlig redogörelse för uppströmskällor, licenser, undantag, begränsningar och omskolningspraxis.

Dataproveniens innebär att kunna spåra var träningsmaterial kom ifrån, vilka rättigheter som var knutna till det och hur leverantören vet att användningen var laglig och avtalsmässigt tillåten. Detta är särskilt viktigt när leverantörer blandar öppna modeller, tredjeparts-API:er, finjusteringsdataset och kundprompter i en och samma tjänst. Upphandlingsutmaningen blir också skarpare med open-source- och self-hosted-alternativ, eftersom “öppet” inte automatiskt betyder “låg risk”. Vår artikel om due diligence för open-source-programvara i skolan utforskar den skillnaden mer ingående.

Insamling av utdata och licensiering

All återanvändning är inte olämplig. AI-företag kan licensiera dataset, köpa tillgång till innehållsarkiv, använda öppet licensierat material eller förhandla fram uttryckliga villkor för modellförbättring. De kan också träna på kunddata där avtal tydligt tillåter det, även om skolor bör vara försiktiga här. Legitima tränings- och licensieringsupplägg innebär dokumenterade rättigheter, definierad omfattning och en spårbar grund för användning.

Insamling av utdata är något annat när en leverantör samlar in stora mängder svar från en annan modell, särskilt om den insamlingen bryter mot användarvillkor eller kringgår licensavgifter. Den praktiska frågan för skolor är att en leverantör kan presentera dessa utdata som ett neutralt dataset, trots att de är härledda från en annan leverantörs system och föremål för tvist. Om leverantören inte kan förklara skillnaden är det en varningssignal.

Detta spelar också roll i verktyg som används direkt i klassrummet. En skola kanske bara ser ett snyggt gränssnitt för återkoppling, rapportutkast eller quizgenerering. Men under det gränssnittet kan det finnas en kedja av API-anrop, wrappers och finjusterade modeller som ingen i skolan har kartlagt. Det är en anledning till att det är värt att hålla en levande inventering av AI-verktyg och dataflöden, som föreslås i vår checklista för AI-integritetsgranskning.

Redo att revolutionera din undervisningsupplevelse?

Upptäck kraften i Automatiserad Utbildning genom att gå med i vårt community av lärare som tar tillbaka sin tid samtidigt som de berikar sina klassrum. Med vår intuitiva plattform kan du automatisera administrativa uppgifter, personifiera elevinlärning, och engagera dig med din klass som aldrig förr.

Låt inte administrativa uppgifter överskugga din passion för att undervisa. Registrera dig idag och förvandla din utbildningsmiljö med Automatiserad Utbildning.

🎓 Registrera dig GRATIS!

Tio frågor att ställa

Ett bra upphandlingssamtal bör gå från “Vad kan ert verktyg göra?” till “Vad ligger bakom det?” Skolor behöver inte förhöra leverantörer som specialiserade processjurister, men de behöver raka frågor. Fråga vilka basmodeller som används, om några tredjepartsutdata användes i träning eller finjustering och om leverantören kan beskriva den lagliga grunden eller licensen för varje större träningskälla. Fråga om kundprompter eller utdata används för modellförbättring och om det är aktiverat som standard.

Gå sedan längre. Fråga vilka bevis leverantören kan ge för styrning av träningsdata, om det finns dokumenterade undantag för skyddade eller känsliga källor och hur tvister om uppströmsdata hanteras. Fråga vad som händer om en leverantör av en kärnmodell ändrar villkor, stänger av åtkomst eller påstår missbruk. Fråga om skolan kommer att informeras om väsentliga modellförändringar. Be slutligen leverantören att förklara sina röda linjer på enkel svenska: vilka data den aldrig kommer att använda, vilka källor den aldrig kommer att ta in och vilka avtalsmässiga begränsningar den inte kommer att överskrida.

Avtalspunkter värda att driva

Skolor bör inte nöja sig med en vänlig försäkran i ett säljsamtal. Om datalinje spelar roll måste det stå skriftligt. Ett rimligt avtal bör innehålla en garanti om att leverantören har de rättigheter som krävs för att tillhandahålla tjänsten och träna eller finjustera relevanta modeller. Det bör innehålla skadeslöshetsklausuler för tredje parts immaterialrättsliga anspråk, med formuleringar som inte faller samman så fort skolan konfigurerar verktyget på ett normalt sätt. Det bör också kräva snabb underrättelse om anspråk, utredningar eller väsentliga tvister som påverkar tjänsten.

Revisionsrättigheter är värda att driva, även om de är proportionerliga snarare än obegränsade. En skola behöver kanske inte direkt tillgång till råa dataset, men den kan begära oberoende granskningsrapporter, dokumenterade modellkort, listor över underbiträden och bevis på styrningsgranskningar. Om en leverantör vägrar all meningsfull transparens säger det något. Skolor kan också driva på för uppsägningsrätt om det uppstår en allvarlig tvist om proveniens eller en icke godkänd förändring av modellleverantör. För ledare som utformar eller uppdaterar policyspråk i år kan det här sprintpaketet för AI-policy hjälpa till att översätta styrningsprinciper till användbara klausuler.

Ett röd-gul-grönt perspektiv

En praktisk tillitsmatris kan hålla besluten förankrade. En grön leverantör kan identifiera sina basmodeller, förklara träningskällor på hög nivå, bekräfta licensiering eller laglig användning, tydligt ange om kunddata används för träning och erbjuda avtalsmässiga åtaganden om underrättelse och skadeslöshet. En gul leverantör ger delvisa svar, förlitar sig starkt på breda formuleringar som “proprietary methods” eller erbjuder transparens först efter att avtalet har undertecknats. Det kan fortfarande vara hanterbart för användningar med låg risk som inte riktar sig till elever, men det bör utlösa stramare kontroller.

En röd leverantör kan eller vill inte förklara linjen, undviker skriftliga åtaganden, ändrar sin berättelse mellan möten eller avfärdar frågor om proveniens som irrelevanta. En annan röd flagga är aggressiva rabatter som driver fram förhastade beslut innan ordentlig granskning, ett mönster som inte är begränsat till AI men som blir allt synligare i programvaruförsäljning. Vår artikel om mörka mönster i AI-prenumerationer och upphandlingskontroller visar hur kommersiellt tryck kan försvaga due diligence om team inte är försiktiga.

Vad man bör göra den här terminen

Om er skola redan använder ett potentiellt högriskverktyg med AI, få inte panik och vänta inte på en perfekt omskrivning av policyn. Börja med att identifiera var verktyget används, vilka data som matas in i det och om det är nödvändigt eller bara bekvämt. Ställ frågorna om proveniens ovan till leverantören och begär skriftliga svar. Gå igenom avtalsvillkor för träningsanvändning, skadeslöshetsklausuler, uppsägningstider och uppsägningsrätt. Om svaren är svaga, begränsa verktyget till uppgifter med låg risk medan alternativ bedöms.

Det är också klokt att skilja mellan omedelbar nytta i klassrummet och långsiktigt plattformsåtagande. Ett verktyg som hjälper till med brainstorming kan fortfarande vara olämpligt för elevdata, stöd vid bedömning eller utrullning i hela skolan. Upphandling handlar inte om att förbjuda innovation. Det handlar om att veta vad man köper, vilka antaganden som ligger under det och vad som händer om dessa antaganden fallerar. Anklagelsen om DeepSeek–Claude påminner om att den viktigaste AI-frågan i skolan ibland är den äldsta upphandlingsfrågan av alla: kan den här leverantören visa hur den kom fram till sitt resultat?

Här är till tydligare leverantörssvar och säkrare inköpsbeslut för AI.
The Automated Education Team

Innehållsförteckning

Kategorier

Skolverksamhet

Taggar

Upphandling Etik Upphovsrätt

Senaste

Alternativa språk