DeepSeek, Claude ja AI-hankinta

Kouluhankkijan opas datan alkuperäketjuun, toimittajaluottamukseen ja sopimuksellisiin punaisiin linjoihin

Koulun johtaja tarkastelee AI-hankinta-asiakirjoja ja toimittajan vakuutuksia koulutusdatan alkuperästä

Väite siitä, että DeepSeek olisi saattanut kouluttaa malliaan Claude-tuotoksilla, kuulostaa joidenkin opettajien korvaan teknologiafirmojen väliseltä riidalta. Kouluille, oppilaitoksille ja koulutuksen järjestäjille se on kuitenkin hyödyllinen varoitus. Kun AI-toimittaja ei pysty selkeästi selittämään, miten sen malli on koulutettu, mistä sen data on peräisin tai onko toisen järjestelmän tuotoksia kerätty laajassa mittakaavassa, riski ei jää toimittajalle. Se voi siirtyä hankintapäätöksiin, turvallisuusarviointeihin, oikeudelliseen vastuuseen ja pitkäaikaiseen riippuvuuteen. Siksi koulut tarvitsevat vahvemman näkökulman AI:n hankintaan, aivan kuten ne jo tarvitsevat yksityisyyden, tietoturvan ja saavutettavuuden osalta. Jos tiiminne tarkastelee AI-governancea laajemmin, artikkelimme EU:n AI Actista ja kouluhankinnoista tarjoaa hyödyllisen laajemman kehyksen.

Miksi tällä on merkitystä

Koulu hankkii AI-järjestelmän harvoin siksi, että se ihailee mallin arkkitehtuuria. Se hankitaan, koska joku haluaa nopeampaa raporttien kirjoittamista, tukea oppituntien suunnitteluun, kertaamisresursseja tai hallinnon automatisointia. Käytännössä tämä tarkoittaa, että hankintatiimit keskittyvät usein hintaan, ominaisuuksiin ja siihen, vaikuttaako työkalu turvalliselta oppilasdatan kannalta. Nämä kysymykset ovat tärkeitä, mutta ne eivät riitä. Jos toimittajan ydintä oleva malli on rakennettu kiistanalaisten tai huonosti dokumentoitujen lähteiden varaan, koulu voi periä palvelun epävakauden, oikeudellisen epävarmuuden tai äkilliset tuotemuutokset, jos toimittaja joutuu haastetuksi.

Kuvitellaan osasto, joka ottaa käyttöön AI-kirjoitusavustajan raportteja varten. Se toimii hyvin yhden lukukauden ajan, henkilöstö tulee siitä riippuvaiseksi, ja sitten toimittaja poistaa keskeisiä ominaisuuksia lisenssikiistan vuoksi. Välitön ongelma ei ole abstrakti immateriaalioikeuslainsäädäntö. Ongelma on määräaikojen pettäminen, uudelleenkoulutus, hämmentynyt henkilöstö ja uusi kiireellinen hankintakierros. Olemme nähneet samankaltaisia riippuvuushuolia myös muissa yhteyksissä, mukaan lukien muuttuvat käyttömallit ja valtavirran työkalujen hinnoittelupaineet, kuten käsittelemme tässä AI-riippuvuusriskin katsauksessa.

Datan pesu selitettynä

”Datan pesu” kuulostaa dramaattiselta, mutta selkokielinen ajatus on yksinkertainen. Sillä kuvataan tilannetta, jossa aineistoa, joka voi olla rajoitettua, tekijänoikeuden alaista tai sopimuksellisesti suojattua, muokataan tai kuljetetaan muiden järjestelmien kautta tavalla, joka saa sen näyttämään puhtaammalta kuin se todellisuudessa on. Nykyisessä AI-kontekstissa tämä voisi tarkoittaa sitä, että yhden mallin tuottamia vastauksia käytetään toisen mallin koulutusmateriaalina ja sitten väitetään, että toinen aineisto on vain ”synteettistä” tai ”mallin tuottamaa” dataa ilman, että käsitellään sitä, mistä nämä tuotokset alun perin tulivat.

Kouluille keskeinen asia ei ole se, osoittautuuko jokainen väite todeksi. Olennaista on, etteivät ”synteettinen data” tai ”julkisesti saatavilla olevat tuotokset” ole taikasanoja, jotka poistavat kaikki huolet. Jos toimittaja sanoo: ”Emme kaapineet suojattua sisältöä suoraan; koulutimme mallin tuotetuilla vastauksilla”, järkevä jatkokysymys on: kenen tuottamilla, millä lisenssillä ja missä mittakaavassa? Alkuperäongelma ei katoa siksi, että ketjuun on lisätty yksi ylimääräinen vaihe.

Puuttuva kysymys

Monissa koulujen AI-hankinnoissa ohitetaan yhä paljastavin kysymys: pystyykö toimittaja selittämään mallin ja sen koulutusdatan alkuperäketjun tavalla, jonka myös ei-asiantuntijahankkija ymmärtää? Kouluille annetaan usein hiottuja lausuntoja turvallisuudesta, innovoinnista ja tuottavuudesta. Harvemmin niille annetaan selkeä kuvaus lähteistä, lisensseistä, poissulkemisista, rajoituksista ja uudelleenkoulutuskäytännöistä.

Datan alkuperä tarkoittaa sitä, että voidaan jäljittää, mistä koulutusmateriaali on peräisin, mitä oikeuksia siihen liittyi ja miten toimittaja tietää, että käyttö oli laillista ja sopimusten mukaista. Tämä on erityisen tärkeää silloin, kun toimittajat yhdistävät avoimia malleja, kolmannen osapuolen API-rajapintoja, hienosäätöaineistoja ja asiakkaiden kehotteita yhdeksi palveluksi. Hankintahaaste korostuu myös avoimen lähdekoodin ja itse ylläpidettyjen vaihtoehtojen kohdalla, koska ”avoin” ei automaattisesti tarkoita ”vähäriskistä”. Artikkelimme avoimen lähdekoodin koulusoftan due diligence -arvioinnista tarkastelee tätä eroa syvemmin.

Tuotosten kerääminen ja lisensointi

Kaikki uudelleenkäyttö ei ole asiatonta. AI-yritykset voivat lisensoida aineistoja, ostaa pääsyn sisältöarkistoihin, käyttää avoimesti lisensoituja materiaaleja tai neuvotella nimenomaiset ehdot mallin parantamiseen. Ne voivat myös kouluttaa asiakasdatalla, jos sopimukset sallivat sen selkeästi, vaikka koulujen kannattaa olla tässä varovaisia. Lailliseen kouluttamiseen ja lisensointiin kuuluu dokumentoitu oikeusperusta, määritelty laajuus ja jäljitettävä käyttöperuste.

Tuotosten kerääminen on eri asia silloin, kun toimittaja kerää suuria määriä vastauksia toisesta mallista, erityisesti jos kerääminen rikkoo käyttöehtoja tai kiertää lisenssimaksuja. Käytännön ongelma kouluille on se, että toimittaja voi esittää nämä tuotokset neutraalina aineistona, vaikka ne ovat johdannaisia toisen palveluntarjoajan järjestelmästä ja kiistanalaisia. Jos toimittaja ei pysty selittämään eroa, se on varoitusmerkki.

Tällä on merkitystä myös luokkahuoneeseen näkyvissä työkaluissa. Koulu saattaa nähdä vain siistin käyttöliittymän palautteelle, raporttiluonnoksille tai quizien luomiselle. Mutta tämän käyttöliittymän alla voi olla ketju API-kutsuja, wrapper-ratkaisuja ja hienosäädettyjä malleja, joita kukaan koulussa ei ole kartoittanut. Siksi onkin hyödyllistä ylläpitää ajantasaista luetteloa AI-työkaluista ja datavirroista, kuten ehdotamme AI-yksityisyyden auditointitarkistuslistassamme.

Riski kouluille

Kun toimittajat eivät pysty selittämään koulutusdatan alkuperäketjua, koulut kohtaavat samanaikaisesti useita käytännön riskejä. Ensimmäinen on oikeudellinen epävarmuus. Vaikka koulu ei olisi se osapuoli, jota syytetään loukkauksesta, se voi silti joutua vastaamaan vaikeisiin kysymyksiin hallitukselta, vanhemmilta tai viranomaisilta due diligence -arvioinnista. Toinen on toiminnallinen häiriö, jos työkalu vedetään pois, sitä rajoitetaan tai sitä muutetaan olennaisesti. Kolmas on mainehaitta. Johtajat eivät halua selittää, miksi laajasti käytetty oppilaille suunnattu työkalu otettiin käyttöön ilman perustason tarkastelua siitä, mistä sen taustalla oleva älykkyys oli peräisin.

Mukana on myös laaturiski. Toimittajat, jotka ovat epämääräisiä alkuperän suhteen, ovat usein epämääräisiä myös arvioinnista, säilytyksestä, alihankkijoista ja mallipäivityksistä. Heikot vastaukset yhdellä alueella kulkevat usein yhdessä heikon hallinnan kanssa muuallakin. Jos vertailette jo työkaluja kirjoitustukeen, kannattaa katsoa otsikkotason ominaisuuksia pidemmälle ja kysyä, miten tietosuoja, lokitus ja audit trail -jäljitettävyys hoidetaan käytännössä, kuten käsittelemme tässä AI-avustajien vertailussa raporttien kirjoittamiseen.

Valmiina mullistamaan opetuskokemuksesi?

Tutustu Automaattisen Opetuksen voimaan liittymällä yhteisöömme opettajia, jotka ottavat aikansa takaisin samalla kun rikastuttavat luokkahuoneitaan. Intuitiivisen alustamme avulla voit automatisoida hallinnollisia tehtäviä, personoida oppilaiden oppimista ja olla vuorovaikutuksessa luokkasi kanssa aivan uudella tavalla.

Älä anna hallinnollisten tehtävien varjostaa intohimoasi opettamiseen. Liity mukaan tänään ja muuta opetustympäristösi Automaattisen Opetuksen avulla.

🎓 Rekisteröidy ILMAISEKSI!

Kymmenen kysymystä esitettäväksi

Hyvän hankintakeskustelun pitäisi siirtyä kysymyksestä ”Mitä työkalunne voi tehdä?” kysymykseen ”Mitä sen taustalla on?” Koulujen ei tarvitse kuulustella toimittajia erikoistuneiden oikeudenkäyntiasiantuntijoiden tavoin, mutta niiden täytyy esittää suoria kysymyksiä. Kysykää, mitä perusmalleja käytetään, onko koulutuksessa tai hienosäädössä käytetty kolmannen osapuolen tuotoksia ja voiko toimittaja kuvata kunkin merkittävän koulutuslähteen oikeusperustan tai lisenssin. Kysykää, käytetäänkö asiakkaiden kehotteita tai tuotoksia mallin parantamiseen ja onko tämä oletuksena päällä.

Menkää sitten pidemmälle. Kysykää, mitä näyttöä toimittaja voi antaa koulutusdatan hallinnasta, onko suojatuille tai arkaluonteisille lähteille dokumentoituja poissulkuja ja miten lähdedataa koskevia kiistoja käsitellään. Kysykää, mitä tapahtuu, jos ydintä oleva mallitoimittaja muuttaa ehtoja, keskeyttää pääsyn tai väittää väärinkäyttöä. Kysykää, ilmoitetaanko koululle olennaisista mallimuutoksista. Lopuksi pyytäkää toimittajaa selittämään punaiset linjansa selkokielellä: mitä dataa se ei koskaan käytä, mitä lähteitä se ei koskaan ingestoi ja mitä sopimuksellisia rajoituksia se ei ylitä.

Sopimuskohdat, joita kannattaa vaatia

Koulujen ei pitäisi tyytyä ystävälliseen vakuutteluun myyntipuhelussa. Jos datan alkuperäketjulla on merkitystä, sen täytyy näkyä kirjallisesti. Järkevän sopimuksen tulisi sisältää vakuutus siitä, että toimittajalla on palvelun tarjoamiseen sekä mahdollisten asiaankuuluvien mallien kouluttamiseen tai hienosäätöön tarvittavat oikeudet. Sen tulisi sisältää vahingonkorvauslausekkeet kolmansien osapuolten immateriaalioikeusvaatimuksia varten sellaisella sanamuodolla, joka ei romahda heti, kun koulu konfiguroi työkalua tavallisella tavalla. Sen tulisi myös edellyttää viipymätöntä ilmoitusta vaatimuksista, tutkinnasta tai olennaisista palveluun vaikuttavista kiistoista.

Auditointioikeuksia kannattaa tavoitella, vaikka ne olisivat suhteutettuja eivätkä rajattomia. Koulu ei välttämättä tarvitse suoraa pääsyä raakadata-aineistoihin, mutta se voi pyytää riippumattomia varmennusraportteja, dokumentoituja model card -kuvauksia, alikäsittelijäluetteloita ja näyttöä hallintakatselmuksista. Jos toimittaja kieltäytyy kaikesta merkityksellisestä läpinäkyvyydestä, se kertoo jotain. Koulut voivat myös vaatia oikeutta sopimuksen päättämiseen, jos syntyy vakava alkuperäkiista tai mallitoimittaja vaihtuu ilman hyväksyntää. Johtajille, jotka laativat tai päivittävät toimintalinjausten sanamuotoja tänä vuonna, tämä AI-policy sprint -paketti voi auttaa muuttamaan hallintaperiaatteet käyttökelpoisiksi lausekkeiksi.

Punainen–keltainen–vihreä näkymä

Käytännöllinen luottamuksen arviointikehikko voi pitää päätökset maan pinnalla. Vihreä toimittaja pystyy nimeämään perusmallinsa, selittämään koulutuslähteensä yleisellä tasolla, vahvistamaan lisensoinnin tai laillisen käytön, kertomaan selvästi käytetäänkö asiakasdataa koulutukseen ja tarjoamaan sopimuksellisia sitoumuksia ilmoittamisesta ja vahingonkorvauksista. Keltainen toimittaja antaa osittaisia vastauksia, nojaa vahvasti yleisiin ilmauksiin kuten ”proprietary methods” tai tarjoaa läpinäkyvyyttä vasta sopimuksen allekirjoittamisen jälkeen. Tämä voi silti olla hallittavissa vähäriskisissä käyttötapauksissa, jotka eivät kohdistu oppilaisiin, mutta sen pitäisi laukaista tiukemmat kontrollit.

Punainen toimittaja ei pysty tai ei halua selittää alkuperäketjua, välttelee kirjallisia sitoumuksia, muuttaa tarinaansa tapaamisten välillä tai vähättelee alkuperään liittyviä huolia merkityksettöminä. Toinen punainen lippu on aggressiivinen alennushinnoittelu, joka painostaa kiireisiin päätöksiin ennen asianmukaista arviointia; tämä ilmiö ei rajoitu AI:hin, mutta näkyy yhä enemmän ohjelmistomyynnissä. Artikkelimme AI-tilausten dark pattern -käytännöistä ja hankintatarkistuksista näyttää, miten kaupallinen paine voi heikentää due diligence -arviointia, jos tiimit eivät ole varovaisia.

Mitä tehdä tällä lukukaudella

Jos koulunne käyttää jo mahdollisesti korkeariskistä AI-työkalua, älkää panikoiko älkääkä odottako täydellistä toimintalinjausten uudelleenkirjoitusta. Aloittakaa tunnistamalla, missä työkalua käytetään, mitä dataa siihen syötetään ja onko se välttämätön vai vain kätevä. Esittäkää toimittajalle yllä olevat alkuperäkysymykset ja pyytäkää kirjalliset vastaukset. Tarkistakaa sopimusehdot koulutuskäytön, vahingonkorvausten, ilmoitusaikojen ja irtisanomisoikeuksien osalta. Jos vastaukset ovat heikkoja, rajoittakaa työkalu vähäriskisiin tehtäviin samalla kun vaihtoehtoja arvioidaan.

On myös viisasta erottaa välitön hyöty luokkahuoneessa pitkäaikaisesta alustasitoumuksesta. Työkalu, joka auttaa ideoinnissa, voi silti olla sopimaton oppilasdatalle, arvioinnin tueksi tai koko koulun laajuiseen käyttöönottoon. Hankinta ei tarkoita innovaation kieltämistä. Se tarkoittaa sen tietämistä, mitä ollaan ostamassa, mitä oletuksia sen alla on ja mitä tapahtuu, jos nämä oletukset pettävät. DeepSeek–Claude-väite muistuttaa siitä, että kouluissa tärkein AI-kysymys on joskus kaikkein vanhin hankintakysymys: voiko tämä toimittaja näyttää, miten se on työnsä tehnyt?

Kohti selkeämpiä toimittajavastauksia ja turvallisempia AI-hankintapäätöksiä.
The Automated Education Team

Sisällysluettelo

Kategoriat

Koulun toiminta

Tagit

Hankinta Etiikka Tekijänoikeus

Uusimmat

Vaihtoehtoiset kielet