Fra januar i år har Nasjonalbiblioteket hatt anledning til å trene språkmodeller på grunnlag av avisinnhold, etter en avtale som ble inngått i desember i fjor. Nasjonalbiblioteket og Kopinor har forhandlet siden oktober om vilkårene og begrensningene i en tilsvarende avtale om bokinnhold, og i mars ble det oppnådd enighet. En endelig avtale er imidlertid avhengig av bevilgning i statsbudsjettet for 2027.
– Det er mange gode grunner til å være skeptiske til generativ KI, ikke minst til hvordan tek-gigantene har tatt for seg av andres innhold og deretter kolonisert alle digitale hjørner av samfunnet, sa Kopinors administrerende direktør Hege Munch Gundersen i et informasjonsmøte for rettighetshaverne 11. mai.
Hun fastslo likevel at det for Kopinor var riktig å bidra til å få rettighetsperspektivet inn i avtaleverket om KI og å få kultur- og kunnskapssektoren inn i KI-økonomien.
– Vi vil bidra til et samfunn og et økosystem der språket, kulturen og kvaliteten har best mulig vilkår for en sunn utvikling, sa Gundersen da hun presenterte hovedpunktene som Nasjonalbiblioteket og Kopinor var blitt enige om.
Det er bare tekstinnholdet i de digitaliserte bøkene som vil inngå i den avtalen som skal inngås. For ytterligere å beskytte verk som er sårbare for bruk i språkmodeller, er disse bøkene unntatt fra tillatelsen:
- Forlagslitteratur utgitt siste ti år (for samisk litteratur siste åtte år). Grensen vil være rullerende.
- Bøker i bokgruppe 1 og 2 (skolebøker og fag- og lærebøker) utgitt etter 1980 (for samisk litteratur utgitt etter 2019).
- Bøker på bokmål og nynorsk som fortsatt er i salg.
Avtalen omfatter heller ikke bøker som er oversatt fra andre språk. Det er likevel tillatt å benytte oversettelser mellom nynorsk, bokmål og samiske språk.
Det er Nasjonalbiblioteket som vil bestemme hvilke publikasjoner som skal benyttes i trening av de ulike språkmodellene. De trente språkmodellene vil kunne deles vederlagsfritt med lisensbestemmelser som setter betingelser for den videre utnyttelsen.
Alle rettighetshavere kan reserve seg mot at deres verk skal brukes til trening av språkmodeller, og det er Kopinor som vil håndtere slike reservasjoner.
Kommer finansieringen på plass, vil en avtale gjelde fra 1. januar 2027. Den vil i første omgang gjelde i to år og deretter være en årlig, oppsigelig avtale.
DnF-leder Sivert Nesbø sier det er positivt at Nasjonalbiblioteket og Kopinor har blitt enige om en avtale.
– Norge er et foregangsland når det gjelder å anerkjenne opphavsrett, og at det blir betalt vederlag for bruk til trening er naturligvis viktig for opphaverne. Vi er enige med Munch Gundersen når hun vektlegger betydningen av å arbeide for et samfunn der språk og kultur har best mulig vilkår for en sunn utvikling.
Arbeidet med en norsk språkmodell bygger på argumenter om nasjonal digital suverenitet og hensynet til den språklige bredden, noe som blant annet sikrer bedre ivaretagelse av kvalitetsinnhold på nynorsk og samisk.
Det er likevel fortsatt flere spørsmål rundt hvordan man skal bruke disse språkmodellene videre. Vi ser at KI anvendes på stadig flere områder, og det blir allerede gitt ut bøker skrevet av eller i samspill med generativ kunstig intelligens.
– Det er avgjørende å ha en avklart holdning til disse spørsmålene, men jeg er samtidig ikke overbevist om at det kommer til å bli et veldig stort marked for bøker som er «skrevet» av kunstig intelligens på sikt. Det menneskelige har en verdi i seg selv som det er verdt å arbeide for, sier Nesbø.
Til sist understreker han viktigheten av at det finnes mulighet for å holde sine verk utenfor treningen:
– Alle opphavere kan reservere seg mot bruk til trening av denne språkmodellen i Norge. Det er naturlig, og vi er glade for at dette momentet er ivaretatt, da det er noe mange forfattere ønsker. Avtalen mellom Nasjonalbiblioteket og Kopinor sikrer også at verk utgitt de siste ti år ikke skal inngå i treningsgrunnlaget.
Les mer her.