Så gik der endnu et halvår, og vi er nået frem til projektets anden sommer. Og med det nærmer vi os projektets sidste, og meget spændende fase – Specialtræning af modeller. Men mere om det senere i denne sommerhilsen.

Første halvår 2023

I det første halve år af 2023 har hovedfokus i projektet været at få klargjort det data, vi skal bruge til at træne modellerne med. Det har blandt andet handlet om at annotere så meget data, som vi overhovedet kan. Målet er at få annoteret 1.023 repræsentationer af de enkelte typer af oplysninger – for eksempel adresse, organisation og kontaktoplysninger. Hele den proces kan I blandt andet læse om i opslaget her.

Det er gået rigtig godt, og vi nåede i mål med en bred skare af de entiteter, vi håbede på. Vi har fået annoteret 46.613 sætninger, og i alt 66.294 annoteringer. Af de mere interessante kategorier, hvor vi er nået over de 1.023 annoteringer kan nævnes ”Helbred” og ”Organisation”.

Nu går vi i gang med at finjustere og klargøre de sidste ting, inden modellerne bliver fodret med den annoterede data.

Vi har også fået udarbejdet en antropologisk undersøgelse af, hvordan brugerne tager imod det at arbejde med en platform, som anvender kunstig intelligens. Det medførte nogle spændende indsigter, som ikke mindst kan give anledning til gode refleksioner i den generelle ibrugtagning af kunstigt intelligente værktøjer. Blandt andet beskriver Pink Pastinak 3 typer af aktindsigtsbehandling, som vi vil kigge meget mere på den kommende tid. Rapporten kan findes her på hjemmesiden.

Vi er nu meget tæt på at kunne udstille de første elementer på sprogteknologi.dk. – Vores Grundmodel og potentielt et datasæt bestående af data fra 94 kommunale hjemmesider. Vi afventer i øjeblikket en tilbagemelding fra datatilsynet i forhold til den måde vi udstiller data på, som vi formoder kommer meget snart. Så snart vi er kørende på den del, skriver vi om det her, så hold gerne øje her på siden.

I den kommende tid

Modellerne

Projektet har nu et halvt år tilbage af sin levetid, og vi er fortsat relativt godt med. Ikke desto mindre er der stadig et par sløjfer og knuder, vi skal have bundet, før vi kan erklære projektet for vel gennemført.

Det helt store, springende punkt er, selvfølgelig, at få specialtrænet de to specialiserede modeller – NER og Semantisk søgning. Og det er vi heldigvis klar til at kunne sætte i gang med. Som tidligere nævnt har vi fået annoteret en hel masse data. Ud over det har vi indsamlet en stor mængde data fra kommunerne, som modellerne også får at arbejde med.

I takt med, at modellerne bliver trænet og udstillet, skal vi nok holde hjemmesiden opdateret – så følg endelig med her.

Business case

En anden ting, der har været stor fokus på gennem hele projektet, er potentialerne ved en løsning som denne. Tilbage i sommeren 2022 blev der lavet et katalog over 10 tidsbesparende teknologier, og her var projektet med som case.

De estimater, der blev brugt i denne case, vil vi gerne gøre endnu skarpere. Derfor går vi nu i gang med at lave en business case med udgangspunkt i de 3 typer af aktindsigtsbehandlinger, som Pink Pastinak peger på i deres rapport – A) dem der har mange aktindsigter, men ikke meget, der skal udelades; B) dem der har relativt mange aktindsigter og meget der skal udelades; og C) dem der ikke har mange men til gengæld komplekse og tværgående aktindsigter.

Ved at lave denne differentiering, kan vi komme tættere på de processer, der er forbundet med de forskellige typer af behandlinger, og dermed få indsigt i, hvor systemet bedst kan understøtte disse processer. På den måde kan vi blive endnu mere konkrete på potentialer målrettet hver type af behandling.


Kommunikation

På kommunikationssiden får vi fortsat masser af henvendelser – tak for det! – og har flere spændende aftaler i hus i efteråret, som vi ser frem til. Blandt andet er vi inviteret til en god snak med DSB og Skat, som er nysgerrige på projektet og kunstig intelligens mere generelt. Også Kultur- og slotsstyrelsen har inviteret os til at holde et oplæg i september. Ligeledes i september er vi budt med til en Workshop hos digitaliseringsstyrelsen, som opfølgning på en workshop vi deltog i i det tidlige forår 2023. På workshoppen sættes der spot på data – hvad er tilgængeligt, og hvordan kan det komme i spil.

Vi er sikre på, at vi nok skal få mange gode snakke om projektet, sprogmodeller og generelt bare kunstig intelligens.

Vi ser, med andre ord, ind i en spændende og begivenhedsrig sidste fase af projektet. Så til alle jer, der følger med – mange tak for jeres nysgerrighed og interesse!

Rigtig god sommer til alle.

Projektgruppen