Skip to content

Automatisk oversettelse av intranett med AI

Ole Kristian Mørch-Storstein
12. mars 2024

Da Microsoft lanserte muligheten for flerspråklige intranett i juni 2020, regnet mange med at vi skulle få tilgjengeliggjort en form for maskin-oversettelse av sidene via Bing eller lignende.

Dette har ikke skjedd, og flerspråklige intranett baserer seg fremdeles på manuelt oversatte sider. Prosessen anno 2024 er fremdeles svært lik slik den var ved lansering:

  1. Originalartikkelen skrives.
  2. Forfatteren oppretter språkvarianter. Disse er ord for ord kopier av originalen.
  3. Hver språkvariant oversettes manuelt og publiseres.

I utgangspunktet er dette en ganske enkel prosess, men det fører til at hver artikkel krever en del manuelle steg, selv i de tilfellene der man ønsker å bruke maskinoversettelse. Forfatteren må manuelt kopiere og lime inn teksten for hver seksjon inn i oversettelsesverktøyet.

Lanseringen av store språkmodeller og Azure Open AI har gitt oss verktøy og muligheter som vi ikke hadde tilgjengelig tidligere. Vi har nå muligheten til å kunne oversette alt innhold på siden, inkludert struktur og formattering, uten at vi må lage kompliserte løsninger for å oversette siden porsjonsvis.

Med bakgrunn i utfordringene vi ser med flerspråklige intranett har vi bygget en løsning som overordnet gjør følgende:

  1. Når en artikkel publiseres opprettes alle språkvarianter som ikke allerede er opprettet.
  2. Hver oversettelse er en kopi av den originale artikkelen, så teksten kan sendes inn i Azure Open AI for oversettelse
  3. Språkmodellen oversetter, og vår logikk gjør en kvalitetssikring før innholdet på siden oppdateres.
    • Oversettelsen er nå klar til enten å bli publisert direkte eller gå gjennom en kvalitetssikring

 

 

Komponentene i denne løsningen er

  1. Azure Logic app: fungerer som trigger, aktiveres ved publisering
  2. Azure Automation Runbook: PowerShell script som oppretter språkvarianter, instruerer språkmodellen og kaller Azure Open AI. Kvalitetssikring av respons fra Azure Open AI
  3. Azure Open AI Service: håndterer språkmodellen som benyttes av løsningen. Avhengig av Azure lokasjon vil forskjellige språkmodeller være tilgjengelig. Vi anbefaler at det velges en språkmodell med så stort kontekstvindu som mulig.

Selv med relativt strenge instruksjoner, vil språkmodellen av og til ignorere dem og for eksempel fjerne formattering. Stort sett er dette av mindre konsekvens, men noe av den opprinnelige strukturen som for eksempel navn på elementer må bestå. Vi kan derfor ganske enkelt gjøre kvalitetssikring på teksten som kommer tilbake fra Azure Open AI.

Av erfaring ser vi at det er stor forskjell i de modellene som tilbys som en del av Azure Open AI Service avhengig av datasenteret som er valgt. Datasentrene i USA har absolutt det største utvalget, men Europeiske Azure lokasjoner oppdateres stadig.

Om du er interessert i en demonstrasjon eller å snakke mer om denne eller lignende løsninger kan du ta kontakt med oss her.

 

 

Ole Kristian Mørch-Storstein

portrait-01

John Doe

Job Title

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Integer eget hendrerit metus. Curabitur a diam ultricies, vulputate quam non, aliquet sem. Nulla nisi enim, mollis ut tempus et, pulvinar eu urna. Mauris commodo turpis elit, sed dictum orci pharetra ac.