Tumgik
#kunstigintelligens
funza · 1 year
Photo
Tumblr media
Repost from @techtopiadk • ⭐Techtopia 277: GPT-4 - Spøgelset i maskinen⭐ 🤖🌍 Kunstig intelligens er en del af vores hverdag, men hvordan fungerer de imponerende tjenester egentlig? 💻🧐 ChatGPT fra OpenAI kan agere som en menneskelig samtalepartner på nettet, og nu er GPT-4 offentliggjort, som er trænet på endnu flere data! 😱💪 I Techtopia-podcasten taler vi med AI-specialisten Erik David Johnson fra Delegate om, hvordan disse sprogmodeller kan virke så menneskelige og fremstå som om, de forstår vores verden på samme niveau som vi gør! 🎙️😍 Vil du høre mere om GPT-4? Lyt med, hvor du hører dine podcast eller gennem link i bio! #kunstigintelligens #OpenAI #GPT4 #Techtopia #podcast 🤖👍 📢Medvirkende 🧔‍♂️Erik David Johnson, AI-specialist hos firmaet Delegate. https://www.instagram.com/p/CqU4hEiMUsE/?igshid=NGJjMDIxMWI=
3 notes · View notes
Photo
Tumblr media
#callfordelegate Registration for delrgates is now open for the 13th World Nursing, Healthcare Management, and Patient Safety Conference, which is CME/CPD approved. Join us in Los Angeles, USA, on November 15–18, 2023. It unites international speakers and insider insights to study the most recent studies and trends. Grab your slot as an online listener/delegate now.
Email us at [email protected] WhatsApp: https://wa.me/442033222718 Register here: https://nursing.universeconferences.com/registration/
#nursing #patientsafety #healthcare #nurse #nurselife #nurses #nursingschool #nursingstudent #speakerdoctor #health #fitness #healthylife #selfcare #healthy #mentalhealth #nutrition #registerednurse #nursepractitioner #medicalstudent #studentnurse #medstudent #surgery #coronavirus #covid #Omicron #conferencia #MaamaaArtificial #Kunstigintelligens #enfermera #enfermeria
0 notes
vicislifeinbinary · 3 years
Photo
Tumblr media
I denne måned udgav Niels Damgaard og jeg en artikel hos ING/DataTech med titlen “Tre veje at gå for AI i retslig praksis og beslutningstagen: Højere grad af anvendelse af AI i sagsbehandling vil kræve lovændring, skriver jurastuderende Victoria Sobocki og cand.jur. Niels Damgaard.” Det var fedt at komme med input om emner som ligger inden for ens arbejds- og studieområde og jeg er taknemmlig for at have fået denne mulighed 😊🤖 I øjeblikket udvikles og anvendes AI af forvaltningen til en lang række opgaver, også når der skal træffes afgørelser over for borgere og virksomheder. Især systemer udviklet med machine learning viser et stort potentiale til at blive anvendt i stadig større udstrækning til at assistere sagsbehandlere, når de skal træffe afgørelser over for borgere, eller til at holde øje med, om borgere eller virksomheder overholder loven – men hvad kan problemerne ved samt løsningerne for dette være? . . Læs mere på pro.ing.dk/datatech/article/tre-veje-gaa-ai-i-retslig-praksis-og-beslutningstagen-13147 / tinyurl.com/AIbeslutningstagen . . “Ingeniørens PRO-medie DataTech er målrettet professionelle i såvel private virksomheder som offentlige organisationer, der arbejder med data science, AI, analytics med mere. DataTech giver dig inspiration, råd og erfaringer om, hvordan du analyserer og udnytter data, hvordan du navigerer ansvarligt og effektivt i junglen af love og regler på området, samt hvordan du udbreder værdien af dataanalyse til alle hjørner af organisationen. Vi giver dig viden om de nyeste teknologiske løsninger på tværs af fagområder, markeder og landegrænser. DataTech er medspiller i en fælles mission om at fostre etisk og sikker brug af data til fordel for virksomheder og borgere.” . . . . . . . . . . . #INGDATATECH #data #ingeniør #artikel #AI #artificialintelligence #legaltech #jura #UCPH #kbhuni #DKtech #NielsDamgaard #Damgaard #VictoriaSobocki #Sobocki #ArtificialIntelligenceandLegalDisruption #kunstigintelligens #Danmark #Copenhagen #AIlaw #AIpolicy #AIethics #fremtiden #machinelearning #futurism #AIregulation #sagsbehandling #ethics #blackbox #algorithms @DataTechdk (at Copenhagen) https://www.instagram.com/p/CQwd1vKB5jv/?utm_medium=tumblr
0 notes
arkivverketbeta · 3 years
Text
ARKIVVERKET BRUKER MASKINLÆRING
Vår satsing på maskinlæring i Arkivverket har for lengst gått over fra prøving og feiling til å utvikle faktiske nyttetjenester. Så det er på tide med en oppdatering av bloggen vår.
Sist snakket vi om sladding av personnummer i grunnboksblader fra Digitalarkivet. Vi har lyst til å formidle at dette nå har gått fra test til produksjon. Det er vår første automatiserte tjeneste basert på maskinlæring. Den har nå vært i drift i et par måneder, og resultatene så langt er vellykkede.
Søk – og deretter bestillingen – er som tidligere:
Tumblr media
Personnummeret er de 5 siste siffer i fødselsnummer. Datatilsynet regner ikke fødselsnumme som en sensitiv personopplysning (ref. beskrivelse hos Datatilsynet). Likevel ønsker vi ikke at dette skal komme på avveie, så vi gjorde en vurdering av personvernkonsekvenser – DPIA – i forbindelse med slike bestillinger
Flere metoder ble vurdert, der vi endte opp med å anbefale – og utvikle – denne prosedyren:
Tumblr media
Det betyr at bestilling av grunnboksblad nå kan gjennomføres automatisk, og dermed mye raskere enn tidligere. Denne rutinen ble valgt etter en kost/nytte/risiko-vurdering (se nedenfor).
Typisk for bruk av maskinlæring er at når den erstatter manuelt arbeid, vil det ofte – som her – være arbeid som er både monotont og kjedelig.
Etter bestilling får man en epost som ser slik ut etter sladding:
Tumblr media
En side fra et bestilt dokument ser slik ut:
Tumblr media
Selve programvaren er som vanlig utviklet ved å lage modeller basert på store treningssett med tilsvarende bilder av grunnboksblader.
Den maskinelle rutinen består av to steg.
Identifiser nøyaktig hvor i et bilde (koordinater) personnummer står (dette er det vanskelige)
Bruk deretter programvare for å endre disse områder (polygoner) slik at de blir svarte (dette er det enkle – her kan man velge mellom flere standardløsninger)
Dokumentene hadde til dels dårlig kvalitet. Vanlig OCR-tolkning klarte bare ca. 75 % av tekstene i et bilde. Vi måtte derfor utvide verktøykassa.
Vi har blant annet brukt følgende programvare:
OpenCV for forbehandling (forbedre dokument kvalitet ved justering, binarisering osv.).
tesseract-ocr for dokumenttolking. Tesseract kunne tolke ca. 90 % av alle tekster som står i et dokument (etter forbehandling). Tesseract- resultatene samles i - - -
Pandas DataFrame-format. I hver rad inkluderes et tolket ord og det knyttes koordinater til «bounding box». Ord med koordinater som overlapper med koordinater fra treningsdata, ble definert som fasit/target (personnummer).
Scikit-Learn-verktøy ble tatt i bruk for å organisere trenings-/test-data og evaluere resultatene.
XGBoost ble tatt i bruk for å definere og trene modellen over treningsdataene.
Alt dette krever mye maskinressurser. Vi har implementert trening over GPU (i motsetning til CPU) for å øke treningshastighet. Det skal vi komme tilbake til i et senere innlegg.
Modellen leverer ca. 89 % av riktige personnummer som står i «tolket» informasjon. Det betyr at for hele arbeidsflyten er presisjon ca. 80 % (90 % * 89 % = 80 % - ref. Tesseracts presisjon over.).
Ingen intelligens – kunstig eller menneskelig – er ufeilbarlig. Så det vil i denne løsningen dessverre forekomme feil – i den forstand at sladdingen mangler eller er upresis.
Vi har imidlertid laget rutiner for tilbakemelding fra brukerne dersom de oppdager feil. Feil kan være både «falske negative» (for lite sladdet) eller «falske positive (for mye sladdet)
Tilbakemeldingene gjør oss i stand til å forbedre modellene ytterligere – og dermed øke kvaliteten. Vi tror det bare er et tidsspørsmål før maskinell presisjon her overstiger den menneskelige.
Dersom du ønsker å ta kontakt utover bloggen, kan du også sende en epost til [email protected] gjenstår det bare å glede seg til videre forbedring av vår intelligens utover høsten. Vi har fått hjelp av noen flittige studenter til å teste en alternativ hypotese (Kan personnummer gjenkjennes med metoder som brukes til å gjenkjenne trafikkskilt?), noe som ser ut til å ha gitt enda bedre resultater. Følg med for videre innlegg!
Tumblr media
1 note · View note
karmel80 · 5 years
Link
via Twitter https://twitter.com/karmel80
0 notes
funza · 2 years
Photo
Tumblr media
Repost from @techtopiadk • Techtopia 264: Når chefens AI kigger dig over skulderen 🔍 Hjemmearbejde kan for nogle godt resultere i en ekstra kop morgenkaffe, lidt sortering af vasketøj eller måske en lille lur efter frokost. Men holder din arbejdsgiver egentlig øje med det? Der findes efterhånden en række forskellige softwareprogrammer, der kan holde øje med, om du fx taster på dit tastatur eller klikker med din mus – altså en reel dataopsamling af dig som medarbejder. Det kaldes algoritmisk ledelse og får flotte ord med på vejen om højere effektivitet og bedre udnyttelse af tid og kompetencer. Men faktum er, at mange ansatte er bekymrede for, om deres arbejdsplads overvåger dem. Det viser en ny undersøgelse om danske arbejdspladser. 👥 Medvirkende: Grit Munk, chefkonsulent, IDA Mary Towers, employment rights policy officer in the Rights, International, Social and Economic department at the TUC Catrine Søndergaard Byrne, advokat Labora Legal 🎧 Du kan finde link til episoden på www.techtopia.dk. Her kan du også finde et link til ADD projektets rapport "Hver femte medarbejder har følt sig overvåget på arbejdspladsen". #Techtopia #techtopiadk #tech #techdk #techpodcast #ai #kunstigintelligens #algoritmiskledelse #dataindsamling #digitalovervågning #ADDprojektet #overvågningpåarbejdspladsen https://www.instagram.com/p/CmGQ4Jfs1hG/?igshid=NGJjMDIxMWI=
0 notes
funza · 2 years
Photo
Tumblr media
Repost from @techtopiadk • Techtopia 261: Det er bare bryster Ada er en transkønnet kvinde, der i processen fra mand til kvinde lægger fotos af sin nøgne overkrop på det sociale medie Instagram i protest mod platformens censur af kvinders brystvorter. Bryster og brystvorter kan nemlig være svære at finde på Instagram – altså medmindre de sidder på en mand. Afbildning af kvinders brystvorter får kun i sjældne tilfælde lov til at blive liggende på platformen, men hvorfor er det sådan? Og hvordan ved Instagram præcis hvilke brystvorter, der er acceptable, og hvilke, der ikke er? Techtopia har inviteret Peter Svarre og Ada Hyldahl Fogh i studiet til en diskussion af digital etik og hvordan vi designer digitale løsninger, kunstig intelligens og algoritmer på en etisk forsvarlig måde. Adas kunstprojekt "in transitu" er også en kønspolitisk protest, der har til formål at få hendes Instagram-profil lukket. 👥 Medvirkende: Peter Svarre, foredragsholder, digital strateg og aktuel med bogen ”Digital Etik” Ada Hyldahl Fogh, kunstner, interaktionsdesigner, programmør og skaber af kunstværket "in transitu" under kunstnernavnet Ada Ada Ada (@ada_ada_ada_art) 🎧 Find episoden på www.techtopia.dk #Techtopia #tech #techpodcast #dktech #digitaletik #kunstigintelligens #ai #algoritmer #bias #kønsgenkendelse #genderbias #socialemedier #etikkompasset #DetDigitaleEtikkompas #DanskDesignCenter #ddc https://www.instagram.com/p/ClPW8kSMyyI/?igshid=NGJjMDIxMWI=
0 notes
Photo
Tumblr media
#callfordelegate The onsite Registration is now open for the 11th World Nursing, Healthcare Management, and Patient Safety Conference, which is CME/CPD/CE approved. Join us in San Francisco, USA, on November 15–18, 2022. It unites international speakers and insider insights to study the most recent studies and trends. Grab your slot as an online listener/delegate now.
Email us at [email protected] WhatsApp: https://wa.me/442033222718 Register here: https://nursing.universeconferences.com/registration/
#nursing #patientsafety #healthcare #nurse #nurselife #nurses #nursingschool #nursingstudent #speakerdoctor #health #fitness #healthylife #selfcare #healthy #mentalhealth #nutrition #registerednurse #nursepractitioner #medicalstudent #studentnurse #medstudent #surgery #coronavirus #covid #Omicron #conferencia #MaamaaArtificial #Kunstigintelligens #enfermera #enfermeria
0 notes
Photo
Tumblr media
#Callforrgistration If you are interested to be a part of this conference as a speaker or delegate then register yourself today. Our CME/CPD/CE accredited 11th World Nursing, Healthcare Management, and Patient Safety Conference will be held on November 15-18, 2022 in San Francisco, USA. Registration deadline is extended to 14th November.
Register here: https://nursing.universeconferences.com/registration/ #Nursing #NursingConference #UCGConferences #doctor #Globaliseeruminejatervis #GlobalisasyonatKalusugan #NakamamataynaEpektongCoronavirussaTao #naturopathicdoctor #doctorsoffice #medicaldoctor #futuredoctors #ninthdoctor #doctorwhocosplay  #researchpaper #researchers #biochemistry #medicalresearch #instascience #sciencecommunication #scicomm #phdchat #research #MaamaaArtificial #Kunstigintelligens
0 notes
Photo
Tumblr media
#callfordelegate Registration is now open for the 11th World Nursing, Healthcare Management, and Patient Safety Conference, which is CME/CPD/CE approved. Join us in San Francisco, USA, on November 15–18, 2022. It unites international speakers and insider insights to study the most recent studies and trends. Grab your slot as an online listener/delegate now.
Email us at [email protected] WhatsApp: https://wa.me/442033222718 Register here: https://nursing.universeconferences.com/online-registration/
#nursing #patientsafety #healthcare #nurse #nurselife #nurses #nursingschool #nursingstudent #speakerdoctor #health #fitness #healthylife #selfcare #healthy #mentalhealth #nutrition #registerednurse #nursepractitioner #medicalstudent #studentnurse #medstudent #surgery #coronavirus #covid #Omicron #conferencia #MaamaaArtificial #Kunstigintelligens #enfermera #enfermeria
0 notes
Photo
Tumblr media
#Callforrgistration If you are interested to be a part of this Webinar as a speaker or delegate then register yourself today. Our CME/CPD/CE accredited 11th World Nursing, Healthcare Management, and Patient Safety Conference will be held on November 15-18, 2022 in San Francisco, USA. Final Registration deadline has been extended to 10th November.
Email us at [email protected] WhatsApp: https://wa.me/442033222718 Register here: https://nursing.universeconferences.com/registration/
#Nursing #NursingConference #UCGConferences #doctor #Globaliseeruminejatervis #GlobalisasyonatKalusugan #NakamamataynaEpektongCoronavirussaTao #naturopathicdoctor #doctorsoffice #medicaldoctor #futuredoctors #ninthdoctor #doctorwhocosplay  #researchpaper #researchers #biochemistry #medicalresearch #instascience #sciencecommunication #scicomm #phdchat #research #MaamaaArtificial #Kunstigintelligens
0 notes
Photo
Tumblr media
#Callforrgistration If you are interested to be a part of this Webinar as a speaker or delegate then register yourself today. Our CME/CPD/CE accredited 11th World Nursing, Healthcare Management, and Patient Safety Conference will be held on November 15-18, 2022 in San Francisco, USA. Registration deadline is extended to 27th October.
Register here: https://nursing.universeconferences.com/registration/
#Nursing #NursingConference #UCGConferences #doctor #Globaliseeruminejatervis #GlobalisasyonatKalusugan #NakamamataynaEpektongCoronavirussaTao #naturopathicdoctor #doctorsoffice #medicaldoctor #futuredoctors #ninthdoctor #doctorwhocosplay  #researchpaper #researchers #biochemistry #medicalresearch #instascience #sciencecommunication #scicomm #phdchat #research #MaamaaArtificial #Kunstigintelligens
0 notes
vicislifeinbinary · 4 years
Photo
Tumblr media
Nye brugergrænseflader/UI/UX 💡🤖🔎 Jeg er i gang med at undersøge hvad der rører sig inden for nye brugergrænseflader/user interfaces og experiences. Kender du nogle virksomheder/personer/cases der arbejder med innovative og nye måder at tænke brugergrænseflader på? Så kontakt mig endelig. Det kan både være konkrete services/produkter eller på et mere strategisk/teoretisk plan. Dette kan f.eks. være inden for: Gesture control, BCI (Brain-Computer-Interfaces)/Neural interfaces, Kropslige interfaces, Biometrics, AR & VR interfaces, Deepfakes, Tangible user interfaces, chatbots, samtaler og hologrammer, Fleksible interfaces, Emotion-sensing technology (EST), Teleoperation interfaces, Anti UI/Sikkerhed, Ambient intelligence, Nearables, Haptiske/kinæstetiske interfaces og mange andre.   På forhånd mange tak! Photo sources: www.enginess.io & www.interestingengineering.com . . . . . . . #dkstartup #legaltech #UI #UX #userinterface #userexperience #brugergrænseflader #digitalebrugergrænseflader #interfaces #futureuserinterfaces #futureinterface #virksomhed #tech #teknologi #DKtech #Danmark #Denmark #Danish #AI #kunstigintelligens #artificialintelligence #neuralinterface #BCI #gesturecontrol #AR #VR #biometrics #deepfakes #iværksætter #virtualreality (her: Copenhagen) https://www.instagram.com/p/CKehUTfhToa/?igshid=1unm64rf5gg6v
0 notes
Photo
Tumblr media
#Callforrgistration If you are interested to be a part of this Webinar as a speaker or delegate then register yourself today. Our CME/CPD/CE accredited 11th World Nursing, Healthcare Management, and Patient Safety Conference will be held November 15-17, 2022 in San Francisco, USA. Registration deadline is extended to 27th September.
Register here: https://nursing.universeconferences.com/registration/
#Nursing #NursingConference #UCGConferences #doctor #Globaliseeruminejatervis #GlobalisasyonatKalusugan #NakamamataynaEpektongCoronavirussaTao #naturopathicdoctor #doctorsoffice #medicaldoctor #futuredoctors #ninthdoctor #doctorwhocosplay  #researchpaper #researchers #biochemistry #medicalresearch #instascience #sciencecommunication #scicomm #phdchat #research #MaamaaArtificial #Kunstigintelligens
0 notes
arkivverketbeta · 4 years
Text
Arkivverket tester maskinlæring
Utrolig nok har det gått et år siden Arkivverket begynte sin store satsing på Maskinlæring. Tida har gått fort, men resultatene har kommet enda fortere. Hjemmekontor ingen hindring. Vi satser nå enda hardere for 2021, og styrker staben med ytterligere nyansettelser.
I dette innlegget fokuserer vi på forbedring av bildebehandling og resultater fra OCR og HTR – gjenkjenning av håndskrift.
De siste månedene har vi arbeidet mye med gammelt materiale – gammel håndskrift og gammel maskinskrift med tvilsom kvalitet. Felles for disse er at vi har en skannet versjon der vi må prøve å få ut en meningsfylt tekst. Håndskrift er den største utfordringen, men det som er skrevet på skrivemaskin før ca. 1980 (og rettetasten - - ) kan også være vanskelig (blåpapir, papirkvalitet, skitt - -).
Tolking av skannede dokumenter
Tolking av disse dokumenter kan deles i 3 trinn:
1: Klassifisere dokumenter på grunn av skjema eller dokument typer 2: Dele klassifisert dokumenter «intelligent» inn i bokser eller objekter,     med antagelse om hvilken informasjon som finnes hvor 3: Tolke skriften i disse boksene.
Det siste kan igjen deles i 2:
3A: Basere seg på å forstå «tegn for tegn». 3B: Basere seg på en tolkning av hele innholdet, basert på sannsynlige eller ofte forekommende varianter (typisk: koblet mot et sett av navn).
Begge deler krever en trent modell for å gi gode resultater. Som et eksempel kan vi se på et «hovedregisterkort» fra en folketelling.
Tumblr media
Her kan man i cellen «Etternavn» enten gjenkjenne tegnene G-u-l-b-r-a-n-d-s-e-n hver for seg, hjulpet av mønstre fra kjente navn, eller man kan gjenkjenne hele navnet «Gulbrandsen» ut fra en begrenset liste av navn. Eller aller helst – man kan kombinere to metoder og vekte resultatene for å oppnå enda bedre presisjon. Folkeregisteret
Vi har nå kommet ganske langt med tolking av disse folkeregisterkortene. Resultatet vil etter hvert bli en søkbar tjeneste på Digitalarkivet. (Her tillater vi oss å tipse om søk i folketellingen for 1920 - som nylig er sluppet på Digitalarkivet.)
Dette er et pågående arbeid som i 2021 vil gi resultater i form av nye søke-tjenester på Digitalarkivet.
Noen gamle registerkort byr på problemer – slik som dette:
Tumblr media
Fjerning av støy
Kortet over illustrerer at det i mange tilfeller er vanskelig å tolke selve layout-en i bildet, slik som over.
I tillegg vil vi ofte ha problemer med «støy» (linjer, flekker, skribling - - ). Og det vil ikke bare være et problem for håndskrift, det vil også ofte gjelde eldre maskinskrift.
I mange tilfeller kan vi kompensere støy i bildet med preprosessering – det vil si å forbehandle skannede bilder før de sendes til «tolking».
Her har vi hatt stor glede av programpakkene OpenCV for å forbedre bilder, og P2PaLa for layout analyse.. Hvis vi kan tydeliggjøre skriften ved blant annet å øke kontrast og fjerne støy vil tegn-tolkingen ofte bli mye bedre.
Her kan de spesielt interessert lese seg opp på metoder som
Contrast-limited adaptive histogram equalization
Non-local means denoising
Singular value decomposition
Image binarization
Det siste har med hell brukt i kombinasjon med OCR-programvaren Tesseract.
Som et eksempel kan man i det dynamiske bildet under se forandring fra et «råbilde» - via fjerning av støy og økt kontrast - til ferdig tolket tekst. Dokumentet er fra arkivet over norske flyktninger i Sverige under annen verdenskrig. Siden disse dokumentene fortsatt ikke er 100 år gamle må vi her sladde deler av innholdet.
Tumblr media
Om valg av «fri» programvare
All programvare vi har nevnt hittil er basert på fri bruk og åpen kildekode.  For å tolke innhold – spesielt i håndskrevet tekst – har vi imidlertid delvis brukt programpakken Transkribus. Foruten gjenkjenning av skrift er Transkribus ganske god på å identifisere «bokser» med innhold. I tillegg har den også et godt brukergrensesnitt for manuell trening og klassifikasjon. Mengder av korrekt tolket innhold gir gode maskinlærings-modeller.
Transkribus baserer seg på en lisens-modell. Men deler av programpakken kan etter hvert erstattes av fri programvare. Her har vi testet mye med programvaren PyLaia, og for enkelte dokumentkategorier oppnådd svært gode resultater. Analyse av alternativer vil fortsette neste år. ______________________________________________________________
Stor takk til våre kompetente medarbeidere Eivind og Javad som utvikler metoder og modeller, samtidig som de formidler kunnskap slik at selv de(n) som skriver denne spalten forstår. ______________________________________________________________
Avslutningsvis
Vi var i forrige innlegg innom Turingtesten, og ny programvare nærmer seg stadig «Bestått». Så til slutt tar vi med en liten dialog fra en av de mer intelligente datamaskiner vi har snakket med (fra https://aidungeon.io).
Siden vi nå tar juleferie, vil vi jo da gjerne vite hvilket forhold den kunstige intelligensen har til jula:
Tumblr media
______________________________________________________________ 
Så herved ønskes en god jul fra Team Maskinlæring i Arkivverket.
Tumblr media
Dersom du ønsker å ta kontakt utover bloggen, kan du også sende en epost til [email protected]. ____________________________________________________________
0 notes
arkivverketbeta · 4 years
Text
ARKIVVERKET TESTER MASKINLÆRING
Det er en stund siden vi oppdaterte oss på denne siden, men det jobbes jevnt og trutt. Hjemmekontor ingen hindring. Fokus har endret seg litt fra "grunnforsking" til hvordan vi kan få konkret nytteverdi. Det betyr både å effektivisere interne arbeidsprosesser og etter hvert øke kvalitet og brukervennlighet på Digitalarkivet. Vi har også laget en liten demo.
Før vi går videre til vår beskrivelse av vår demo har vi lyst til å nevne et nytt prosjekt:
Gammel grunnbok – og sladding av personnummer:
Tumblr media
(Klikk to ganger på bildet for å forstørre, Escape for å komme tilbake).
Av personverngrunner kan vi ikke vise personnummer når brukere vil ha innsyn i grunnboksblader. Alle forespørsler må derfor gjennom en manuell sladde-prosess hos Arkivverket før vi kan sende dokumentene til brukerne. Team ML (Maskinlæring) analyserer om det er mulig med automatisk identifikasjon og sladding av personnummer. Rutiner som utvikles her kan forhåpentligvis generaliseres og brukes til annen anonymisering eller fjerning av sensitive data. I tillegg vil vi kunne fremheve andre sentrale data, slik som gårds- og bruksnummer.
Men det vi har mest lyst til å snakke om er at vi har laget en liten demo.
Vi skrev sist om hvordan man kunne bruke et programmeringsgrensesnitt (API) inn mot modellene som er bygget via maskinlæring. Og vi nevnte NER/Named Entity Recognition ("Deteksjon av begreper"). Nå har vi kombinert disse og testet på 5 protokoller fra gamle regjeringsforhandlinger. I Digitalarkivet er de organisert slik:
Tumblr media
De kan nås direkte slik:
https://media.digitalarkivet.no/view/39780/1
https://media.digitalarkivet.no/view/39781/1
https://media.digitalarkivet.no/view/39782/1
https://media.digitalarkivet.no/view/39783/1
https://media.digitalarkivet.no/view/39784/1
- eller man kan gjøre et søk på kilde i Digitalarkivet:
Tumblr media
Underliggende sider kan også nås direkte, eksempelvis slik for side 8 i arkiv 3970 fra 1981: https://media.digitalarkivet.no/view/39780/8.
NB:
1: Man må ha bruker og være innlogget på Digitalarkivet - og 2: For å se hva vår relativt kunstige intelligens har funnet ut må man    først klikke på ikonet øverst til høyre
Tumblr media
for å aktivisere side-menyen (dersom den ikke allerede er aktiv), og deretter klikke på øyet i menyen:
Tumblr media
Da vil man for URLen over se dette i høyre ramme:
Tumblr media
I den grad vi kan knytte organisasjoner og institusjoner til et sted vil det komme opp et lite ikon -
Tumblr media
- som man kan klikke på og få opp plasseringen på kart, slik (https://media.digitalarkivet.no/view/39780/2): 
Tumblr media
Kartløsningen her bruker Open Street Map (https://www.openstreetmap.org/) bak kulissene.
Det vil ta en stund å kjøre hele Digitalarkivet gjennom disse analysene (flere måneder ren maskintid), men vi bygger på etter hvert i prioritert dokument-rekkefølge. Samtidig vil modellene bak kontinuerlig utvides og forbedres. I mellomtiden håper vi mange tester funksjonaliteten. Vi setter pris på alle tilbakemeldinger og forslag til forbedringer.
Arkitekturen bak tjenesten (eksterne kall via programgrensesnitt) er vist i vårt forrige innlegg.
Vi er helt klar over at det er en stund til våre rutiner består Turing testen (https://no.wikipedia.org/wiki/Turingtest), men det er nok heller ikke nødvendig for at brukere skal synes dette er nyttig.
Dersom du ønsker å ta kontakt utover bloggen, kan du også sende en epost til [email protected].
God sommer fra Arkivverket.
Tumblr media
0 notes