Publikumssøket i bakleksa – men kor lenge? – Biblioteket tar saka #librarycase

dont give up — *Søk og finn. Don’t give up*

Vi ser at Nasjonalbiblioteket skal arrangere seminar 3. april med tittelen «Hei Siri. Kan du finne ei god bok til meg? Om søking i framtida». Vi skal altså snart kunne snakke til webkatalogen og få gode svar?

Men så tenkjer vi, ikkje som ekspert av noko slag, men som livslang brukar av bibliotekkatalogar, at ein god del må vel på plass innan vi kjem dit? For òg når det gjeld god, gamal skriftleg dialog ligg biblioteket langt etter Google, Amazon og andre søkemotorar og nettbutikkar. Stadig fleire av dei foreslår meir sannsynlege alternativ når vi har tenkt for vidt eller for smalt (for andre har søkt etter det same, og Google & co hugsar det for oss), og dei rettar typiske stavefeil mens vi skriv.

Eller: Får vi på konferansen i april høyre at vi ved hjelp av kunstig intelligens snart kan hoppe over slike utviklingssteg?

Kjære svenskspråklege lesarar: Kunstig intelligens = Artificiell intelligens (AI). Om ein norsking skriv «kunstig intelligens» på ein svensk maskin vil resultatet kunne bli ganske «konstig», for å seie det slik. Om ikkje, må maskina vere verkeleg intelligent!

Bibliotekarstanden syntest det var eit stort sprang framover då webkatalogane, pluss no også Oria.no og Bokhylla.no, fekk seg «google-søk», altså enkle rektangel som innbyr til å skrive og søkje i naturleg språk. Men så blir ikkje trefflistene heilt som du er van med frå Google.

Vi har lese og tenkt rundt dette ei tid, men påskottet vårt til å blogge om det no kom i form av eit nyheitsbrev frå …… DBC, den danske offentleg eigde verksemda som sidan bibliotekautomatiseringas morgon har hatt hand om alle «rikstenestene» i dronningriket der sør, frå bibliografiske data, via nasjonalbiografien, til bibliotek.dk.

Den store nyheita deira er at «Materialetype kan søges som fritekst». Dei skriv: «Det er blevet muligt at skrive ’bog’ i fritekst-søgefeltet og rent faktisk få alle bogposter frem, hvor man tidligere kun ville have fået de resultater, hvor ’bog’ optrådte i materialets titel, i en note eller lignende.»

Vi gjorde eit søk i bibliotek.dk på vikinger + dvd. Vi fekk 145 treff på det vi spurde om pluss 9 treff i andre medium, noko som kan oppfattast som støy – eller relevant tilleggsinformasjon. I alle fall ein presisjon på minst 94 prosent.

Norske bibliotek

Same søket i Oria.no, felleskatalogen for fag- og forskingsbibliotek, ser ikkje så verst ut, men vi finn «dvd» og «video» om kvarandre som materialtype. Oria er basert på Ex Libris’ Primo og dokumentasjonen deira stadfester at dei har noko liknande som i Danmark.

Biblioteksøk, som også omfattar folkebiblioteka, gjev også relativt bra resultat, rett nok får vi 62 treff for søkesettet «vikinger dvd», men seks færre for «vikinger» avgrensa til materialtypen dvd.

Men kva med det lokale norske folkebiblioteket?

Om det mykje omtalte nye biblioteksystemet Quria, som Drammensbiblioteket var tidleg ute med, finn vi lite dokumentasjon, men vi høyrer at dei blant anna skal ha eit fuzzy-søk. Det same viking-søket der gjev 6 treff, men når vi søkjer på «vikinger» og avgrensar på medietype = dvd, får vi 18 treff. Altså ein «presisjon» på berre 33 prosent.

Hos Bibliofil-biblioteket i «vikingdistriktet» Larvik fekk vi 8 treff med «fritekstsøket» og det same då vi avgrensa til medietype «film».

Deichman gjev berre 1 treff på «vikinger dvd», men 14 ved avgrensing til medietype «dvd». Under KORG-dagane i haust gav Asgeir Rekkavik inntrykk av at dei jobbar intenst med fleire sider av katalogen og brukardialogen, men akkurat denne biten er kanskje ikkje på prioriteringstoppen no?

Kva manglar i bibliotekas publikumssøk?

Dette fritekstsøket på medietype er berre ein liten bit av kva vi burde kunne krevje av eit biblioteksystem og ein OPAC når vi snart skriv 2020.

Ein analyse av biblioteka sine søkedialogar som set spørsmålet på spissen er Gerd Berget si doktoravhandling frå 2016, med ein norskspråkleg kortversjon i tidsskriftet Bibliotekaren: «Søkesystem på parti med dyslektikere?».

Ho listar opp funksjonar som «bør inkluderes for at bibliotekenes søkesystemer skal være tilgjengelige for brukere med dysleksi». Men desse er òg viktige for dei fleste, og dei er, som sagt, noko folk er blitt vane med på kommersielle nettstader:

«Tilbakemelding om hvilken del av søkestrengen det ikke er match for i basen (for eksempel «Ingen treff på termen Unseth»)
Foreslå termer når ord er stavet feil («Mente du Undset?»)
Synonymkontroll (slik får brukerne mulighet til å unngå ord som er vanskelige
å stave)
Foreslå termer mens brukerne skriver (autofullfør)
Høy toleranse for skrivefeil, inkludert et system for tolking av skrivefeil som typisk gjøres av dyslektikere.»

Våre eigne algoritmar

«Human Operators» heiter ei fersk bok frå Library Juice Press i California. Undertittelen er «A Critical Oral History on Technology in Libraries and Archives.» Dette er ei uvanleg og verkeleg spennande bok, for her blir mange sentrale bibliotekfolk med IT-bakgrunn intervjua og så redigerte saman til virtuelle samtalar om ulike emne, blant anna katalogoppbygging, søking og attfinning, som vi er opptatte av her, men også om e-bøker og kommunikasjon og kva er eigentleg favorittprogrammet ditt?

Og heller ikkje i USA er dei nøgde med katalogane. Èin meiner den «automatiserte» katalogen er «absolutely miraculous» samanlikna med kortkatalogane, mens andre er mykje meir skeptiske.

Til dømes Becky Yoose, sjef for «applications and systems» ved Seattle Public Library:

«Eg kjenner mange som ikkje liker bibliotekkatalogen, og dei har nokre gode poeng. Bibliotekkatalogane er ganske enkle. Dei gjev ikkje spesielt gode søk, avhengig av system. Men dei er alt vi har» (våre eigne omsettingar her og nedanfor).

Bess Sadler har ei mangfaldig karriere med blant anna utvikling av integrerte «discovery-portalar», men jobbar no med digitalisering. Det viktigaste for henne er at biblioteka må få kontroll over deira eigne algoritmar: «When we talk about a search algoritm, we’re asking the question what is significant and what is relevant? … Putting the ability to ask those questions as close as possible into the hands of the user – it’s still mediated, I get that, but it’s a lot better than having a single answer that was provided to you by a commercial vendor».

Alison Macrina er kjent for lesarar av denne bloggen. Vi kåra henne blant anna til ein av dei (førebels) fjorten Barske bibliotekarane. Ho opnar med at «Library technology is such a shitshow.» Biblioteka må «ta eit oppgjer med desse forferdelege programma som ingen likar og ingen kan bruke». Ho ønsker ei heilt anna og kritisk innstilling til dei som utviklar og sel desse systema. Ho snakkar om at biblotekarane har eit mindreverdskompleks og at dei går for mykje på tå for leverandørane. Kvifor? Fordi biblioteka er ikkje blant dei pengesterke kundane.

Ho peiker også på korleis dei kommersielle leverandørane poppar opp og ned og blir oppkjøpte, til det i dag berre er tre (i USA) i tillegg til dei med Open Source. Så konkurransen blir dårleg. Og har vi garanti for at vi i all framtid vil få nøytrale treff når innhaldsleverandøren ProQuest har kjøpt opp systemleverandøren Ex Libris?

Michael Gorman, ein verkeleg veteran innan kunnskapsorganisering på global basis, er også ein gjengangar her på bloggen. Han var pådrivar for UBC – Universal Bibliographic Control – heilt sidan 1970-talet, men meiner dette idealet blei øydelagt av «the search engine dynamic». Som eit resultat av dette meiner han at til dømes katalogen til British Library i dag er «virtually as useless as a vast card catalog.»

Han finn tre grunnar til dette: For det første at bibliotekleiingane, som Oscar Wilde seier, «knows the price of everything and the value of nothing». Så la dei ned katalogavdelingane. For det andre at folka i dei nye IT-avdelingane ikkje kan anna om informasjonsattfinning enn det dei kan gjere i søkemotorar. Og for det tredje at publikum er blitt så «Googlized» at det einaste dei krev av noko som helst datasøk er ein haug med ymse referansar som dei kan prøve å sortere ut.

Vi kunne ha halde på med dette, men les heller boka, som tar føre seg det meste innan bibliotek-IT . Ho finst dessverre enno ikkje ved noko norsk bibliotek.

PS: Vi veit vi ikkje nok om dei aktuelle systema her i landet til å kunne påstå at stoda er like dårleg her. Men kommentarfeltet er ope for diskusjon.

Oppdag mer fra Biblioteket tar saka #librarycase

Abonner for å få de siste innleggene sendt til din e-post.

8 kommentarer om “Publikumssøket i bakleksa – men kor lenge?”

Anonym sier:

mars 27, 2019, kl. 10:00 am

Veldig fine observasjoner om verdens bibliotek-kataloger. Nå er det kommet en Master-oppgave om studenters bruk av Oria , her: https://oda-hioa.archive.knowledgearc.net/handle/10642/6723 . Hun kommer inn på svakheter i Discovery-systemet Oria. Likevel ser vi at Oria er ganske god på å finne den eksakte pensumlitteraturen. Systemet klarer fint å låne ut, kreve frister overholdt, virker mot ut-enheter, som ulike ting vi kobler til. Men etter min mening er systemet for komplekst, og det kan kollapse på sikt … (av ein eller annan grunn er denne blitt anonym, men Kristin Røijen har meldt at det var ho som skreiv. AE)

Svar
1. Anders Ericson sier:
  
  mars 27, 2019, kl. 10:04 am
  
  Alle vi som ikkje veit så mykje om denne kompleksiteten vil gjerne vite meir om dette. Kan du gå meir inn i det? Eller finst det litteratur?
  
  Svar
Kristin Røijen sier:

mars 27, 2019, kl. 10:35 am

Da BIBSYS ble anklaget for å være for komplekst, kan jeg si at programvaren der var bygd på objektorientert programmering. Det betyr at du har en kjerne av data, som trekkes med over i de ulike modulene til systemet. Der utføres prosesser, med mer. Det endret seg lite for hver prosess, brukte bare «blå bakgrunn». Dermed gikk det lynraskt.

Det store Primo (Alma) har en mer hemmelig programmering, der folka som lager det, sitter i Israel. Vi kan bare ønske oss noen endringer, men for å få utført dem, må vi stemme på dem. Det er deres kontakt med brukerne – altså bibliotekarene. Det jeg har sett av alle de rollene, leverandørlistene og andre ting Alma har, får meg til å tro et dette mer er som et vanlig lagersystem. Slike ligger i Microsoft Office, og Excel kan brukes til å lage tabeller. Systemet bruker pekere mellom tabeller, det er egentlig algoritmer. Mange flere algoritmer må brukes for å lage kall, som besvarer et spørsmål. Der trengs det mer programmering på toppen for å få til alle prosessene på de lange listene. Primo er mer komplekst enn Excel, selvfølgelig. Det vi brukere ser, er resultatet av våre spørsmål inn til systemet.

Dette er veldig enkel forklaring på noe som skjer overalt på nettet – ingenting av det vi ser er uten programmering..

Svar
Tilbaketråkk: Nye og gamle nål-i-høystakken-metodar | Biblioteket tar saka #librarycase
Tilbaketråkk: Danske bibliotek har skjønt det med Nettet | Biblioteket tar saka #librarycase
Tilbaketråkk: Biblioteket mest populært? | Biblioteket tar saka #librarycase
Tilbaketråkk: Korona-omstillinga for biblioteka vil KOSTE, herr kulturminister! | Biblioteket tar saka #librarycase
Tilbaketråkk: Er dette gullalderen for norske bibliotek? | Biblioteket tar saka #librarycase

	Anonym til «Nasjonalbiblioteket er…
	«Nasjonalbibli… til KI – skremmande bra! På…
	Anonym til Fred i biblioteket?
	Fred i biblioteket?… til Thomas Gramstad om den laust f…
	Les – og høyr… til Litteraturpolitikk utan sans f…

Publikumssøket i bakleksa – men kor lenge?

Oppdag mer fra Biblioteket tar saka #librarycase

Publisert av Anders Ericson

8 kommentarer om “Publikumssøket i bakleksa – men kor lenge?”

Legg igjen et svar til Anonym Avbryt svar

Oppdag mer fra Biblioteket tar saka #librarycase

Del dette med flere:

Publisert av Anders Ericson

8 kommentarer om “Publikumssøket i bakleksa – men kor lenge?”

Legg igjen et svar til Anonym Avbryt svar