Publikumssøket i bakleksa – men kor lenge?

dont give up

Søk og finn. Don’t give up

Vi ser at Nasjonalbiblioteket skal arrangere seminar 3. april med tittelen «Hei Siri. Kan du finne ei god bok til meg? Om søking i framtida». Vi skal altså snart kunne snakke til webkatalogen og få gode svar?

Men så tenkjer vi, ikkje som ekspert av noko slag, men som livslang brukar av bibliotekkatalogar, at ein god del må vel på plass innan vi kjem dit? For òg når det gjeld god, gamal skriftleg dialog ligg biblioteket langt etter Google, Amazon og andre søkemotorar og nettbutikkar. Stadig fleire av dei foreslår meir sannsynlege alternativ når vi har tenkt for vidt eller for smalt (for andre har søkt etter det same, og Google & co hugsar det for oss), og dei rettar typiske stavefeil mens vi skriv.

Eller: Får vi på konferansen i april høyre at vi ved hjelp av kunstig intelligens snart kan hoppe over slike utviklingssteg?

Kjære svenskspråklege lesarar: Kunstig intelligens = Artificiell intelligens (AI). Om ein norsking skriv «kunstig intelligens» på ein svensk maskin vil resultatet kunne bli ganske «konstig», for å seie det slik. Om ikkje, må maskina vere verkeleg intelligent!

Bibliotekarstanden syntest det var eit stort sprang framover då webkatalogane, pluss no også Oria.no og Bokhylla.no, fekk seg «google-søk», altså enkle rektangel som innbyr til å skrive og søkje i naturleg språk. Men så blir ikkje trefflistene heilt som du er van med frå Google.

Vi har lese og tenkt rundt dette ei tid, men påskottet vårt til å blogge om det no kom i form av eit nyheitsbrev frå …… DBC, den danske offentleg eigde verksemda som sidan bibliotekautomatiseringas morgon har hatt hand om alle «rikstenestene» i dronningriket der sør, frå bibliografiske data, via nasjonalbiografien, til bibliotek.dk.

Den store nyheita deira er at «Materialetype kan søges som fritekst». Dei skriv: «Det er blevet muligt at skrive ’bog’ i fritekst-søgefeltet og rent faktisk få alle bogposter frem, hvor man tidligere kun ville have fået de resultater, hvor ’bog’ optrådte i materialets titel, i en note eller lignende.»

Vi gjorde eit søk i bibliotek.dk på vikinger + dvd. Vi fekk 145 treff på det vi spurde om pluss 9 treff i andre medium, noko som kan oppfattast som støy – eller relevant tilleggsinformasjon. I alle fall ein presisjon på minst 94 prosent.

Norske bibliotek

Same søket i Oria.no, felleskatalogen for fag- og forskingsbibliotek, ser ikkje så verst ut, men vi finn «dvd» og «video» om kvarandre som materialtype. Oria er basert på Ex Libris’ Primo og dokumentasjonen deira stadfester at dei har noko liknande som i Danmark.

Biblioteksøk, som også omfattar folkebiblioteka, gjev også relativt bra resultat, rett nok får vi 62 treff for søkesettet «vikinger dvd», men seks færre for «vikinger» avgrensa til materialtypen dvd.

Men kva med det lokale norske folkebiblioteket?

Om det mykje omtalte nye biblioteksystemet Quria, som Drammensbiblioteket var tidleg ute med, finn vi lite dokumentasjon, men vi høyrer at dei blant anna skal ha eit fuzzy-søk. Det same viking-søket der gjev 6 treff, men når vi søkjer på «vikinger» og avgrensar på medietype = dvd, får vi 18 treff. Altså ein «presisjon» på berre 33 prosent.

Hos Bibliofil-biblioteket i «vikingdistriktet» Larvik fekk vi 8 treff med «fritekstsøket» og det same då vi avgrensa til medietype «film».

Deichman gjev berre 1 treff på «vikinger dvd», men 14 ved avgrensing til medietype «dvd». Under KORG-dagane i haust gav Asgeir Rekkavik inntrykk av at dei jobbar intenst med fleire sider av katalogen og brukardialogen, men akkurat denne biten er kanskje ikkje på prioriteringstoppen no?

Kva manglar i bibliotekas publikumssøk?

Dette fritekstsøket på medietype er berre ein liten bit av kva vi burde kunne krevje av eit biblioteksystem og ein OPAC når vi snart skriv 2020.

Ein analyse av biblioteka sine søkedialogar som set spørsmålet på spissen er Gerd Berget si doktoravhandling frå 2016, med ein norskspråkleg kortversjon i tidsskriftet Bibliotekaren: «Søkesystem på parti med dyslektikere?».

Ho listar opp funksjonar som «bør inkluderes for at bibliotekenes søkesystemer skal være tilgjengelige for brukere med dysleksi». Men desse er òg viktige for dei fleste, og dei er, som sagt, noko folk er blitt vane med på kommersielle nettstader:

  • «Tilbakemelding om hvilken del av søkestrengen det ikke er match for i basen (for eksempel «Ingen treff på termen Unseth»)
  • Foreslå termer når ord er stavet feil («Mente du Undset?»)
  • Synonymkontroll (slik får brukerne mulighet til å unngå ord som er vanskelige
    å stave)
  • Foreslå termer mens brukerne skriver (autofullfør)
  • Høy toleranse for skrivefeil, inkludert et system for tolking av skrivefeil som typisk gjøres av dyslektikere.»

Våre eigne algoritmar

A-Critical-Oral-History-on-Technology-in-Libraries-and-Archives«Human Operators» heiter ei fersk bok frå Library Juice Press i California. Undertittelen er «A Critical Oral History on Technology in Libraries and Archives.» Dette er ei uvanleg og verkeleg spennande bok, for her blir mange sentrale bibliotekfolk med IT-bakgrunn intervjua og så redigerte saman til virtuelle samtalar om ulike emne, blant anna katalogoppbygging, søking og attfinning, som vi er opptatte av her, men også om e-bøker og kommunikasjon og kva er eigentleg favorittprogrammet ditt?

Og heller ikkje i USA er dei nøgde med katalogane. Èin meiner den «automatiserte» katalogen er «absolutely miraculous» samanlikna med kortkatalogane, mens andre er mykje meir skeptiske.

Til dømes Becky Yoose, sjef for «applications and systems» ved Seattle Public Library:

«Eg kjenner mange som ikkje liker bibliotekkatalogen, og dei har nokre gode poeng. Bibliotekkatalogane er ganske enkle. Dei gjev ikkje spesielt gode søk, avhengig av system. Men dei er alt vi har» (våre eigne omsettingar her og nedanfor).

Bess Sadler har ei mangfaldig karriere med blant anna utvikling av integrerte «discovery-portalar», men jobbar no med digitalisering. Det viktigaste for henne er at biblioteka må få kontroll over deira eigne algoritmar: «When we talk about a search algoritm, we’re asking the question what is significant and what is relevant? … Putting the ability to ask those questions as close as possible into the hands of the user – it’s still mediated, I get that, but it’s a lot better than having a single answer that was provided to you by a commercial vendor».

Alison Macrina er kjent for lesarar av denne bloggen. Vi kåra henne blant anna til ein av dei (førebels) fjorten Barske bibliotekarane. Ho opnar med at «Library technology is such a shitshow.» Biblioteka må «ta eit oppgjer med desse forferdelege programma som ingen likar og ingen kan bruke». Ho ønsker ei heilt anna og kritisk innstilling til dei som utviklar og sel desse systema. Ho snakkar om at biblotekarane har eit mindreverdskompleks og at dei går for mykje på tå for leverandørane. Kvifor? Fordi biblioteka er ikkje blant dei pengesterke kundane.

floppy

Floppy. Kjelde: Stockio.com

Noko Jaime Taylor seier seg heilt einig i. Ho er systemansvarleg ved Centre for Jewish History i New York og aktiv i gruppa Radical Reference. Ho nemner som eit symbol for galskapen at når ein skal lagre noko i systemet deira må ein klikke eit ikon som viser ein floppy disc frå 1980-90-talet.

Ho peiker også på korleis dei kommersielle leverandørane poppar opp og ned og blir oppkjøpte, til det i dag berre er tre (i USA) i tillegg til dei med Open Source. Så konkurransen blir dårleg. Og har vi garanti for at vi i all framtid vil få nøytrale treff når innhaldsleverandøren ProQuest har kjøpt opp systemleverandøren Ex Libris?

Michael Gorman, ein verkeleg veteran innan kunnskapsorganisering på global basis, er også ein gjengangar her på bloggen. Han var pådrivar for UBC – Universal Bibliographic Control – heilt sidan 1970-talet, men meiner dette idealet blei øydelagt av «the search engine dynamic». Som eit resultat av dette meiner han at til dømes katalogen til British Library i dag er «virtually as useless as a vast card catalog.»

Han finn tre grunnar til dette: For det første at bibliotekleiingane, som Oscar Wilde seier, «knows the price of everything and the value of nothing». Så la dei ned katalogavdelingane. For det andre at folka i dei nye IT-avdelingane ikkje kan anna om informasjonsattfinning enn det dei kan gjere i søkemotorar. Og for det tredje at publikum er blitt så «Googlized» at det einaste dei krev av noko som helst datasøk er ein haug med ymse referansar som dei kan prøve å sortere ut.

Vi kunne ha halde på med dette, men les heller boka, som tar føre seg det meste innan bibliotek-IT . Ho finst dessverre enno ikkje ved noko norsk bibliotek.

PS: Vi veit vi ikkje nok om dei aktuelle systema her i landet til å kunne påstå at stoda er like dårleg her. Men kommentarfeltet er ope for diskusjon.

8 Responses to “Publikumssøket i bakleksa – men kor lenge?”

  1. Veldig fine observasjoner om verdens bibliotek-kataloger. Nå er det kommet en Master-oppgave om studenters bruk av Oria , her: https://oda-hioa.archive.knowledgearc.net/handle/10642/6723 . Hun kommer inn på svakheter i Discovery-systemet Oria. Likevel ser vi at Oria er ganske god på å finne den eksakte pensumlitteraturen. Systemet klarer fint å låne ut, kreve frister overholdt, virker mot ut-enheter, som ulike ting vi kobler til. Men etter min mening er systemet for komplekst, og det kan kollapse på sikt … (av ein eller annan grunn er denne blitt anonym, men Kristin Røijen har meldt at det var ho som skreiv. AE)

  2. Da BIBSYS ble anklaget for å være for komplekst, kan jeg si at programvaren der var bygd på objektorientert programmering. Det betyr at du har en kjerne av data, som trekkes med over i de ulike modulene til systemet. Der utføres prosesser, med mer. Det endret seg lite for hver prosess, brukte bare «blå bakgrunn». Dermed gikk det lynraskt.

    Det store Primo (Alma) har en mer hemmelig programmering, der folka som lager det, sitter i Israel. Vi kan bare ønske oss noen endringer, men for å få utført dem, må vi stemme på dem. Det er deres kontakt med brukerne – altså bibliotekarene. Det jeg har sett av alle de rollene, leverandørlistene og andre ting Alma har, får meg til å tro et dette mer er som et vanlig lagersystem. Slike ligger i Microsoft Office, og Excel kan brukes til å lage tabeller. Systemet bruker pekere mellom tabeller, det er egentlig algoritmer. Mange flere algoritmer må brukes for å lage kall, som besvarer et spørsmål. Der trengs det mer programmering på toppen for å få til alle prosessene på de lange listene. Primo er mer komplekst enn Excel, selvfølgelig. Det vi brukere ser, er resultatet av våre spørsmål inn til systemet.

    Dette er veldig enkel forklaring på noe som skjer overalt på nettet – ingenting av det vi ser er uten programmering..

Trackbacks

Leave a reply to Anonym Avbryt svar