Du er her: Heim > Produkt > Norsk temasøk > Detaljomtale

Detaljomtale

Nynodata AS har utvikla eit system for temasøk på norsk, på tvers av dei to målformene bokmål og nynorsk. Det inkluderer parallellsøk (søk etter parallelle ord på den andre målforma), bøyingsformer og synonym. Synonym er ord med same eller liknande meining.

Problemet

Når ein søkjer på Internett eller intranett, er det for å finne informasjon om eit tema. Dette er ikkje alltid like lett. Ofte finn ein ikkje det ein leitar etter, og stundom får ein mange treff med lite relevant stoff.
Dei fleste søkjemotorane i dag er bygd opp rundt nøkkelord som blir indekserte. Orda blir henta frå ulike stader på heimesidene, som tittel, metatekst (skjult tekst med informasjon om dokumentet) og sjølve brødteksten. Når du tastar inn søkjeordet, får du tilbake ei liste over tekstar der ordet finst. Nokre motorar kan også finne tekstar med bøyingsformer av søkjeordet. Men prinsippet er det same, det er berre tekstar med søkjeordet som blir vist.
Derfor finn du ikkje tekstar som har brukt andre ord for det temaet du søkjer etter. Søkjer du etter høyskole og teksten bruker høgskole, finn du den ikkje. Du finn heller ikkje tekstar på nynorsk når du tastar inn eit reint bokmålsord, eller tekstar på bokmål når du søkjer med berre nynorskord.

Løysinga

Nynodata sitt søkjesystem omarbeider søkjeomgrepet på ulike måtar før det blir sendt inn til søkjemotoren. Vi utvidar søket med aktuelle tilleggsord, slik at det langt på veg blir eit norsk temasøk på tvers av målformene. Teknologien kan også inkludere andre språk. I versjon 1 har vi teke med dette:

  • Nære synonym. Dette er ord som praktisk talt er identiske, men på grunn av dei mange valfrie formene på norsk, kan dei skrivast ulikt. Eksempel er boksmålsordet høyskole, som gir synonymet høgskole. Nynorsk omsetting blir høgskole eller synonymet høgskule. Den samla konverteringa av søkjeordet høyskole blir slik i temasøket: høyskole OR høgskole OR høgskule. Eit eksempel til: Ordet ansikt har både på bokmål og nynorsk synonymet andlet. Søkjer vi etter ansikt, blir dette konvertert til ansikt OR andlet.
  • Generelle synonym. Dette er ord som i visse samanhengar har same tematiske innhald som søkjeordet, men som ikkje alltid tyder det same. Dersom søk etter tematisk innhald er det viktigaste, kan desse tilleggsorda styrkje treffmengda vesentleg. Vi har likevel valt å ikkje inkludere generelle synonym i basisfunksjonane, fordi det fort gir ei overgenerering som inkluderer irrelevante tekstar. Generelle synonym kjem derfor opp når resultatet blir vist, som tips til eventuelt å omarbeide søket.
  • Omsetting. Vi har med omsetting mellom bokmål og nynorsk, begge vegar. Dersom du skriv inn ikkespredningsavtale, blir dette omsett til ikkjespreiingsavtale. Det komplette søkjeomgrepet blir ikkespredningsavtale OR ikkjespreiingsavtale. I resultatet kjem det opp dokument der anten bokmålsforma eller nynorskforma finst.
  • Bøying. Valfridommen i skrivemåte på bokmål og nynorsk gjeld ikkje berre ord, men også bøying. Dersom vi søkjer etter ordet arbeidsboken, vil mange søkjemotorar ikkje finne dokument med forma arbeidsboka, eller motsett. Vårt temasøk finn fram til alternative bøyingsformer og inkluderer dei i søket. Alle bøyingsformer av eit ord er i prinsippet tilgjengeleg, men i basisversjonen er dei mest relevante valt ut som ei avgrensing.