Forstå beregning av Originalitetsindekset

  • Oppdatert

Originalitetsindekset reflekterer nivået av bekymringer knyttet til originalitet identifisert i et dokument. Det fremhever i hvilken grad innhold kan kreve ytterligere gjennomgang ved å presentere resultater enten som en prosentandel eller en risikoklassifisering, som Lav, Middels eller Høy. Denne tilnærmingen gjør det mulig for lærere å raskt og tydelig vurdere originalitetsstatusen til en innlevering.

Denne artikkelen skisserer hvordan Originalitetsindekset beregnes for kontrollerte innleveringer, og gir en tydelig forklaring på formålet med og tolkningen av resultatene. Dette bidrar til å forstå hvordan originalitet vurderes og hvordan resultatene støtter effektiv gjennomgang og beslutningstaking.

Hvordan blir setninger flagget for likhet?

Inspera Originality undersøker følgende komponenter når dokumenttekst vurderes for potensiell likhet med samsvarende kilder:

  • Tekstlikhet – Undersøker setningsoppbygging og formulering for å vurdere graden av likhet med en setning i en ekstern kilde.
  • Kontekstuell likhet – Analyserer en setning i dokumentet for å vurdere graden av likhet i overordnet betydning og idé med en setning i en samsvarende kilde. Dette inkluderer identifisering av bruk av synonymer og parafrasering, noe som sikrer bredere dekning når den opprinnelige meningen er bevart til tross for endringer i hvordan den uttrykkes.
  • Ord-nærhet – Analyserer setninger for å avgjøre gjennomsnittlig nærhet mellom lignende ord i setningen fra dokumentet og en setning i en ekstern kilde.

Tilnærmingen går lenger enn grunnleggende tekstanalyse for å identifisere den underliggende meningen og konteksten i innholdet.

I tillegg til elementene skissert ovenfor:

  • Inspera Originality bruker også avanserte lemmatiseringsteknikker for å sikre nøyaktig identifisering av grunnformene til ord. Dette er avgjørende for presis og meningsfull språkanalyse.
  • Inspera Originality utfører uklarhetsanalyse (fuzziness analysis) for å evaluere graden av tvetydighet og klarhet i teksten. Dette bidrar til å vurdere presisjonen i språket som er brukt og støtter en mer nyansert forståelse av innholdet.

Forståelse av beregningslogikken

Originalitetsindekset beregnes basert på antall setninger som er fremhevet i Originalitetsrapporten.

For å illustrere, se for deg et dokument bestående av 10 setninger, der hver setning i beregningen av Originalitetsindekset er vektet likt med 10 %. Setningsvekten refererer til påvirkningen en setning har på Originalitetsindekset, som bestemmes av setningens tildelte:

  • Likhetsprosent
  • Kontekstuell likhetsprosent
  • Ord-nærhet
  • Mulig inkludering av manipulasjoner
  • Overordnet klassifisering (Eksakt treff, Mulig endret tekst, Kontekstuell likhet).

For eksempel, i et dokument bestående av 10 setninger, representerer hver setning 10 % av det totale Originalitetsindekset. Hvis en setning blir flagget eller fremhevet på grunn av problemer identifisert under originalitetskontrollen, bidrar den med sin fulle vekt (10 %) til dokumentets totale poengsum. Når en setning flagges for flere problemer, blir den talt bare én gang og øker ikke sitt bidrag.

Visse elementer er ekskludert fra beregningen av Originalitetsindekset. Disse inkluderer ikke-tekstlig innhold, som bilder brukt i stedet for tekst, samt resultater avledet fra metadataanalysen.

 Logikken bak beregning av Originalitetsindekset
Logikken bak beregning av Originalitetsindekset

Oppsummert beregnes Originalitetsindekset ved å vurdere antall flaggede setninger, der den proporsjonale vekten av hver flaggede setning utgjør det totale Originalitetsindekset tildelt et innsendt dokument.

Elementer som påvirker beregningen av Originalitetsindekset

  1. Konfigurasjon av terskelverdier

    Som standard bruker Inspera Originality forhåndsdefinerte prosentvise terskelverdier for å klassifisere et dokuments originalitetsskår inn i ett av tre risikonivåer: Lav, Middels eller Høy.

    • 0–20 % Dokument klassifisert som Lav risiko
    • 20–80 % Dokument klassifisert som Middels risiko
    • 80–100 % Dokument klassifisert som Høy risiko

    Disse standardtersklene gir et standardisert og godt testet rammeverk.

    Administratorer har imidlertid fleksibilitet til å overstyre disse innstillingene og definere egendefinerte terskelverdier innenfor institusjonens konfigurasjon for å samsvare bedre med spesifikke behov og praksis for originalitetsvurdering.

  2. Konfigurasjon av terskelverdier på setningsnivå

    I tillegg til å konfigurere terskelverdier for dokumentklassifisering, tilbyr Inspera Originality også terskelkonfigurasjon på setningsnivå. Disse tersklene avgjør om enkeltsetninger flagges som eksakte treff, mulig endret tekst, eller kontekstuell likhet.

  3. Likhetsflagg for originalspråk

    Setninger flagget for likhet i originalspråk bidrar til det tildelte Originalitetsindekset for et innsendt dokument. En flagget setning kan klassifiseres som Eksakt treff, Mulig endret tekst, eller Kontekstuell likhet. En setnings bidrag til Originalitetsindekset varierer basert på nivået av detektert likhet og klassifiseringen den er tildelt.

    I motsetning til dette vil ekskluderingshandlinger knyttet til likhet i originalspråk også påvirke det tildelte Originalitetsindekset.

    • Å ekskludere en samsvarende kilde i Sammendragsvisning for likhet i originalspråk vil påvirke det tildelte Originalitetsindekset.
    • Å ekskludere en samsvarende kilde i Detaljert visning for likhet i originalspråk vil påvirke det tildelte Originalitetsindekset.
    • Å ekskludere en samsvarende setning flagget for likhet i originalspråk vil påvirke det tildelte Originalitetsindekset.

    Prosentandelen som avgjør om en flagget setning klassifiseres som Eksakt treff, Mulig endret tekst eller Kontekstuell likhet, avhenger av konfigurasjonen satt av administrator på institusjonsnivå.

  4. Likhetsflagg for oversatt språk

    Setninger flagget for likhet i oversatt språk bidrar til det tildelte Originalitetsindekset for et innsendt dokument. En flagget setning kan klassifiseres som Eksakt treff, Mulig endret tekst, eller Kontekstuell likhet. En setnings bidrag til Originalitetsindekset varierer basert på nivået av detektert likhet og klassifiseringen den er tildelt.

    I motsetning til dette vil ekskluderingshandlinger knyttet til likhet i oversatt språk også påvirke det tildelte Originalitetsindekset.

    • Å ekskludere en samsvarende kilde i Sammendragsvisning for likhet i oversatt språk vil påvirke det tildelte Originalitetsindekset.
    • Å ekskludere en samsvarende kilde i Detaljert visning for noen av språkene inkludert i likhet i oversatt språk vil påvirke det tildelte Originalitetsindekset.
    • Å ekskludere en samsvarende setning flagget for noen av språkene inkludert i likhet i oversatt språk vil påvirke det tildelte Originalitetsindekset.

    Prosentandelen som avgjør om en flagget setning klassifiseres som Eksakt treff, Mulig endret tekst eller Kontekstuell likhet, avhenger av konfigurasjonen satt av administrator på institusjonsnivå.

  5. Flagg for AI-prediksjon

    Det er viktig å merke seg at funksjonen for AI-prediksjon i Inspera Originality også bidrar til Originalitetsindekset tildelt et innsendt dokument.

    Setninger flagget av AI-prediksjon kan ikke ekskluderes. Dette betyr at påvirkningen fra AI-prediksjon forblir statisk. Originalitetsindekset kan variere avhengig av omfanget av AI-prediksjon som oppdages.

  6. Manipulasjonsflagg

    I tillegg til likhetsflagg for originalt og oversatt språk, kan setninger også flagges for manipulasjoner, nærmere bestemt karakterbytte og skjult tekst. Slike manipulasjoner påvirker også den tildelte originaliteten. Tilsvarende vil ekskludering av manipulasjoner også påvirke dokumentets Originalitetsindeks.

FAQ

  1. Når en setning flagges som Mulig endret tekst, indikerer det at setningen sannsynligvis ble parafrasert, men fortsatt viser likhet i overordnet formulering og struktur sammenlignet med setningen den ble matchet mot.

    I motsetning betyr Kontekstuell likhet at setningen deler en lignende overordnet betydning eller idé med den matchede setningen, selv om formulering og struktur er forskjellig.

  2. I motsetning til Originalitetsrapporten, viser Offline-rapporten alle likhetstreff, inkludert de som utgjør en svært liten prosentandel av likhet (f.eks. 0,97 %). Disse samsvarende kildene er tilgjengelige i Originalitetsrapporten kun under en filtrert visning. Som et resultat kan det i noen tilfeller virke som om Offline-rapporten inneholder flere samsvarende kilder enn selve Originalitetsrapporten.

    Dette kan imidlertid avhjelpes ved å bruke funksjonen for Kriterier for ekskludert kilde på oppgavenivå. Dette lar lærere definere en prosentvis terskel som ekskluderer samsvarende kilder under en spesifisert likhetsprosent fra beregningen fullstendig.

  3. Slike variasjoner i originalitetsskår forekommer ikke ofte og er forårsaket av mindre forskjeller som oppstår under analyseprosessen. For eksempel, hvis det samme dokumentet sendes inn flere ganger, kan analysatoren av og til identifisere én ekstra kilde i ett tilfelle og én kilde mindre i et annet.

    I tillegg blir kortere setninger eller setninger med mindre relevans ikke tatt med i betraktningen, noe som også bidrar til sporadiske avvik. Dette kan resultere i en liten variasjon i originalitetsskåren for en bestemt innlevering. Likevel er enhver variasjon i den totale originalitetsskåren vanligvis minimal.

  4. Uavhengig av hvilke originalitetsproblemer setninger flagges for, har de hver sin vekt. Dette betyr at de påvirker det tildelte Originalitetsindekset på ulike måter. For eksempel kan en flagget setning med 8 ord bidra med 6 %, mens en annen med 22 ord kan bidra med 13 %.

    Generelt har lengre setninger eller mer omfattende treff en tendens til å ha større innvirkning på Originalitetsindekset. Likevel er det viktig å understreke at innvirkningen ikke utelukkende avhenger av antall ord i setningen, da treff påvirkes av ytterligere faktorer under originalitetskontrollen.

  5. Setninger flagget for likhet i Originalitetsrapporten kan ha mer enn én samsvarende kilde. Det betyr at likhet er oppdaget mot flere kilder.

    Som et resultat vil det å ekskludere primærkilden ikke alltid fjerne setningen fra beregningen, ettersom den gjeldende sekundærkilden effektivt tar plassen til primærkilden i Originalitetsrapporten for den flaggede setningen.

Var denne artikkelen nyttig?

0 av 0 syntes dette var nyttig