Dokumentafbildningssoftware JOCR

JOCR er en specialiseret optisk karaktergenkendelsessoftware (ocr), der kan genkende tegn fra billeder taget på computerens skrivebord.

Før vi undersøger funktionaliteten, skal det bemærkes, at JOCR kræver Microsoft Office Document Imaging-komponenten, som er en komponent i Microsoft Office 2003 og nyere Office-versioner. Office-værktøjet skal installeres for, at JOCR overhovedet kan fungere.

JOCR i sig selv er et bærbart softwareprogram. Grænsefladen ligner en skærmoptagelse af softwareprogrammer. Det tilbyder at fange en region, skrivebordet eller det aktive vindue. Billedet vises derefter i programmets grænseflade med indstillinger til at udskrive eller kopiere det, eller til at genkende det, der starter OCR-processen.

OCR med JOCR

document imaging software

Anerkendelse er åbenlyst hoveddelen, da den vil analysere billedet, der er til rådighed for at opdage alle de tegn, den indeholder. Dokumentafbildningssoftwaren viser det identificerede tegnantal og viser dem i standardteksteditoren, hvorfra de let kan redigeres eller kopieres.

Dokumentafbildningssoftwaren kan være nyttig i situationer, hvor tekst skal kopieres fra interfaceelementer. Dette kan være fejlmeddelelser, tekst, der vises i applikationer eller billeder. Genkendelsesfrekvensen afhænger stort set af den anvendte billedtype og tekst. Det spænder fra strålende (næsten ingen redigering kræves) til svag (kunne ikke genkende bestemte tegn, kræves masser af redigering).

JOCR er kompatibel med følgende sprog: Kinesisk, tjekkisk, dansk, hollandsk, engelsk, finsk, fransk, tysk, græsk, ungarsk, italiensk, japansk, koreansk, norsk, polsk, portugisisk, russisk, spansk, svensk, tyrkisk.

Dom

JOCR er et godt designet program, som du muligvis kan bruge til at slå tekst på ethvert billede eller program, som du ser på Windows-maskinen, til tekst.

Bemærk : Jocr er ikke blevet opdateret siden 2006, hvilket gør det sandsynligt, at det ikke fungerer på nyere versioner af Windows eller Office. En sammenlignelig løsning er GOCR , en open source-tegngenkendelsessoftware, som du kan downloade fra projektets Sourceforge-side.

Programmet er tilgængeligt til Linux og Windows og som kildekode. Du skal indlæse billeder i programmet, så teksternes indhold på billederne kan omdannes til almindelig tekst, som du kan kopiere. Selvom det ikke understøtter skærmoptagelsesfunktionalitet, er det let nok at oprette et skærmbillede selv, gemme det som en billedfil og indlæse det i programmet for at få teksten genkendt.