OCR (optinis simbolių atpažinimas) verčia skenuotą PDF arba PDF su paveikslėliais į paieškomą, kopijuojamą tekstą. Tai būtinas žingsnis, kai gaunate skenuotą sutartį, knygos kopiją ar bet kokį dokumentą, kuriame tekstas yra paveikslėlio pavidalu. Mūsų sistema atpažįsta tekstą lietuvių ir anglų kalbomis.
Galite pasirinkti, ar gauti rezultatą kaip „Searchable PDF“ (toks pat dokumentas, bet su paieškomu tekstu po paveikslėliais) arba kaip paprastą tekstinį (.txt) failą. Lietuviški rašmenys (ą, č, ę, ė, į, š, ų, ū, ž) palaikomi visiškai – atpažinimo tikslumas paprastai siekia 95%+ kokybiškai skenuotuose dokumentuose.
Atsidaro tame pačiame lange. Veikia naršyklėje, be diegimo, nemokamai.
Atidaryti įrankį →Kokybiškai skenuotuose dokumentuose – 95–99%. Prastesniuose dokumentuose – 80–90%.
Ne, OCR atpažįsta tik atspausdintą tekstą. Rankraščių atpažinimui reikia specializuotų sprendimų.
Searchable PDF išlaiko originalų išvaizdą su paieškomu tekstu po paveikslėliais. TXT yra paprastas tekstas be formatavimo.