pdftools.lt

PDF OCR – tekstas iš skenuoto dokumento

OCR (optinis simbolių atpažinimas) verčia skenuotą PDF arba PDF su paveikslėliais į paieškomą, kopijuojamą tekstą. Tai būtinas žingsnis, kai gaunate skenuotą sutartį, knygos kopiją ar bet kokį dokumentą, kuriame tekstas yra paveikslėlio pavidalu. Mūsų sistema atpažįsta tekstą lietuvių ir anglų kalbomis.

Galite pasirinkti, ar gauti rezultatą kaip „Searchable PDF“ (toks pat dokumentas, bet su paieškomu tekstu po paveikslėliais) arba kaip paprastą tekstinį (.txt) failą. Lietuviški rašmenys (ą, č, ę, ė, į, š, ų, ū, ž) palaikomi visiškai – atpažinimo tikslumas paprastai siekia 95%+ kokybiškai skenuotuose dokumentuose.

Naudoti įrankį dabar

Atsidaro tame pačiame lange. Veikia naršyklėje, be diegimo, nemokamai.

Atidaryti įrankį →

Kada naudoti šį įrankį

Kaip naudoti – žingsniai

  1. Įkelkite skenuotą PDF arba PDF su paveikslėliais.
  2. Pasirinkite kalbą (lietuvių, anglų arba abi).
  3. Pasirinkite output formatą (Searchable PDF arba TXT).
  4. Spauskite „Atpažinti“ ir palaukite – OCR užtrunka 20–60 sekundžių pagal puslapių skaičių.
  5. Atsisiųskite rezultatą.
Privatumas: Visi failai šifruojami HTTPS, niekas jų nemato ir neperžiūri. Automatiškai ištrinami iš serverio per 1 valandą po apdorojimo.

Dažniausiai užduodami klausimai

Koks OCR tikslumas lietuvių kalbai?

Kokybiškai skenuotuose dokumentuose – 95–99%. Prastesniuose dokumentuose – 80–90%.

Ar palaiko rankraščius?

Ne, OCR atpažįsta tik atspausdintą tekstą. Rankraščių atpažinimui reikia specializuotų sprendimų.

Kuo skiriasi Searchable PDF nuo TXT?

Searchable PDF išlaiko originalų išvaizdą su paieškomu tekstu po paveikslėliais. TXT yra paprastas tekstas be formatavimo.

Atidaryti „PDF OCR – tekstas iš skenuoto dokumento" →