71
Tesseract.js je javascriptová knihovna, která z obrázků dostává slova téměř v jakémkoli jazyce.Motor Tesseract OCR byl jedním z nejlepších 3 motorů v roce 1995 testu přesnosti UNLV.V letech 1995 až 2006 se na tom odvedlo jen málo práce, ale je to pravděpodobně jeden z nejpřesnějších dostupných OCR motorů s otevřeným zdrojovým kódem.Zdrojový kód přečte binární, šedý nebo barevný obrázek a výstupní text.Je zabudována čtečka tiffů, která bude číst nekomprimované obrázky TIFF, nebo lze ke čtení komprimovaných obrázků přidat libtiff.Existují jazykové soubory pro mnoho jazyků, dokonce i pro text nastavený ve Frakturu a písmo blackletteru ....