Chystám se získat kancelář bez papírů a k tomu potřebuji dobrý skriptovatelný kousek OCR pro OS X?
Přečetl jsem blogpost od Marca Arment o několika programech. Existují nějaké funkční, které mi umožňují psát věci?
Chystám se získat kancelář bez papírů a k tomu potřebuji dobrý skriptovatelný kousek OCR pro OS X?
Přečetl jsem blogpost od Marca Arment o několika programech. Existují nějaké funkční, které mi umožňují psát věci?
OCRKit má podporu AppleScript i rozhraní příkazového řádku. Z jejich stránky nápovědy:
AppleScript
Můžete také skriptovat OCRKit a integrovat jej do konkrétního pracovního postupu. Například zpracovávejte příchozí soubory z sdílené složky z kopie MFP stroj atd. a jednoduše řekněte OCRKit, aby se otevřel, a tak proces proběhl prostřednictvím AppleScript:
řekněte aplikaci „OCRKit“ - zázraky manipulace s cestou AppleScript POSIX, ... otevřít "Uživatelé: admin: Desktop: orderform.pdf" otevřená cesta POSIX "/Users/Admin/Desktop/orderform.pdf" konec řekni
Cmand line
Protože je podporováno přímé skriptování z příkazového řádku OCRKit verze 2.5. To značně zjednodušuje použití OCRKit v dávkovém zpracování, umožňuje nastavit více možností a je také robustnější a více platforem než AppleSCript.
OCRKit.app/Contents/MacOS/OCRKit \ --lang cs | de | fr | es | ... \ --formát pdf | html | rtf | text \ --žádný pokrok \ --výstup out-file in-file
Od verze OCRKit 16.9 jsou podporovány další možnosti příkazového řádku:
-r, --rekurzivní adresář
Rekurzivně prohledejte adresář a vyhledejte nové soubory. Přeskočí soubory z OCRKit s textovou vrstvou nebo vektorovou grafikou.
--pattern "regex"
Vzor používaný ke shodě s názvy souborů během rekurzivních skenů. Výchozí hodnota
% .pdf $
, doporučení pro TIFF je%.tiff?$
- soubor protokolu
Během rekurzivního skenování do souboru zapisujte informace a statistiky protokolu.
- tajné heslo
Použijte tajné heslo k dešifrování souborů PDF během dávkového zpracování.
--test-run [fast]
Testovací dávkové zpracování spusťte pouze v testovacím režimu k testování souborů PDF nebo do získat počet stránek k odhadu celkové doby zpracování."rychle" bude místo toho, abyste procházeli všemi stránkami, zkontrolujte první stránku každého souboru analýza obrazu a vektorů.
- název značky
Pomocí rozšířeného názvu atributu označte stav zpracování souborů během dávkového zpracování.
macos: OCRKit (% s)
použije nativní macOS Vyhledejte místo toho tagy nebo jednodušemacos: OCRKit
bez uvedení stavu atribut.Pořadí atributu stavu je:spuštěno
,analyzováno
,zpracováno
a může být takéšifrováno
.
Readiris pro Mac. Mám ho, ale už jsem ho dlouho nepoužíval, takže si přesně nepamatuji, jak dobrý byl. Myslím, že prvních pár dokumentů to moc neudělalo, ale naučí se to.
Oh, a nejsem si jistý tím, jaká skriptovatelnost je. Zkontroluji to.
Vypadá to, že Readiris má skriptovací slovník, a taky je docela dobrý.
ABBYY FineReader Pro pro Mac umí OCR dobře a je skriptovatelný.Z jejich stránky s reklamami:
Zpracovávejte dávky dokumentů a automatizujte úlohy převodu
Dosáhněte nových úrovní produktivity a užijte si větší flexibilitu při převodu dokumentů s podporou akcí Automator a příkazů AppleScript.
Podporuje Applescript i Automator.Dříve jsem se to nepokoušel zautomatizovat, ale po prozkoumání mám nějaké plány udělat nějaké základní věci.To je důvod, proč na tuto otázku opožděně „odpovídám“.