laacz.lv

Kaspara F. neoficiālā mājaslapa (Anno 1997)

Izvāc tekstu no bildītēm

Šodien visu internetu apskrēja kāds Chrome paplašinājums Project Naptha, kurš nodarbojas ar lietām, kuras ir mazliet no fantastikas jomas. Tātad, paplašinājums ļoti augstā līmenī prot atpazīt tekstu attēlos. Pioniera goda vārds. Tiesa, attēlu analīzei tas izmanto autora izveidotu ārējo serveri un tā API, tāpēc pēc paspēlēšanās drošāk paplašinājumu ir izslēgt, bet aizvien sasodīti iespaidīgs rezultāts pat neskatoties uz to, ka latviski neprot un diez vai jel kad pratīs. Otra iespēja, kā komentāros norāda pyro, ir izvēlne Options -> Disable lookup. Ar to tiek izmantots iekšējais OCR risinājums un nekas nekur netiek sūtīts.


Tātad, uzinstalējot šo paplašinājumu lielā daļā bildīšu ar tekstu tas būs … iezīmējams. Izkopējams. Pārtulkojams uz vietas. Izdzēšams. Paplašinājums un tā izmantotais serviss uzlabojas ar katru dienu. Strādā aizdomīgi lieliski pat uz CSDD infografikiem un lolkaķu bildēm ar parakstiem. Uz sarežģītākām bildēm var paiet brītiņš kamēr teksts tiek atpazīts, bet rezultāts aizvien ir lielisks.

Tieši tik vienkārši – iezīmējam, nokopējam un priecājamies.

Kas interesanti MIT organizētajā HackMIT hakatonā šis paplašinājums ieguva godpilno … otro vietu. Nopietni :) Autoram Kevin Kwok, šķiet, ir 19 gadi un šis nav viņa pirmais WTF līmeņa projekts.

*Google* jau sen piedāvā attēlos un attēlveida PDFos esošo tekstu atpazīt.

Ja nu kas, tad teksta atpazīšanu jau nodrošina daudzi servisi, ieskaitot Google Drive (iepriekš Google Docs). Latviešu valodai gan labākais, protams, aizvien ir vecais labais ABBY FineReader. Kā jau viegli iedomāties, šauri specializēta aplikācija tiek lieliski galā ar savu uzdevumu līdz brīdim kamēr plaši specializētam risinājumam paši lietotāji nesāk piegādāt milzumdaudz materiālu analīzei un teksta atpazīšanas algoritmu uzlabošanai.

Pavisam aizmirsu. Lai tekstu izvāktu, ar labo peles pogu izveicam klikšķināšanas darbību uz attēla un izvēlamies Translate -> Erase text.

Iesniegt savu viedokli

Atruna par moderāciju. Daži vārdi, var gadīties, ka ir iz melnās listes (viagra and stuff). Tādi komentāri tiek aizturēti, pirms parādās lapā. Ja Tavs komentārs neparādās uzreizi, būs vien jāpagaida, līdz es jamo izlasīšu. Protams, ka paturu tiesības sev netīkošos komentārus dzēst, iemeslu neminot.