✉️ Saņem šito visu e-pastā. Tā vietā, lai palaistu garām kaut ko no tā, ko es rakstu savā blogā, tagad vari pierakstīties un saņemt e-pastā visu, ko es te rakstu. Tas nav bieži.

← Uz sākumu

Izvāc tekstu no bildītēm

2014. gada 23. aprīlī, 3 komentāri

Šodien visu internetu apskrēja kāds Chrome paplašinājums Project Naptha, kurš nodarbojas ar lietām, kuras ir mazliet no fantastikas jomas. Tātad, paplašinājums ļoti augstā līmenī prot atpazīt tekstu attēlos. Pioniera goda vārds. Tiesa, attēlu analīzei tas izmanto autora izveidotu ārējo serveri un tā API, tāpēc pēc paspēlēšanās drošāk paplašinājumu ir izslēgt, bet aizvien sasodīti iespaidīgs rezultāts pat neskatoties uz to, ka latviski neprot un diez vai jel kad pratīs. Otra iespēja, kā komentāros norāda pyro, ir izvēlne Options -> Disable lookup. Ar to tiek izmantots iekšējais OCR risinājums un nekas nekur netiek sūtīts.

Tātad, uzinstalējot šo paplašinājumu lielā daļā bildīšu ar tekstu tas būs ... iezīmējams. Izkopējams. Pārtulkojams uz vietas. Izdzēšams. Paplašinājums un tā izmantotais serviss uzlabojas ar katru dienu. Strādā aizdomīgi lieliski pat uz CSDD infografikiem un lolkaķu bildēm ar parakstiem. Uz sarežģītākām bildēm var paiet brītiņš kamēr teksts tiek atpazīts, bet rezultāts aizvien ir lielisks.

Tieši tik vienkārši - iezīmējam, nokopējam un priecājamies.
Tieši tik vienkārši - iezīmējam, nokopējam un priecājamies.

Kas interesanti MIT organizētajā HackMIT hakatonā šis paplašinājums ieguva godpilno ... otro vietu. Nopietni :) Autoram Kevin Kwok, šķiet, ir 19 gadi un šis nav viņa pirmais WTF līmeņa projekts.

*Google* jau sen piedāvā attēlos un attēlveida PDFos esošo tekstu atpazīt.
*Google* jau sen piedāvā attēlos un attēlveida PDFos esošo tekstu atpazīt.

Ja nu kas, tad teksta atpazīšanu jau nodrošina daudzi servisi, ieskaitot Google Drive (iepriekš Google Docs). Latviešu valodai gan labākais, protams, aizvien ir vecais labais ABBY FineReader. Kā jau viegli iedomāties, šauri specializēta aplikācija tiek lieliski galā ar savu uzdevumu līdz brīdim kamēr plaši specializētam risinājumam paši lietotāji nesāk piegādāt milzumdaudz materiālu analīzei un teksta atpazīšanas algoritmu uzlabošanai.

Pavisam aizmirsu. Lai tekstu izvāktu, ar labo peles pogu izveicam klikšķināšanas darbību uz attēla un izvēlamies Translate -> Erase text.

Tu atbildi augstāk redzamajam komentāram. Atcelt

Gravatar pyro

2014. gada 23. aprīlī, plkst. 15:40

Sīkums, tas magic ir būvēts uz client side js, saikne ar serveri nav obligāta.

Gravatar laacz Autors

2014. gada 23. aprīlī, plkst. 15:49

Paldies, ka atgādināji. Tā kā darba diena, tad nācās veikli rakstīt un šo to nedarakstīju. Piefiksēju ar atsauci uz Tevi :)

Gravatar Berend

2014. gada 18. augustā, plkst. 14:02

Deem, izgudrotājam tikai 19 gadi...