Semalt: Cinci aplicații extraordinare de razuire a textului pentru jurnaliști

Un jurnalist colectează, scrie și distribuie conținut în mod regulat. El / ea se concentrează în principal pe probleme generale, probleme politice sau dezastre naturale. Majoritatea jurnaliștilor acoperă știri din lumea divertismentului, în timp ce ceilalți vorbesc despre jocuri și sport. Un jurnalist trebuie să întreprindă mai multe sarcini de razuire a textului în același timp; el / ea nu doar extrage date, dar asigură exactitatea și legitimitatea acestora într-o măsură. Jurnaliștii se expun uneori pericolului și scriu articole de știri pentru a angaja tot mai mulți cititori. Dacă doriți să deveniți jurnalist și nu aveți abilitățile de programare de bază, puteți utiliza următoarele aplicații pentru a vă finaliza munca.

1. Răzuitor:

Scraper este unul dintre cele mai bune și mai utile servicii de razuire a textului și a imaginilor. Este ușor de utilizat și vine cu o interfață prietenoasă. Cu Scraper, jurnaliștii pot viza mai multe pagini web în același timp și extrag date de pe site-uri întregi sau parțiale. Scraper este cel mai cunoscut pentru tehnologia sa de învățare automată și extrage text simplu din CNN, BBC și alte site-uri de știri similare. Puteți exporta aceste date în fișiere Google Docs, CSV sau fișiere JSON. Utilizează XPath pentru a evalua calitatea textelor.

2. Hub Outwit:

Outwit Hub este potrivit atât pentru jurnaliști, cât și pentru non-programatori. Nu trebuie să înveți Python, C ++ sau Ruby pentru a beneficia de această aplicație. Este, în principal, o extensie Firefox și scartaiește fișiere text, PDF, documente HTML și imagini pentru dvs. Outwit Hub oferă rezultate precise și poate fi utilizat pentru a indexa diferite site-uri în mod convenabil.

3. Scraperwiki:

Puteți utiliza Scraperwiki pentru a extrage date din paginile Wikipedia, jurnale online, site-uri de știri și site-uri de comerț electronic. Este o aplicație bazată pe browser care oferă rezultate fără erori instantaneu. Dacă nu aveți cunoștințe de codificare, Scraperwiki este opțiunea potrivită pentru dvs. Cu acest serviciu, jurnaliștii pot răzui întregul site și descarcă datele pe hard disk-urile lor în câteva secunde. Versiunea clasică a Scraperwiki este potrivită pentru dezvoltatorii de aplicații, freelanceri și webmasteri.

4. Import.io:

Import.io este unul dintre cele mai bune și mai utile servicii de razuire a textului pe internet. Îi ajută pe jurnaliști să caute subiecte în trend, să extragă date cu exactitate și să le publice pe site-urile proprii de știri în câteva minute. Cu Import.io, puteți razi atât fișiere text, cât și JPG. Odată instalat și activat, acest instrument va realiza până la două mii de proiecte de razuire a textului simultan. Face o treabă destul de bună de preluare a conținutului din adresele URL date și vă permite să analizați datele fără nici o problemă.

5. Laboratoarele Kimono:

La fel ca Import.io, Kimono Labs vizează un număr mare de site-uri. Acționează ca un raclet de text pe scară largă și un crawler web pe internet. Trebuie doar să menționați URL-ul din care doriți să extrageți informații, iar Kimono Labs va obține rezultatele dorite în câteva minute. Este cel mai cunoscut pentru tehnologia sa de învățare a mașinilor și sapă pe internet pentru a găsi subiecte adecvate pentru jurnaliști. Puteți salva fișierele de imagine și text în Google Docs sau le puteți descărca direct pe computer.

mass gmail