Internetový robot

Z Multimediaexpo.cz

Verze z 6. 6. 2014, 01:12; Frill80 (diskuse | příspěvky)
(rozdíl) ← Starší verze | zobrazit aktuální verzi (rozdíl) | Novější verze → (rozdíl)

Internetový robot nebo častěji jenom bot je počítačový program, který pro svého majitele opakovaně vykonává nějakou rutinní činnost na internetu - obvykle sbírá data, odesílá a zpracovává požadavky na služby vzdálených serverů.


Poznámka: Správný český tvar by měl být roboty, převládají však roboti.

Obsah

Příklady botů

Vyhledávací roboti

Častým příkladem robota jsou vyhledávací roboti internetových vyhledávačů, v angličtině crawler, spider, gatherer (doslova „prolízač“, pavouk, „shomažďovač“ - český ekvivalent se nepoužívá). Tento typ robotů prochází jednotlivé webové stránky, hledá na nich odkazy na nové stránky, indexuje obsah zpracovávaných stránek a umožňuje jejich následné prohledávání. Podobným příkladem může být robot na kontrolu odkazů (linkchecker). Prochází zadanou množinu stránek (opět následuje odkazy) a hledá na nich odkazy na již neexistující stránky.

Spamboti

Robot může informace do stránek i vkládat (odesíláním dat přes HTTP), existují např. roboti vkládající komentářový spam. Takový robot vyhledává formuláře na webu a vkládá do nich reklamní text nebo komerční sdělení.

Existují rovněž roboti, kteří získávají e-mailové adresy, jež vkládají do databází příjemců pro rozesílání nevyžádané pošty (spamu). Odtud se jim říká spamboti, řídčeji harvester. Jeden ze způsobů je prohledávání internetových stránek - e-mailovou adresu obvykle poznají podle přítomnosti zavináče@. Teoreticky by se zavináč mohl uvést jako element @; specifikaci HTML to neodporuje, prohlížeče by to měly podporovat a většinu spambotů by to mělo zmást. Protože objem takového spamu přesáhl míru únosnosti, bývá naléhavě doporučováno e-mailové adresy na internetu nezveřejňovat přímo, ale nějakým pro člověka snadno pochopitelným způsobem je opsat, např. jmeno (zavinac) domena.cz. Některé servery jdou v tomto uživatelům vstříc a e-mailové adresy takto rozloží automaticky nebo je vloží ve formě obrázku – příklad e-mailu ve formě obrázku (na stránce uveden ve spodní části) (či obrázkem nahradí jednotlivá písmena nebo alespoň znak zavináče [1]). Existuje i způsob přes kaskádové styly [2] [3], ten však zužuje skupinu uživatelů na ty s prohlížeči s podporou CSS(2).

Spamovací roboti však e-mailové adresy můžou získat rovněž sledováním odpovědí vzdálených SMTP serverů. Provádějí na vzdálený poštovní server tzv. slovníkový útok, kdy se pokouší doručit e-mail na adresy složené z obvyklých jmen a příjmení, oblíbených názvů a přezdívek (svoboda, novak, cerny, atd.). Tyto adresy jsou proto ohroženější, jako protiopatření se doporučuje např. rozšíření adresy o další znaky (xsvoboda, novak69, …).

Některé weby místo kontaktního mailu rovnou zobrazí formulář (třeba na připomínky k správě či obsahu jejich stránek), který je po vyplnění uživatelem zpracován na serveru, přičemž se teprve pošle na adresu administrátora nebo jiné zodpovědné osoby [4]. Při nedůsledném zpracování tohoto formuláře vzniká bezpečnostní díra, kterou může robot využít a pomocí ní rozeslat spam nejen správci ale libovolnému příjemci [5].

Zajímavostí jsou ring servery, které na spamboty políčily past - zobrazují stránky s desítkami mailových adres a odkazy vedoucí na obdobné takové stránky spřátelených serverů. Tyto stránky jsou vygenerované a odkazy lze procházet donekonečna, aniž by spamboty jediný z nich vyvedl mimo ring (obtěžovat běžné uživatele). Zmíněné e-mailové adresy pak patří největším prokázaným spamerům, takže tito v podstatě „sklízejí co zaseli“ [6].

Roboti pro správu a údržbu

Multimediaexpo.cz může používat roboty k různým údržbářským pracím, např. odstraňování nefunkčních externích odkazů, vytváření nových přesměrování či odstraňování dvojitých přesměrování.

IRCbot, Chatterbot

Robot nemusí pracovat pouze s webovými stránkami, IRC bot může poslouchat na IRC kanálu a reagovat na zaslané příkazy, či do IRC kanálu nějakou konverzaci odesílat.

Úkolem dalšího z botů, tzv. chatterbota, není sbírat nebo zasílat spam, ale bavit uživatele předstíráním (simulací) inteligentní konverzace. Zpravidla jeho algoritmus není tak dokonalý, aby obstál srovnání s živým protějškem (více viz Turingův test), většinou se jen snaží analyzovat z vět klíčová slova a na ně odpovědět podle připravených vzorů.

Botnet

Dnešní počítačové viry a červy často staví botnety, celé sítě propojených botů na zavirovaných počítačích, kteří čekají na příkaz majitele a poté používají kontrolované počítače k jejich splnění. Tímto způsobem se často vytváří DDoS útoky nebo odesílají spamy.

Související články

Externí odkazy