.    

POZOR! Tento článek byl naposledy aktualizován před více než dvěma lety!

Je možné, že následující­ stránka obsahuje odkazy, které dnes již nejsou funkční, nebo že některé informace uvedené v tomto článku se v průběhu času ukázaly jako prokazatelně chybné. Pokud jakoukoliv podobnou závadu zjistíte, tak neváhejte napsat co nejpřesnější popis závady do veřejného komentáře pod článkem: redakce TečkyCZ nové komentáře neustále sleduje, a to i pod těmi nejstaršími články. V celé řadě případů lze chyby snadno opravit - např. se stává, že video na YouTube bylo smazáno a znovu nahráno pod jiným id. V jiných případech někdo zase zakáže embedovaní videa, která přitom existuje ve více kopiích, nebo se z webu ztratí stránka umístěná na negarantovaném freehostingu, zatímco původní autor stránek si mezitím zaregistruje vlastní doménu, atd.

Děkujeme všem, kteří pomáhají opravovat chyby ve starších webových stránkách a udržují tak Internet naživu - redakce TečkyCZ.


Často navštěvovaná neexistující URL ve statistikách - internetové priony

xChaos 2. února 2006 [4501 znaků] [editováno 17. března 2006] [Linux a internet]
[ + ] 1 [3x] [ - ]
Zobrazení 13334 ← Facebook 13 Twitter 9 Google 2
Komentářů 5

Hlásím objev něčeho, co pro lepší srovnání s už existujícími počítačovými (internetovými) viry lze označit nejspíš jako internetové priony.
Biologické viry jsou v podstatě jenom fragmenty DNA nesoucí návod ke vlastní samoreplikaci živými; počítačové viry byly označeny poněkud nepřesně, protože se neliší od "dospělých" programů tak zásadně, jako se viry liší třebas jen od nejjednoduší baktérie.

Priony jakožto samoreplikující se bílkoviny (které mohou být i toxické) jsou paralelou virů - s tím rozdílem, že vlastně ani nenesou jakoukoli abstraktní informaci - prostě jen "jsou" (jedna postava v posledním Gibsonově románu Pattern recognition se jmenuje Billy Prion - ale ted si nevybavuju, čím se vyznačuje...) Moje metafora s neexistujícími URL na čelných místech ve statistikách návštěvnosti sáhla po prionech - ale ve skutečnosti teda samozřejmě korektní by bylo označit "počítačové viry" spíše za "softwarové baktérie" - a v takovém případě má fenomén, který jsem "objevil" já, ke skutečným virům daleko blíže - a to sice tím, že nejde reálně o žádný "spustitelný" kód, ale pouze o parazitně existující adresu. Také bych to po sobě nejraději pojmenoval - co třeba "xChaosova URL" ... ne, to není ono, nazvěme to raději třeba "Polákův fenomén" :-) - ale obávám se, že tenhle fenomén už asi řadu názvů má - ať už je to Hlava XXII, Uroboros (had kousající se do vlastního ocasu), a nebo řada jiných.

Co se stane, když vaše webové stránky začne stahovat nějaký search engine, a nebo i třeba jenom hloupoučký mirorovací software (například wget s parametrem -r) ? Stáhnou se všechny stránky vašeho webu, na které odkazuje původní stránka.

Včetně stránky se statistikou nejnavštěvovanějších stránek, kterou generuje například webalizer, nebo jiný podobný software.

Robot se následně rekurzivně noří do dalších úrovní odkazů - včetně "nejnavštěvovanějších" odkazů, které jsou uvedené na stránce se statistikami.

Následně jsou statistiky vyhodnoceny - včetně (častých) dotazů na neexistující stránky, které byly uvedeny ve statistikách návštěvnosti.

To by samo o sobě nedostačovalo k vysvětlení, proč chybné odkazy přežívají. Aktivita normálních uživatelů, kteří klikají převážně na rozumnéa existující dotazy, by přeci měla postupně odsunout "rekurzivně" vyžadovaná chybná URL pod hranici sledovanou statistikami, ne ?

Skutečnost, že chybná URL ve statistikách přežívají, si vysvětluji tak, že různé Googleboty a ostatní zvěrstva se snaží častěji dotazovat na ta URL, na která sice na nějaké (často aktualizované - což statistiky návštěvnosti nepochybně jsou!) stránce nalezla odkaz - nicméně které v době prvního pokusu nebyly dostupné (což už tak neexistující URL většinou bývají).

Důsledkem je "zavirování" nebo chcete-li, "zaprionování" statistik neexistujícími URL - které ale v případě poměrně dlouhých neexistujících URL (jako jsou naše zkomolené dotazy na stránky s překódovanou češtinou) a jejich velkého množství můžou jednak docela vážně zatížit server, jednak generovat i docela značnou šířku pásma.

Důkazem, že nejde o zcela fiktivní problém, jsou myslím statistiky návštěvnosti firemních stránek Arachne Labs (jako příklad uvádím ty lednové - ale předesílám, že ). Ono by to bylo celkem zanedbatelné - kdyby robotů, které se snaží dělat stejnou věc jako Googlebot, ale přitom jsou ještě daleko hloupější, nebylo tak moc. To, jak moc těch robotů je, zase napovídá, jak moc si nejrůznější subjekty cení schopnosti, které všichni pozorujeme u Googlu - a jak moc by tuto schopnost chtěli získat, aniž by ale měli k dispozici programátory používající hlavu. No, jako jediné možné řešení mě napadá, že seznam nejnavštěvovanějích URL prostě na pár dní vypnu - čímž se chybná přestanou objevovat v každý den aktualizovaných stránách...

Co je obzvláštně znepokojivé je, že Googlebot (který je sám o sobě provozován jednou z nejvýkonějších serverových farem plně připojených k Internetu, které na téhle planetě lze najít) by asi ke "spamování" statistik generovaných webalizerem (nebo podobnými programy, které neověřují existenci URL) bylo možné "navést" podobným způsobem, jakým je možné naučit Google kdo nebo co je to "pazmrd" (ta finta je prostá: prostě potřebujete na dostatečném množství Googlem indexovaných stránek uvést odkaz ve tvaru <a href="http://tam-kam-chci.google.dostat">pazmrd</a>).

No, co zbývá dodat ... snad jen viroidní vtip, který mi přišel přes ICQ:

Jede webmaster vlakem, a slyší: <td></td>, <td></td> ...


Sloupcová sazba: pokud je okno prohlížeče dostatečně velké (na monitoru s dostatečným rozlišením), zobrazí se článek ve více sloupcích (w3.org). Testováno v browserech Firefox, Opera a Chrome. Není implementováno v Internet Exploreru. Tato feature může způsobovat problémy ve starších verzích prohlížečů s jádrem Webkit (Google Chrome, Safari, Konqueror). Pokud nevidíte článek celý, zkuste zmenšit okno prohlížeče nebo použít verzi pro tisk. [zpět na začátek sloupcové sazby]
Pokud se vám článek líbil, zkuste autora podpořit [zobrazit možnosti]
Sdílet v síti [Identi.ca - musíte být předem přihlášeni] [Twitter] [Facebook] [Jagg.cz]
Formátovat pro tisk [bez komentářů] [s komentáři]
Krátká forma URL (adresy) [http://teckacz.cz/348]
Všechny články [od autora xChaos] [v rubrice Linux a internet] [nejnovější]

Hodnocení článku čtenáři [ + ] 1 [3x] [ - ]
Tip: Pro moderaci článků (kladné nebo záporné hodnocení) je nutné použít browser, který podporuje javascript a cookies.
Komentáře čtenářů [napsat vlastní]
Skrýt hodnocené nebo méně


[] zuzu (anonym) 6. února 2006 ← komentářů 105 ☯☯☯☯ 5 [7x]
[ + ] 0 [0x] [ - ] ← pro ohodnocení komentáře se není nutné nikde registrovat
→ [/-/9326] ← na komentář můžete odpovědět nebo ho sdílet
no ja jen dodavam, ze http://www.google.com/search?q=pazmrd

[] Tomáš_Mráz 7. února 2006 ← komentářů 304 64 [240x]
[ + ] 0 [0x] [ - ] ← pro ohodnocení komentáře se není nutné nikde registrovat
→ [/-/9330] ← na komentář můžete odpovědět nebo ho sdílet
Aktualni varianta: Jede webmaster v Pendolinu a slysi:

"<td></td> ... Parse error: parse error, unexpected '.' in engine.php on line 1"

[] xChaos 7. února 2006 ← komentářů 5510 -2 [3026x]
[ + ] 0 [0x] [ - ] ← pro ohodnocení komentáře se není nutné nikde registrovat
→ [/-/9334] ← na komentář můžete odpovědět nebo ho sdílet
zuzu: ale ze teda má ten pazmrd výdrž ... já být takhle potrefený takhle dlouho, tak už přemýšlím, jak rozjet nějakou protiakci, a zvrátit rovnováhu sil uvnitř Googlu... je vidět, že proti té Číně jsme přeci jenom demokratická vesnice...

[] Jay-Rôh (anonym) 9. února 2006 ← komentářů 4 ☯☯☯ 3 [3x]
[ + ] 0 [0x] [ - ] ← pro ohodnocení komentáře se není nutné nikde registrovat
→ [/-/9354] ← na komentář můžete odpovědět nebo ho sdílet
a pak taky:
http://www.google.com/search?q=ministerstvo+brutality
:*)

[] Jay-Rôh (anonym) 9. února 2006 ← komentářů 4 ☯☯☯ 3 [3x]
[ + ] 0 [0x] [ - ] ← pro ohodnocení komentáře se není nutné nikde registrovat
→ [/-/9355] ← na komentář můžete odpovědět nebo ho sdílet
a ještě (na vzestupu):
http://www.google.com/search?q=lampárna
 

Počet zobrazených komentářů: 5 [celkový čas potřebný k prohledání databáze a vytvoření stránky: 0.66 sekund]

Pozor, vložením komentáře souhlasíte s pravidly hry TečkyCZ! [zobrazit pravidla] →
Ochrana proti spambotům - tři-krát-tři je ... ? (napište číslicí - nemělo by byt potřeba při zapnutém JavaScriptu)
Sociální síť (přihlaste se předem, 1. řádek<=96 znaků=status, zbytek=odkaz)
Offtopic resolver (týká se odpověď původního tématu, nebo patří jinam?)
Přezdívka (povinně) - nepoužívejte speciální znaky, mezery=podtržítka
E-mail (volitelně) - nebude zobrazen, zobrazí se ikonka z [www.gravatar.com]

Nelze použít HTML [zobrazit mikrosyntax] →

Nápověda: ve vlastním zájmu uvádějte u komentářů pouze funkční a dostupnou e-mailovou adresu. Přezdívku, která je jednou spojená s konkrétní e-mailovou adresou, už nyní nelze bez zásahu administrátora serveru spojit s jinou adresou. Uvedením neplatné e-mailové adresy si v budoucnu znemožníte upload ikonky i možnost použít některé další chystané neanonymní funkce vázané na uvedení platné e-mailové adresy.


TečkaCZ [Nejnovější články] [Nejnovější komentáře] [Zeď vzkazů] [Zeď odkazů] [Začátek článku]

    TečkaCZ
  •  
  • Komentáře →
  • Nástěnky →
  • Debaty →
  • Články →
  • Ročníky →
  • Rubriky →
  • RSS kanály →
  • Vzhled →
  • Ostatní →
  •  
[] [] [] [] [] [] [] [] [] [] [] [] [] [] [] [] [] [] [] [] [] [] [] [] []
  •  
.

[Arachne Labs]

[SPOJE.NET]

[Právě dnes | Tech | Ostatní]

Yacy P2P web search jabber.arachne.cz
tiskové zprávy a otevřené dopisy přebíráme z nejrůznějších informačních kanálů (i bez výslovného souhlasu autorů)
licenční práva k použitým obrázkům a grafickým motivům nejsou definována (přebírejte pouze texty bez obrázků)
texty článků i komentáře bez uvedení copyrightu jsou chráněny GNU Free Documentation License
založeno na Quzo engine, (G)1999-2002 David Čermák, (G)2002-2012 Michael Polák
Quzo engine vyvíjejí Arachne Labs, webhosting sponzorují SPOJE.NET
seznam aktuálních článků je dostupný i ve formátu RSS (XML)
můžete také sledovat Twitter feed TečkyCZ.
test XHTML a CSS2 validity