mindfields.ro header

21 February 2010 - 12:39Goana dupa indexare

Multi dintre cei ce activeaza online isi pun cel putin o data intrebarea “de ce nu mi-a indexat Google tot site-ul” iar raspunsurile, in functie de persoana pe care o intrebi sunt destul de variate.

Exista o gramada de site-uri si experti ce vorbesc despre optimizarea pe motoarele de cautare. Ce i-ar placea lui Google si ce nu, si ce sa faci ca sa ii pici in gratii. Matt Cutts, unul dintre angajatii Google care impartaseste cateodata ponturi despre SEO pe blogul personal, este cu siguranta una dintre persoanele pe care ar trebuii sa le citesti daca esti interesat de felul in care gigantul priveste web-ul, dar nu este singurul. Un altul este Dan Crow, care a raspuns la un moment dat la problema “ce sa fac sa imi indexez tot site-ul”.

Raspunsul este pe cat de uimitor pe atat de simplu. Chiar daca Google are resurse nelimitate cand vine vorba de puterea de calcul pe care ar putea sa o cumpere exista 2 alte resurse care inca nu permit paianjenilor care acceseaza paginile web sa indexeze chiar tot. Electricitatea si latimea de banda a serverelor.

Sa o luam mai simplu insa. Google isi trimite crawlerul (paianjenul) pe net, si din link in link acesta gaseste pagini pe care le indexeaza. Sau nu. Adevarul este ca in fiecare zi Google ajunge pe un numar mare, dar limitat de link-uri. Si asta pentru ca electricitatea necesara operatiunilor de crawling precum si latimea de banda ar fi pur si simplu mult prea mari pana si pentru marele gigant.

Ai putea sa crezi, gresit insa, ca Google ar prefera sa indexeze toate site-urile si paginile aferente de la A la I si sa le ignore cu succes pe cele de la J la Z.

Una dintre teorii este ca daca ai o valoare Page Rank mare pe cateva pagini din site-ul tau, cu siguranta acele pagini precum si multe altele din site-ul tau vor fi indexate. Insa exista situatia mult mai plauzibila cand mai multe pagini din site-ul tau au o valoare Page Rank mai mica. Atunci, chiar daca Google trece prin acele pagini, este posibil sa refuze indexarea.

Si desi afirmatia de mai sus se pupa cu politica Google de relevanta asupra Internetului, nu prea se leaga cu ce am scris mai devreme despre electricitate si latime de banda. Si asta pentru ca mai exista o teorie, destul de plauzibila. Vorbeam mai sus despre acei experti in optimizarea pentru motoarele de cautare, care de cele mai multe ori pun accentul pe continut de calitate, pe numarul de linkuri care vin catre site-ul tau, dar de foarte putine ori asupra curateniei codului.

Da, codul HTML curat este mai usor de indexat decat codul care contine elemente de CSS sau JavaScript. De multe ori cand atrag atentia unora asupra exportarii elementelor de stil si de scripting in fisiere externe, imi atrag priviri urate si incruntari. E adevarat, reprezinta o munca in plus sa faci asta dupa ce ai construit deja o pagina. Limitarea elementelor de stil (CSS) si a JavaScriptului din codul site-ului tau va reduce viteza de incarcare a paginilor precum si timpul petrecut de crawler pentru a citi continutul site-ului, ceea ce la sfarsit duce la un consum mai mic de electricitate si de latime de banda. In plus, crawlerul nici nu intelege si nici nu vrea sa inteleaga elementele de JavaScript sau de stil.

Bine bine o sa zici, dar site-ul meu se incarca rapid de la mine de acasa … si pana la urma, e site-ul meu, doar nu o sa il defavorizeze chiar pe el. Viteza accesarii site-ului tau de acasa de la tine, sau de la serviciu nu este aceeasi cu viteza accesarii site-ului tau din China, America sau Germania. Iar Google acceseaza (probabil) cateva milioane de linkuri daca nu mai bine pe zi din diferite parti ale globului. Pentru ei conteaza. O secunda timp de incarcare in plus pentru 100.000 de site-uri reprezinta un efort de 27.7 ore de electricitate si latime de banda in plus care ar putea fi evitat. Si asta doar prin curatirea codului HTML. Impresionant nu?

Daca toata lumea ar avea mai multa grija la felul in care paginile sunt construite si ar urma un set de reguli simple Google ar putea sa indexeze mai multe pagini web, mai repede, cu efort mai mic.

Si atunci, de ce nu educa Google webmasterii pentru a construii paginile mai prietenoase pentru motorul lor de cautare? Poate pentru ca ar da rau ca Google sa ceara lumii sa faca ceea ce ar trebuii deja sa faca (pana la urma de aia exista posibilitatea de a pune codul auxiliar in fisiere externe), doar pentru a le usura lor munca.

No Comments | Tags: seo, webdesign

28 October 2008 - 11:33Analytics facelift si betas

Acum cateva zile Google Analytics a primit un facelift vizibil mai ales in partea stanga (meniul).
Astazi au aparut 2 taburi noi in contul meu de analytics: Custom Reports si Advanced Segments. Ambele optiuni sunt in beta deocamdata dar iata 2 screenshoturi.

No Comments | Tags: Google, search engines, search marketing, sem, seo

13 October 2008 - 12:27Oare …

Se da o agentie web oarecare. Se da un proiect SEO pentru un client al agentiei web, care este administrat de un third-party.
Ce ar trebuii sa raspunda firma de consultanta SEO cand primeste intrebari de la agentia web care suna ceva in genul: “de ce trebuie sa separam stilurile de continut (in fisiere externe .css) si de ce trebuie sa scoatem JavaScriptul din pagina (in fisiere externe .js)” ?

Sa le spuna cum functioneaza motoarele de cautare ? Sau sa le povesteasca despre standarde W3C ? Nu vrem sa facem lucrurile foarte complicate totusi … sa nu se piarda baietii.

3 Comments | Tags: intrebari, seo, today I hate

6 August 2008 - 12:10Google Insights

Google a lansat un nou serviciu (inca in BETA) ce se numeste Google Insights for Search.
Inca are buguri (mai ales la cautari pt Romania), dar pare un tool interesant.

No Comments | Tags: Google, sem, seo

1 July 2008 - 10:48Flash indexabil

Adobe si Google s-au gandit ca ar fi un moment prielnic sa dezvolte o tehnologie ce ar putea indexa textul si linkurile din fisierele .swf …
mai multe aici

No Comments | Tags: Google, search engines, seo

30 May 2008 - 21:56SEO Rap

No Comments | Tags: search engines, seo, video

22 January 2007 - 12:11What new stuff is out there …

So, a new fresh week just started, and it today the winter made its appearance in Copenhagen, and although the wind has been blazing in my window for the last 2 weeks or so, I didn’t see the snow coming this way at all. My mindfields hasn’t been updated with any geek-ish news lately, so why not do it now as a few things have happened during the last week. First to start off it’s of course the Apple’s new invention (Apple Computers changed name recently to Apple Inc.), the iPhone. My experience with Apple products has been quite brief as back home I didn’t really see many laptops or computers signed by this company, but when getting in Denmark, I did get familiar to the iPods the MacBooks and the ever acclaimed MacOS X. At first I didn’t really like Apple, it was one of those things PC enthusiasts don’t even talk about … the “dark side” of the computer world. Now things have changed in my vision, and after having some nice encounters with the MacBooks especially, I’ve learned to like them … although I wouldn’t buy one unless I really really really had to. The iPod is another story though …
Back to the iPhone though… and as it couldn’t be a quiet launch of the first phone ever produced by Adam’s temptation company, the name itself (iPhone) had to be discussed on legal grounds with Cisco Networking which apparently owned the name (i wonder why :o ) ). The phone itself looks good, stylish just as we got used to see from Apple, featuring almost no buttons, but a huge touch screen which might create usability problems among those with sausage fingers and a bad dexterity. It seems more like a huff and puff to me, as the lcd touch sensible screen is not mature enough to be used on a daily basis especially for a phone. Get this more, no stylus needed. This means that the happy buyers will have to use their own set of 10 wonderful fingers in stock to activate and interact with the iPhone. Of course it is not only a phone, but a shaver, a toaster, a spare wheel when you go flat on your car, a gps, a fan, a bottle opener, a hair-blower, a pacemaker, a fat analyzer, a remote control, an anti-rust filter, a condom dispenser and has some functionality as a dildo. Does that sound fake ? It is a bit, cause the new device can only store music (and play it back hopefully – 8GB memory), images and movies, take pictures via the 2mpix camera and operate as a all-in-one pda with the mac-os right there on the spot. The price is estimated at 599$, so if you have them, what are you waiting for ?
Aaaanyway… LG seems to have their own iPhone replica (did I just say iPhone ? damn … ), called the LG “Prada” which looks outstandingly the same as the above mentioned gadget, has the same lcd touchscreen and mostly the same functions all over, only that it costs 780$ (whaaat? It’s an LG Prada … it will stick … I mean look at the D&G Motorola V6 … it was a blast :P ). Going to work (Outrider I mean), Google seems to be playing around quite a bit these days, as there has been a toolbar PR upgrade and search engine results look very very strange. People all over have been complaining that pages are being de-indexed or that rankings dropped all of a sudden for some keywords. I suspect we are about to see some changes, don’t know exactly what but it seems that the ranking algorithm is being changed to consider pages with more relevance and inbound links than those with content. I’d better drop by Mat’s blog and see what he notes…
That’s it for now.

No Comments | Tags: Google, computers, daily, it, seo