Goana dupa indexare
Multi dintre cei ce activeaza online isi pun cel putin o data intrebarea “de ce nu mi-a indexat Google tot site-ul” iar raspunsurile, in functie de persoana pe care o intrebi sunt destul de variate.
Exista o gramada de site-uri si experti ce vorbesc despre optimizarea pe motoarele de cautare. Ce i-ar placea lui Google si ce nu, si ce sa faci ca sa ii pici in gratii. Matt Cutts, unul dintre angajatii Google care impartaseste cateodata ponturi despre SEO pe blogul personal, este cu siguranta una dintre persoanele pe care ar trebuii sa le citesti daca esti interesat de felul in care gigantul priveste web-ul, dar nu este singurul. Un altul este Dan Crow, care a raspuns la un moment dat la problema “ce sa fac sa imi indexez tot site-ul”.
Raspunsul este pe cat de uimitor pe atat de simplu. Chiar daca Google are resurse nelimitate cand vine vorba de puterea de calcul pe care ar putea sa o cumpere exista 2 alte resurse care inca nu permit paianjenilor care acceseaza paginile web sa indexeze chiar tot. Electricitatea si latimea de banda a serverelor.
Sa o luam mai simplu insa. Google isi trimite crawlerul (paianjenul) pe net, si din link in link acesta gaseste pagini pe care le indexeaza. Sau nu. Adevarul este ca in fiecare zi Google ajunge pe un numar mare, dar limitat de link-uri. Si asta pentru ca electricitatea necesara operatiunilor de crawling precum si latimea de banda ar fi pur si simplu mult prea mari pana si pentru marele gigant.
Ai putea sa crezi, gresit insa, ca Google ar prefera sa indexeze toate site-urile si paginile aferente de la A la I si sa le ignore cu succes pe cele de la J la Z.
Una dintre teorii este ca daca ai o valoare Page Rank mare pe cateva pagini din site-ul tau, cu siguranta acele pagini precum si multe altele din site-ul tau vor fi indexate. Insa exista situatia mult mai plauzibila cand mai multe pagini din site-ul tau au o valoare Page Rank mai mica. Atunci, chiar daca Google trece prin acele pagini, este posibil sa refuze indexarea.
Si desi afirmatia de mai sus se pupa cu politica Google de relevanta asupra Internetului, nu prea se leaga cu ce am scris mai devreme despre electricitate si latime de banda. Si asta pentru ca mai exista o teorie, destul de plauzibila. Vorbeam mai sus despre acei experti in optimizarea pentru motoarele de cautare, care de cele mai multe ori pun accentul pe continut de calitate, pe numarul de linkuri care vin catre site-ul tau, dar de foarte putine ori asupra curateniei codului.
Da, codul HTML curat este mai usor de indexat decat codul care contine elemente de CSS sau JavaScript. De multe ori cand atrag atentia unora asupra exportarii elementelor de stil si de scripting in fisiere externe, imi atrag priviri urate si incruntari. E adevarat, reprezinta o munca in plus sa faci asta dupa ce ai construit deja o pagina. Limitarea elementelor de stil (CSS) si a JavaScriptului din codul site-ului tau va reduce viteza de incarcare a paginilor precum si timpul petrecut de crawler pentru a citi continutul site-ului, ceea ce la sfarsit duce la un consum mai mic de electricitate si de latime de banda. In plus, crawlerul nici nu intelege si nici nu vrea sa inteleaga elementele de JavaScript sau de stil.
Bine bine o sa zici, dar site-ul meu se incarca rapid de la mine de acasa … si pana la urma, e site-ul meu, doar nu o sa il defavorizeze chiar pe el. Viteza accesarii site-ului tau de acasa de la tine, sau de la serviciu nu este aceeasi cu viteza accesarii site-ului tau din China, America sau Germania. Iar Google acceseaza (probabil) cateva milioane de linkuri daca nu mai bine pe zi din diferite parti ale globului. Pentru ei conteaza. O secunda timp de incarcare in plus pentru 100.000 de site-uri reprezinta un efort de 27.7 ore de electricitate si latime de banda in plus care ar putea fi evitat. Si asta doar prin curatirea codului HTML. Impresionant nu?
Daca toata lumea ar avea mai multa grija la felul in care paginile sunt construite si ar urma un set de reguli simple Google ar putea sa indexeze mai multe pagini web, mai repede, cu efort mai mic.
Si atunci, de ce nu educa Google webmasterii pentru a construii paginile mai prietenoase pentru motorul lor de cautare? Poate pentru ca ar da rau ca Google sa ceara lumii sa faca ceea ce ar trebuii deja sa faca (pana la urma de aia exista posibilitatea de a pune codul auxiliar in fisiere externe), doar pentru a le usura lor munca.
Inca una de la Antena3
Deja incep sa ma intreb cu cat sunt platiti editorii web ai Antenei3.
Web-design.ro
Astazi ne uitam putin la un site al unui dealer auto din Romania. Mai exact Bras.
Ajuns intamplator (prin click pe un banner de pe un blog) pe bucatica de cyberspace a firmei numite mai sus, am aflat ca dansii vand automobile marca Renault.
Cum sunt curios am vrut sa vad cam ce oferte au dansii la masini, ce promotie de martisor.. s.a.m.d
Sa incepem cu landing page-ul pe care m-a dus bannerul.
Si anume acesta.
Mi-a atras atentia in primul rand imaginea cu cele 2 Meganeuri in oglinda, iar cum nu ar fi fost de ajuns, au si scris langa fiecare Megane Sedan sa nu cumva sa le confundati. Persoana care a facut aceasta manevra sigur s-a gandit la legile lui Gestalt. Plus, daca ne uitam cu atentie la imagine ne dam seama ca oglindirea nu este perfect simetrica.
Sa continuam..
In dreptul preturilor avem o bucata bara alba, care se misca in momentul in care faci scrolling.
Tough luck daca vrei sa vezi pretul la masina respectiva.
Avem o bara in schimb daca te intereseaza. Cel mai probabil o problema de CSS din moment ce pe Internet Explorer 7 bara nu apare.
Aditional uitandu-ma prin cod nitel am observat ca se tot incearca loadul la o imagine bak1_1.jpg, care nu prea exista “The requested URL /bak1_1.jpg was not found on this server.”
In sfarsit se intampla si la case mai mari. Sa continuam. Am dat click pe unul dintre linkurile din dreapta – detalii. Ma asteptam evident sa gasesc o lista bine organizata si detaliata a dotarilor nu o pagina care pare a fi facuta in frontpage acum 4 ani de zile.
Uitandu-ma la titlu citesc cu voce tare “Bras — Dotari auto”. In primul rand cele 3 liniute sunt super smechere, ai nevoie de toate 3 acolo ..
In al doilea rand, dotari auto … pentru … ce ? Pentru Mercedes, BMW, oi, capre … aaaa Renault.
La prima vedere as spune ca celor de la Bras nu le pasa de SEO din moment ce titlul spune simplu : 3 liniute — dotari auto. Insa daca as afirma asa ceva s-ar bate cap in cap cu dita-mai lista de meta keywords pe care o au pe pagina anterioara.
Daca as incepe sa disec pagina asta in amanunt, as mai detalia meniurile de prost gust in flash, tabelurile, css-ul…. situatiile de genul acesta:
sau situatiile de genul acesta:
Sa nu batem insa campii cu gratie pentru ca nu are rost. In cele din urma singura mea dilema este urmatoarea: de ce ai vrea sa investesti in reclama pentru site-ul tau, cand stii ca unii vizitatori nu vor putea sa vada contentul corect (ca sa nu fim rai spunand ca site-ul tau este varza atat estetic cat si tehnic) ?
Nu ar fi mai bine sa investesti intai banii intr-o firma de webdesign care sa iti faca MACAR un face-lift la website?
Mecanicii sau instructorii auto de la firma ta ar trebuii sa isi vada de suruburile si semnele lor si nicidecum de CSS-ul si HTML-ul site-ului Bras.
Web-design … a la Roumanie.
ASP vs Restul
Ma intreb cateodata ce gandesc unii oameni cand construiesc o pagina web.
Se da urmatoarea problema: avem de construit o pagina pentru … sa zicem un hotel. Este un hotel nici prea mic nici prea mare, si dupa ce am adunat toate datele necesare ajungem la concluzia ca avem vreo 10-15 pagini de construit. Intrucat hotelurile sunt in general internationale, si in contextul Internetului de azi nu poti avea o pagina intr-o singura limba, mai adaugam 2 limbi si ajungem la un 30-45 pagini de construit. Interactivitatea se realizeaza cu JavaScript, AJAX sau in cel mai rau caz Flash. Dar pentru ca tinem la motoarele de cautare si traficul care vine de acolo vom evita sa folosim Flash.
Urmatorul pas este sa ne decidem in ce vrem sa codam pagina. Avem design-ul pregatit, si avem de ales … HTML (e cam invechit e drept, dar inca isi face treaba), PHP (ar merge), ASP.NET (??) .. etc.
Contextul in care se face decizia, este o firma micuta de creatie si webdesign. De ce ar vrea cineva sa codeze 40 de pagini in ASP.NET, cand site-ul respectiv nu va avea login formuri, nu va fi folosit ca o platforma de utilizatori si simplul scop al site-ului este sa reprezinte imaginea hotelului pe net?
Oare pentru ca CMS-ul pe care il produce compania ta este specializat sa editeze si sa exporte in ASP ? Iar pentru ca i-ai bagat pe gat clientului CMS-ul (pentru care a platit si plateste lunar), tie iti este mai usor sa construiesti totul intr-un limbaj care este greu modificabil de catre un necunoascator ?
Posibil… pentru ca daca NU AI NEVOIE de ASP.NET sa iti faci prezenta pe net, nu ar trebuii sa incurci niste oameni cu figurile tale … ma gandesc eu.
Ce twittaresc?
- Cirque du Soleil (@ ROMEXPO w/ 4 others) http://t.co/f3UwCAd3
- @kaspersky I receive a security alert from Kaspersky when accesing andreeastan.ro but the website is not infected. care to help?
- infofer.ro sucks!
- RT @AndreeaStanRo: #ZiuaZ vine de la Zonga, iar postul acesta http://t.co/lgvkA7xD vine cu 3 invitatii la private beta
- @bobbyvoicuro eu chiar vroiam sa ajung la Constanta!









