Indexarea site-ului in Google. Metode simple de optimizare a indexarii

Indexarea site-ului in Google. Metode simple de optimizare a indexarii

Indexarea site-ului in motoarele de cautare este pe cat de importanta din punct de vedere SEO, pe atat de gresit inteleasa de foarte multi proprietari si administratori de site-uri. Indexarea site-ului in Google, cel mai utilizat motor de cautare in Romania, are de departe cele mai importante implicatii.
Iata de ce imi propun in acest articol sa clarific cele mai importante aspecte legate de indexarea site-ului in Google, astfel incat sa “pornesti cu dreptul” in procesul complex reprezentat de optimizarea SEO. Dar hai sa incepem cu inceputul si sa vedem in primul rand ce intelegem prin “indexare site“.

Ce inseamna indexare in motoare de cautare

Simplu spus, indexarea site-ului inseamna stocarea paginilor sale si a altor resurse specifice (imagini, fisiere pdf etc.) in baza de date (indexul) motorului de cautare. Scopul acestei operatiuni este ca resursele stocate sa poata fi ulterior returnate ca raspuns la cautarile efectuate de utilizatori.

Ordinea in care paginile web sunt afisate ca raspuns la cautari de catre Google reprezinta pozitionarea (ranking-ul) si este un rezultat al aplicarii unei formule complexe de stabilire a relevantei in raport cu cautarile. Aceasta formula complexa este cunoscuta sub denumirea de algoritm de cautare si are la baza peste 200 de variabile (factori de pozitionare).

Practic, indexarea este o conditie absolut necesara pentru pozitionare (daca site-ul nu exista in indexul motorului de cautare, nu are cum sa fie returnat ca raspuns la cautari), dar nu este nici pe departe o conditie suficienta. Mai multe informatii despre factorii de pozitionare utilizati de Google poti afla in cursul practic de SEO  pe care il sustinem.      

Cum verificam indexarea site-ului in Google

O prima intrebare la care ar trebui sa ne raspundem daca avem deja un site online este daca acesta este sau nu indexat de Google. Raspunsul il aflam simplu, tastand in caseta de cautare Google formula site: urmata imediat, fara spatiu, de domeniul site-ului (de exemplu, in cazul site-ului https://seosfera.ro, domeniul este seosfera.ro)

In cazul in care site-ul este indexat, Google va afisa o lista a paginilor indexate. In exemplul de fata, observati ca Google a indexat 38 de pagini.

Rezultat Google pentru verificare indexare site

Rezultat verificare indexare site

In cazul in care site-ul nu este indexat, Google va afisa un mesaj cum este cel de mai jos.

Rezultat verificare indexare site neindexat

Rezultat verificare indexare site NEINDEXAT

Pentru a obtine rezultate corecte, asigura-te ca ai ortografiat corect numele de domeniu si ai introdus comanda site: fara spatii sau alte caractere inaintea numelui de domeniu.

Similar se procedeaza si pentru a verifica indexarea unei singure pagini din site (de exemplu, un articol pe care l-ai publicat pe blog). Diferenta este ca dupa comanda site:, trebuie sa introduci adresa completa a paginii, nu doar numele de domeniu. Pentru a evita eventuale erori, iti recomand sa copiezi cu “copy paste”.

Atentie, daca pagina este disponibila cu www in fata, introdu adresa ca atare; daca nu, introdu adresa fara www.

Daca pagina este indexata, va aparea afisata in pagina de rezultate afisata de Google. Poti vedea un exemplu in copia de ecran mai jos:

Rezultat Google la verificare indexare pagina site

Rezultat verificare indexare pagina din site

Daca pagina nu este indexata, Google va afisa mesajul “Cautarea nu a returnat niciun rezultat”.

Formulele site:domeniu.ro si site:domeniu.ro/pagina pot fi utilizate atat in Google, cat si in alte motoare de cautare, cum ar fi Bing si Yahoo.

Indexare partiala a site-ului

Daca observi ca la cautarea site:numedomeniu.ro, Google returneaza un numar mult mai mic de rezultate decat numarul de pagini publicate pe site-ul tau, inseamna ca site-ul a fost doar partial indexat. Altfel spus, exista continut in site care nu poate fi gasit de utilizatorii care efectueaza cautari in Google.

Ce poti face in aceasta situatie:

Daca site-ul are adresele URL organizate pe foldere (acestea corespund categoriilor si/sau subcategoriilor de produse sau servicii) – de exemplu: www.numedomeniu.ro/categorie/subcategorie/landing-page – o analiza a indexarii diferitelor foldere iti poate arata care sunt categoriile sau subcategoriile neindexate sau care sunt indexate partial.

 

De exemplu, introducand in caseta de cautare Google site:www.numedomeniu.ro/categorie/ (cu slash la sfarsit!), vei afla daca acea categorie este indexata de Google si, daca da, care sunt paginile indexate. De-a lungul timpului, am intalnit numeroase cazuri de site-uri in care categorii intregi nu erau indexate din cauza unor setari gresite a platformelor de administrare.

La fel, efectuand cautarea site:numedomeniu.ro/categorie/subcategorie/ (cu slash la sfarsit), vei afla care sunt paginile indexate de Google din subcategoria respectiva.

Daca site-ul are toate fisierele incarcate la radacina site-ului, ca de exemplu http://www.numedomeniu.ro/denumire-serviciu-sau-produs, poti verifica indexarea diferitelor tipuri de pagini cu comanda site:numedomeniu.ro inurl: dupa care adaugi un identificator comun pentru toate URL-urile paginilor pentru care doresti sa verifici indexarea.

In copia de ecran de mai jos, poti vedea cum am verificat indexarea paginilor corespunzatoare produselor LEGO Star Wars de pe site-ul okazii.ro. Practic, dupa site:okazii.ro inurl: am adaugat identificatorul comun al adreselor URL corespunzatoare paginilor de produs LEGO Star Wars, in cazul de fata, lego-star-wars

Verificare indexare URL-uri cu site: si inurl:

Verificare indexare pagini cu site: si inurl:

Cauze posibile ale indexarii partiale / neindexarii site-ului

Printre cele mai frecvente cauze identificate in auditele onsite efectuate de-a lungul timpului, pentru care  pagini, sectiuni sau chiar site-uri in intregime nu sunt indexate in Google, amintesc:

  • accesul motoarelor de cautare este restrictionat din fisierul robots.txt Aici gasesti o serie de informatii utile despre fisierul robots.txt si despre cum poti utiliza instructiunile specifice acestui fisier pentru o indexare optima a site-ului.
  • paginile au tag-ul Meta Robots cu valorile “noindex, nofollow” sau “noindex, follow” in codul sursa (“noindex” reprezinta instructiunea de neindexare).

Nu putine sunt cazurile in care pagini, categorii sau chiar  intregul site sunt restrictionate accidental din plugin-ul de SEO prin bifarea optiunii “noindex, nofollow”. Destul de numeroase sunt si situatiile in care se omite anularea restrictionarii indexarii odata cu lansarea online a unui site (restrictionare efectuata fie din fisierul robots.txt , fie prin tag-ul Robots “noindex”)

  • paginile nu sunt “legate” de site prin link-uri – practic, paginile exista pe site, dar nu se poate ajunge la ele prin intermediul link-urilor din site – se mai numesc si pagini orfane.
  • link-ul / link-urile care trimit catre pagini nu sunt corecte (utilizatorilor li se va afisa o pagina de eroare 404)
  • paginile sunt mult prea “ascunse” in arhitectura site-ului (este nevoie de multe click-uri pentru a ajunge la ele).
  • nu exista fisier sitemap.xml instalat pe site care sa ajute la “descoperirea” paginilor
  • fisierul sitemap.xml instalat pe site este ignorat de Google din cauza unor erori de configurare

Cum asiguram o buna indexare a site-ului in Google

Hai sa vedem care sunt metodele prin care te poti asigura ca site-ul tau este indexat de Google.

Formularul de indexare Google

Recomand folosirea Formularului mai ales pentru indexarea site-urilor noi.

Formular indexare site Google

Formular pentru indexare site nou in Google

Este suficient sa introduci adresa paginii de pornire (Acasa, Homepage sau Home). Nu este nevoie sa adaugi adresa fiecarei pagini din site. Pornind din Homepage, robotul Google descopera si indexeaza noi pagini, prin intermediul link-urilor din site.

Indexare site cu fisier Sitemap XML

Fisierul sitemap.xml este un fisier care contine adresele paginilor pe care doresti sa le indexeze motorul de cautare, impreuna cu o serie de informatii optionale, cum ar fi prioritatea fiecarei pagini la indexare sau rata de actualizare a fiecarei pagini.

Fisierul se instaleaza la radacina site-ului (exemplu: www.numesite.ro/sitemap.xml) si este al doilea fisier pe care il viziteaza Google in orice site, dupa fisierul robots.txt.

Iata cum arata continutul unui fisier sitemap.xml. Exemplul contine o singura adresa URL si toate tag-urile optionale

<?xml version=”1.0″ encoding=”UTF-8″?>

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

<url>

<loc>http://www.example.com</loc>

          <lastmod>2005-01-01</lastmod>       

          <changefreq>monthly</changefreq>      

           <priority>0.8</priority>

</url>

</urlset>

De retinut ca poti genera un fisier sitemap.xml valid pentru site-ul tau folosind un instrument automatizat online. Iti recomand:

De asemenea, pe platforme CMS cum sunt WordPress, Prestashop, Open Cart etc., poti instala plugin-uri de SEO care au optiuni de generarare si actualizare automata a fisierului sitemap.xml.

Este foarte important ca fisierul sitemap.xml sa contina URL-uri valide care corespund unor pagini pe care doresti sa le gaseasca utilizatorii in Google. Nu pastra in fisierul sitemap.xml adresele unor articole/produse care nu mai exista pe site (pagini care intorc codul de eroare 404). Aici gasesti mai multe informatii despre fisierul sitemap.xml

Odata ce ai generat fisierul sitemap.xml, incarca-l la radacina site-ului (ex: www.numesite.ro/sitemap.xml). Poti verifica eventualele erori de configurare cu ajutorul optiunii “Test” din contul Google Search Console al site-ului. Daca testul nu evidentiaza erori de configurare, poti trimite sitemap-ul catre Google folosind optiunea “Trimiteti”. Este un fel de invitatie la indexare in Google a paginilor listate in sitemap.

Trimitere sitemap XML prin Google Search Console

Optiune trimitere sitemap XML prin Google Search Console

Indexare site cu ajutorul link-urilor externe

Probabil stii ca Google si alte motoare de cautare descopera noi pagini web prin intermediul link-urilor. Odata descoperite, aceste pagini pot fi indexate daca respecta anumite standarde. Desi nu e indicat sa ne bazam niciodata doar pe aceasta metoda de indexare, este intotdeauna util sa obtinem link-uri catre site-ul nostru de pe alte  site-uri relevante, mai ales ca link-urile externe sunt unul dintre cei mai importanti factori de pozitionare in Google.

Profilele din retelele sociale (Facebook, Google+, Youtube, Twitter etc.) asociate site-ului, precum si cataloagele de afaceri sau portalurile relevante pentru domeniul de activitate sunt doar cateva exemple de site-uri unde poti include link-uri catre site-ul tau, fara teama de a fi penalizat pentru spam.

Informatii detaliate, insotite de exemple si studii de caz, referitoare la modurile in care poti obtine link-uri externe de calitate pentru site-ul tau gasesti in cursul SEO practic pe care il sustinem. 

Indexarea rapida in Google a paginilor noi din site

Daca tocmai ai adaugat in site continut nou (produse in magazinul online sau un articol pe blog, de exemplu) si doresti ca paginile respective sa fie indexate cat mai repede de Google, poti sa-ti atingi scopul prin urmatoarele metode:

  • Asigura-te ca paginile nou create sunt legate de restul site-ului prin cel putin un link care poate fi urmat de utilizatori si de motoarele de cautare. In caz contrar, paginile nu vor putea fi gasite din site de catre utilizatori si exista o probabilitate foarte mare sa nu fie indexate nici de motoarele de cautare, in ciuda aplicarii metodelor de indexare!

 

  • Actualizarea fisierului sitemap.xml, astfel incat sa contina noile URL-uri si trimiterea sitemap-ului catre Google via Google Search Console

 

  • Creaza una sau mai multe postari in pagina Google+ care sa contina link catre pagina / paginile nou create. Paginile respective vor fi foarte rapid indexate de catre Google

 

  • Optiunile “Preluare ca Google” si “Solicitati indexarea” din contul Google Search Console – o recomand mai ales pentru indexarea mai rapida a versiunilor actualizate ale unor pagini deja indexate, in cazul in care metodele anterioare nu au produs rezultat in timpul dorit.
Optiune solicitare indexare rapida in Google Search Console

Optiune pentru solicitare indexare in Google Search Console

Sper ca informatiile oferite sa te ajute sa identifici si sa solutionezi problemele de indexare a site-ului in Google. Odata rezolvate aceste probleme, te vei putea concentra pe celelalte etape ale optimizarii site-ului, optimizarea onsite si optimizarea offsite, despre care poti afla tot ce ai nevoie in cursul practic de SEO pe care il sustinem in Bucuresti.

În lipsa unui acord scris din partea Seosfera, puteţi prelua maxim 500 de caractere din acest articol, dacă inseraţi vizibil un link catre articol: