Autor: Mariana Tudose
Ultima actualizare: Mai 2024
CUPRINS ARTICOL
Poti da click pe link-ul dorit pentru a ajunge direct la sectiunea corespunzatoare.
1. Introducere
2. Ce inseamna indexare in motoare de cautare
3. Cum verificam indexarea site-ului in Google
4. Indexare partiala a site-ului
5. Cauze posibile ale indexarii partiale, respectiv neindexarii site-ului
6. Cum asiguram o buna indexare a site-ului in Google
6.1 Formularul de indexare de la Google
6.2 Indexare site cu fisier Sitemap XML
6.3 Indexare site cu ajutorul link-urilor externe
6.4 Indexarea rapida in Google a paginilor noi din site
1. Introducere
Indexarea site-ului in motoarele de cautare este pe cat de importanta din punct de vedere SEO, pe atat de gresit inteleasa de foarte multi proprietari si administratori de site-uri. Indexarea site-ului in Google, cel mai utilizat motor de cautare in Romania, are de departe cele mai importante implicatii.
Iata de ce imi propun in acest articol sa clarific cele mai importante aspecte legate de indexarea site-ului in Google, astfel incat sa “pornesti cu dreptul” in procesul complex reprezentat de optimizarea SEO. Dar hai sa incepem cu inceputul si sa vedem in primul rand ce intelegem prin indexare site.
2. Ce inseamna indexare in motoare de cautare
Simplu spus, indexarea site-ului inseamna stocarea paginilor sale si a altor resurse specifice (imagini, fisiere pdf etc.) in baza de date (indexul) motorului de cautare. Scopul acestei operatiuni este ca resursele stocate sa poata fi ulterior returnate ca raspuns la cautarile efectuate de utilizatori.
Ordinea in care paginile web sunt afisate ca raspuns la cautari de catre Google reprezinta pozitionarea (ranking-ul) si este un rezultat al aplicarii unei formule complexe de stabilire a relevantei in raport cu cautarile. Aceasta formula complexa este cunoscuta sub denumirea de algoritm de cautare si are la baza foarte multe variabile (factori de pozitionare).
Practic, indexarea este o conditie absolut necesara pentru pozitionare: daca site-ul nu exista in indexul motorului de cautare, nu are cum sa fie returnat ca raspuns la cautari. Pe de alta parte, indexarea nu este nici pe departe o conditie suficienta pentru pozitionare, aceasta din urma fiind rezultatul functiilor incorporate in algoritmul de cautare.
3. Cum verificam indexarea site-ului in Google
O prima intrebare la care ar trebui sa ne raspundem daca avem deja un site online este daca acesta este sau nu indexat de Google. Raspunsul il aflam simplu, tastand in caseta de cautare Google formula site: urmata imediat, fara spatiu, de numele de domeniu al site-ului.
In cazul in care site-ul este indexat, Google va afisa o lista a paginilor indexate.
In cazul in care site-ul nu este indexat, Google va afisa un mesaj cum este cel de mai jos.
Pentru a obtine rezultate corecte, asigura-te ca ai tastat corect numele de domeniu si ai introdus comanda site: fara spatii sau alte caractere inaintea numelui de domeniu.
Similar se procedeaza si pentru a verifica indexarea unei singure pagini din site (de exemplu, un articol pe care l-ai publicat pe blog). Diferenta este ca dupa comanda site: trebuie sa introduci adresa completa a paginii, nu doar numele de domeniu. Pentru a evita eventuale erori, iti recomand sa folosesti functia “copy paste”.
Atentie, daca pagina este disponibila cu www, introdu adresa ca atare; daca nu, introdu adresa fara www.
Daca pagina este indexata, va aparea afisata in pagina de rezultate Google. Daca nu este indexata, Google va afisa mesajul “Cautarea nu a returnat niciun rezultat”.
Formulele site:numedomeniu.ro si site:numedomeniu.ro/pagina pot fi utilizate atat in Google, cat si in alte motoare de cautare, cum ar fi Bing si Yahoo.
4. Indexare partiala a site-ului
Daca observi ca la cautarea site:numedomeniu.ro, Google returneaza un numar mult mai mic de rezultate decat numarul de pagini publicate pe site-ul tau, inseamna ca site-ul a fost doar partial indexat. Altfel spus, exista continut in site care nu poate fi gasit de utilizatorii care efectueaza cautari in Google.
Ce poti face in aceasta situatie:
Daca site-ul are adresele URL organizate pe foldere (acestea corespund categoriilor si/sau subcategoriilor de produse sau servicii) – de exemplu: www.numedomeniu.ro/categorie/subcategorie/landing-page – o analiza a indexarii diferitelor foldere iti poate arata care sunt categoriile sau subcategoriile neindexate sau care sunt indexate partial.
De exemplu, introducand in caseta de cautare Google site:www.numedomeniu.ro/categorie/ (cu slash la sfarsit!), vei afla daca acea categorie este indexata de Google si, daca da, care sunt paginile indexate. De-a lungul timpului, am intalnit numeroase cazuri de site-uri in care categorii intregi nu erau indexate din cauza unor configurari gresite a platformelor de administrare.
La fel, efectuand cautarea site:numedomeniu.ro/categorie/subcategorie/ (cu slash la sfarsit), vei afla care sunt paginile indexate de Google din subcategoria respectiva.
Daca site-ul are toate fisierele incarcate la radacina site-ului, ca de exemplu https://www.numedomeniu.ro/denumire-serviciu-sau-produs, poti verifica indexarea diferitelor tipuri de pagini cu comanda site:numedomeniu.ro inurl: dupa care adaugi un identificator comun pentru toate URL-urile paginilor pentru care doresti sa verifici indexarea.
In copia de ecran de mai jos, poti vedea cum am verificat indexarea paginilor corespunzatoare produselor LEGO Star Wars de pe site-ul okazii.ro. Practic, dupa site:okazii.ro inurl: am adaugat identificatorul comun al adreselor URL corespunzatoare paginilor de produs LEGO Star Wars, in cazul de fata, lego-star-wars
Verificare indexare pagini cu site: si inurl:
5. Cauze posibile ale indexarii partiale, respectiv neindexarii site-ului
Printre cele mai frecvente cauze identificate in auditele onsite efectuate de-a lungul timpului, pentru care pagini, sectiuni sau chiar site-uri in intregime nu sunt indexate in Google, amintesc:
- accesul motoarelor de cautare este restrictionat din fisierul robots.txt. Aici gasesti o serie de informatii utile despre fisierul robots.txt si despre cum poti utiliza instructiunile specifice acestui fisier pentru o indexare optima a site-ului.
- paginile au tag-ul Meta Robots cu valorile “noindex, nofollow” sau “noindex, follow” in codul sursa (“noindex” reprezinta instructiunea de interzicere a indexarii).
Nu putine sunt cazurile in care pagini, categorii sau chiar intregul site sunt restrictionate accidental din plugin-ul de SEO prin bifarea optiunii “noindex” sau „Descurajati motoarele de cautare sa va viziteze site-ul”, dupa caz. Destul de numeroase sunt si situatiile in care se omite anularea restrictionarii indexarii odata cu lansarea site-ului aflat anterior in constructie.
- paginile nu sunt “legate” de site prin link-uri – practic, paginile exista pe site, dar nu se poate ajunge la ele prin intermediul link-urilor interne – se mai numesc si pagini orfane.
- link-ul / link-urile care trimit catre pagini nu sunt corecte (utilizatorilor li se va afisa o pagina de eroare 404).
- paginile sunt mult prea “ascunse” in arhitectura site-ului (este nevoie de multe click-uri pentru a ajunge la ele).
- nu exista fisier sitemap.xml instalat pe site care sa ajute la “descoperirea” paginilor.
- fisierul sitemap.xml instalat pe site este ignorat de Google din cauza unor erori de configurare.
Dacă dorești să rezolvi toate problemele SEO ale site-ului tău, inclusiv cele ce țin de indexare, contactează-ne aici !
6. Cum asiguram o buna indexare a site-ului in Google
Hai sa vedem care sunt metodele prin care te poti asigura ca site-ul tau este indexat de Google.
6.1 Formularul de indexare de la Google
Recomand folosirea Formularului Google mai ales pentru indexarea site-urilor noi.
Este suficient sa introduci adresa paginii de pornire (Acasa, Homepage sau Home). Nu este nevoie sa adaugi adresa fiecarei pagini din site. Pornind din Homepage, robotul Google (Googlebot) descopera si indexeaza noi pagini, prin intermediul link-urilor din site.
6.2 Indexare site cu fisier Sitemap XML
Fisierul sitemap.xml este un fisier care contine adresele paginilor pe care doresti sa le indexeze motorul de cautare, impreuna cu o serie de informatii optionale, cum ar fi prioritatea fiecarei pagini la indexare sau rata de actualizare a fiecarei pagini.
Fisierul se instaleaza la radacina site-ului (exemplu: www.numedomeniu.ro/sitemap.xml) si este al doilea fisier pe care il viziteaza Google in orice site, dupa fisierul robots.txt.
In copia de ecran de mai jos poti vedea cum arata continutul unui fisier sitemap.xml. Exemplul contine o singura adresa URL si 3 tag-uri optionale.
- <lastmod> indica data ultimei modificari a paginii;
- <changefreq> indica frecventa medie cu care este modificata pagina („daily”, „weekly”, „monthly” „yearly”).
- <priority> indica importanta paginii in cadrul site-ului pe o scara descrescatoare de la 1.0 (homepage) la 0.1.
Googlebot ignora tag-urile <changefreq> si <priority>. Tag-ul <lastmod> il ia in considerare doar daca constata, la vizite succesive, ca este actualizat corespunzator pentru fiecare pagina. Cu toate acestea, instrumentele de generare sitemap-uri xml includ sau iti ofera posibilitatea de a adauga toate cele 3 tag-uri care pot fi luate in considerare de alte motoare de cautare.
Cum creezi un fisier sitemap.xml
Poti genera un fisier sitemap.xml valid pentru site-ul tau folosind un instrument online. Iti recomand unul din aceste instrumente:
- www.xml-sitemaps.com/ – gratuit pentru site-uri care contin max. 500 de URL-uri.
- freesitemapgenerator.com/ – gratuit pentru site-uri cu max. 5.000 de URL-uri; contracost pentru max. 25.000 URL-uri.
- www.check-domains.com/sitemap/ – gratuit pentru numar nelimitat de URL-uri (in limita capacitatii de raspuns a serverului).
Alternativ, poti genera sitemap-ul xml cu un soft pe care sa-l descarci pe calculator, cum este Screaming Frog SEO Spider.
De asemenea, pe platforme CMS cum sunt WordPress, Prestashop, Open Cart, Magento etc., poti instala plugin-uri de SEO care, odata configurate, genereaza si actualizeaza automat fisierul sitemap.xml.
Este foarte important ca fisierul sitemap.xml sa contina URL-uri valide care corespund unor pagini pe care doresti sa le gaseasca utilizatorii in Google. Nu pastra in fisierul sitemap.xml adresele unor articole / pagini de produs care nu mai exista pe site (pagini care intorc codul de eroare 404). Aici gasesti mai multe informatii despre fisierul sitemap.xml.
Ce faci cu sitemap-ul xml odata creat
Odata ce ai generat fisierul sitemap.xml, incarca-l la radacina site-ului (ex: www.numedomeniu.ro/sitemap.xml). In cazul in care ai generat sitemap-ul intr-un CMS gen WordPress, nu va fi necesar sa incarci tu fisierul, acesta va fi uploadat automat de platforma.
Poți trimite sitemap-ul catre Google folosind optiunea dedicata din contul Google Search Console. Este un fel de invitatie la indexare in Google a paginilor listate in sitemap.
Este important sa scrii adresa corecta a sitemap-ului. Atentie, acesta se poate chema si altfel decat sitemap.xml (de exemplu, sitemap_index.xml) Pentru a nu gresi, acceseaza sitemap-ul pe site si copiaza-i denumirea, mai exact, partea de dupa numedomeniu.ro/.
6.3 Indexare site cu ajutorul link-urilor externe
Probabil stii ca Google si alte motoare de cautare descopera noi pagini web prin intermediul link-urilor. Odata descoperite, aceste pagini pot fi indexate, daca respecta anumite standarde.
Desi nu este indicat sa ne bazam niciodata doar pe aceasta metoda de indexare, este util sa obtinem link-uri catre site-ul nostru de pe alte site-uri relevante, mai ales ca link-urile externe sunt unul dintre factorii importanti de pozitionare in Google.
Profilele din retelele sociale (Facebook, Instagram, Google My Business, Youtube, X etc.) asociate site-ului, precum si cataloagele de afaceri sau portalurile relevante pentru domeniul de activitate sunt doar cateva exemple de site-uri unde poti include link-uri catre site-ul tau.
6.4 Indexarea rapida in Google a paginilor noi din site
Daca tocmai ai adaugat in site continut nou (produse in magazinul online sau un articol pe blog, de exemplu) si doresti ca paginile respective sa fie indexate cat mai repede de Google, poti sa-ti atingi scopul prin urmatoarele metode:
- Asigura-te ca paginile nou create sunt legate de restul site-ului prin cel putin un link care poate fi urmat de utilizatori si de motoarele de cautare. In caz contrar, paginile nu vor putea fi gasite din site de catre utilizatori si exista o probabilitate foarte mare sa nu fie indexate nici de motoarele de cautare, in ciuda aplicarii metodelor de indexare!
- Actualizarea fisierului sitemap.xml, astfel incat sa contina noile URL-uri si trimiterea sitemap-ului catre Google via Google Search Console
- Creaza una sau mai multe postari in contul Google My Business care sa contina link catre pagina / paginile nou create. Paginile respective vor fi foarte rapid indexate de catre Google.
- Optiunea “Solicitati indexarea” din contul Google Search Console – o recomand mai ales pentru indexarea mai rapida a versiunilor actualizate ale unor pagini deja indexate. Optiunea „Solicitati indexarea” se afiseaza dupa ce accesati link-ul „Verificarea adresei URL” din meniul platformei Google Search Console.
Optiune solicitare indexare pagina in Google Search Console
Sper ca informatiile oferite sa te ajute sa identifici si sa solutionezi problemele de indexare a site-ului in Google. Odata rezolvate aceste probleme, te vei putea concentra pe celelalte etape ale optimizarii site-ului, optimizarea onsite si optimizarea offsite. In oricare din etapele optimizarii SEO simti ca ai nevoie de ajutor, contacteaza-ne si te vom ajuta!