Elementele de bază ale modului în care funcționează indexarea motoarelor de căutare

Publicat: 2022-04-17

Optimizarea pentru motoarele de căutare (SEO) este o modalitate esențială de a crește vizibilitatea site-ului dvs. și de a atrage mai mult trafic organic. Cu toate acestea, este o strategie complexă care se bazează pe înțelegerea algoritmilor și pe utilizarea unei game largi de factori de clasare. Dacă doriți să deveniți un expert SEO, va trebui să înțelegeți indexarea motoarelor de căutare.

În această postare, vom explica modul în care motoarele de căutare indexează site-urile web și cum vă puteți crește clasamentul. De asemenea, vom răspunde la câteva întrebări frecvente despre acest concept SEO. Să începem!

Ce este indexarea motoarelor de căutare?

Indexarea motoarelor de căutare se referă la procesul prin care un motor de căutare (cum ar fi Google) organizează și stochează conținut online într-o bază de date centrală (indexul acesteia). Motorul de căutare poate apoi să analizeze și să înțeleagă conținutul și să îl ofere cititorilor în listele clasate din paginile sale de rezultate ale motorului de căutare (SERP).

Înainte de a indexa un site web, un motor de căutare folosește „crawlerele” pentru a investiga link-urile și conținutul. Apoi, motorul de căutare preia conținutul accesat cu crawlere și îl organizează în baza de date:

Indexarea motoarelor de căutare explicată.

Sursa imagine: Seobility – Licență: CC BY-SA 4.0

Vom privi mai atent cum funcționează acest proces în secțiunea următoare. Deocamdată, te poate ajuta să te gândești la indexare ca la un sistem de fișiere online pentru postările și paginile site-ului web, videoclipuri, imagini și alt conținut. Când vine vorba de Google, acest sistem este o bază de date enormă cunoscută sub numele de index Google.

Cum indexează un site un motor de căutare?

Motoarele de căutare precum Google folosesc „crawlerele” pentru a explora conținutul online și a-l clasifica. Aceste crawler-uri sunt roboți software care urmăresc linkuri, scanează pagini web și obțin cât mai multe date despre un site web. Apoi, ei livrează informațiile către serverele motorului de căutare pentru a fi indexate:

Crawler pentru motorul de căutare

Sursa imagine: Seobility – Licență: CC BY-SA 4.0

De fiecare dată când conținutul este publicat sau actualizat, motoarele de căutare îl accesează cu crawlere și îl indexează pentru a adăuga informațiile acestuia în bazele lor de date. Acest proces se poate întâmpla automat, dar îl puteți accelera prin trimiterea sitemap-urilor la motoarele de căutare. Aceste documente descriu infrastructura site-ului dvs., inclusiv link-uri, pentru a ajuta motoarele de căutare să acceseze cu crawlere și să vă înțeleagă conținutul mai eficient.

Crawlerele motoarelor de căutare operează cu un „buget de accesare cu crawlere”. Acest buget limitează câte pagini roboții vor accesa cu crawlere și vor indexa pe site-ul dvs. web într-o perioadă stabilită. (Totuși, se întorc.)

Crawlerele compilează informații despre date esențiale, cum ar fi cuvintele cheie, datele publicării, imaginile și fișierele video. Motoarele de căutare analizează, de asemenea, relația dintre diferite pagini și site-uri web, urmărind și indexând link-uri interne și URL-uri externe.

Rețineți că crawlerele motoarelor de căutare nu vor urmări toate adresele URL de pe un site web. Ei vor accesa cu crawlere automat linkurile dofollow, ignorând echivalentele lor nofollow. Prin urmare, veți dori să vă concentrați pe link-urile dofollow în eforturile dvs. de creare a link-urilor. Acestea sunt adrese URL de pe site-uri externe care indică conținutul dvs.

Dacă linkurile externe provin din surse de înaltă calitate, ele își vor transmite „sucul de linkuri” atunci când crawlerele le urmăresc de pe alt site pe al tău. Ca atare, aceste adrese URL vă pot îmbunătăți clasarea în SERP-uri:

Sucul de legături

Sursa imagine: Seobility – Licență: CC BY-SA 4.0

În plus, rețineți că anumite conținuturi nu pot fi accesate cu crawlere de motoarele de căutare. Dacă paginile dvs. sunt ascunse în spatele formularelor de conectare, parolelor sau dacă aveți text încorporat în imagini, motoarele de căutare nu vor putea accesa și indexa acel conținut. (Totuși, puteți utiliza text alternativ pentru ca aceste imagini să apară în căutări pe cont propriu.)

4 instrumente pentru indexarea motoarelor de căutare

Puteți folosi mai multe instrumente pentru a ghida modul în care Google și alte motoare de căutare vă accesează cu crawlere și indexează conținutul. Să ne uităm la câteva dintre cele mai utile opțiuni!

1. Sitemaps

Rețineți că există două tipuri de hărți de site: XML și HTML. Poate fi ușor să confundați aceste două concepte, deoarece ambele sunt tipuri de hărți de site care se termină în -ML , dar au scopuri diferite.

Hărțile de site HTML sunt fișiere ușor de utilizat, care listează tot conținutul de pe site-ul dvs. web. De exemplu, veți găsi de obicei unul dintre aceste hărți de site în subsolul unui site. Derulați până la capăt pe Apple.com și veți găsi aceasta, o hartă HTML a site-ului:

Un exemplu de hartă de site HTML pe site-ul Apple

Această hartă a site-ului permite vizitatorilor să navigheze cu ușurință pe site-ul dvs. Acționează ca un director general și vă poate influența pozitiv SEO și poate oferi o experiență de utilizare solidă (UX).

În schimb, un sitemap XML conține o listă cu toate paginile esențiale de pe site-ul dvs. Trimiteți acest document motoarelor de căutare, astfel încât acestea să poată accesa cu crawlere și indexa conținutul dvs. mai eficient:

Un exemplu de hartă de site XML

Rețineți că ne vom referi la documente XML atunci când vorbim despre sitemap-uri în acest articol. De asemenea, vă recomandăm să consultați ghidul nostru pentru crearea unui sitemap XML, astfel încât să aveți documentul pregătit pentru diferite motoare de căutare.

2. Google Search Console

Dacă doriți să vă concentrați eforturile SEO pe Google, Google Search Console este un instrument esențial de stăpânit:

Google Search Console.

În consolă, puteți accesa un raport de acoperire a indexului, care vă spune ce pagini au fost indexate de Google și evidențiază orice probleme în timpul procesului. Aici puteți analiza adresele URL cu probleme și le puteți depana pentru a le face „indexabile”.

În plus, puteți trimite harta site-ului dvs. XML la Google Search Console. Acest document acționează ca o „foie de parcurs” și ajută Google să indexeze conținutul dvs. mai eficient. În plus, puteți cere Google să acceseze din nou cu crawlere anumite adrese URL și părți ale site-ului dvs., astfel încât subiectele actualizate să fie întotdeauna disponibile pentru publicul dvs., fără a aștepta ca crawlerele Google să se întoarcă pe site-ul dvs.

3. Console alternative pentru motoare de căutare

Deși Google este cel mai popular motor de căutare, nu este singura opțiune. Limitarea la Google vă poate închide site-ul pentru traficul din surse alternative, cum ar fi Bing:

Bing

Vă recomandăm să consultați ghidurile noastre despre trimiterea sitemapurilor XML către Bing Webmaster Tools și Yandex Webmaster Tools. Din păcate, alte motoare de căutare, inclusiv Yahoo și DuckDuckGo, nu vă permit să trimiteți sitemap-uri.

Rețineți că fiecare dintre aceste console oferă instrumente unice pentru monitorizarea indexării site-ului dvs. și a clasamentelor în SERP-uri. Prin urmare, vă recomandăm să le încercați dacă doriți să vă extindeți strategia SEO.

4. Robots.txt

Am explicat deja cum puteți utiliza o hartă a site-ului pentru a le spune motoarele de căutare să indexeze anumite pagini de pe site-ul dvs. În plus, puteți exclude anumite conținuturi utilizând un fișier robots.txt .

Un fișier robots.txt include informații de indexare despre site-ul dvs. Este stocat în directorul rădăcină și are două linii: o linie user-agent care specifică un crawler pentru motorul de căutare și o directivă disallow care blochează anumite fișiere.

De exemplu, un fișier robots.txt poate arăta cam așa:

 Agent utilizator: *
Nu permiteți: /example_page/
Nu permiteți: /example_page_2/

În acest exemplu, * acoperă toate crawlerele motoarelor de căutare. Apoi, liniile interzise specifică anumite fișiere sau căi URL.

Trebuie doar să creați un fișier text simplu și să îl denumiți robots.txt . Apoi, adăugați datele de respingere și încărcați fișierul în directorul rădăcină cu un client FTP (File Transfer Protocol).

Întrebări frecvente

Până acum, am acoperit elementele de bază ale indexării motoarelor de căutare. Dacă mai aveți întrebări despre acest concept SEO, le vom răspunde aici! (Și dacă mai aveți unul, anunțați-ne în comentarii ca să putem răspunde acolo!)

Cum pot fi indexat mai bine de motoarele de căutare?

Puteți fi indexat mai bine de motoarele de căutare creând sitemap-uri, auditându-le pentru erori de accesare cu crawlere și trimițându-le către mai multe motoare de căutare. În plus, ar trebui să luați în considerare optimizarea conținutului pentru dispozitive mobile și reducerea timpilor de încărcare pentru a accelera accesarea cu crawlere și indexarea.

Actualizarea frecventă a conținutului poate alerta motoarele de căutare să acceseze cu crawlere și să indexeze paginile „noile”. În cele din urmă, vă recomandăm să împiedicați motoarele de căutare să acceseze cu crawlere conținut duplicat utilizând un fișier robots.txt sau ștergându-l.

Trebuie să solicit motoarelor de căutare să îmi acceseze cu crawlere site-ul?

Motoarele de căutare vor accesa cu crawlere noul conținut disponibil public pe internet, dar acest proces poate dura săptămâni sau luni. Prin urmare, ați putea prefera să accelerați lucrurile trimițând un sitemap la motoarele de căutare alese.

Trebuie să alertez motoarele de căutare dacă public conținut nou?

Vă recomandăm să vă actualizați harta site-ului atunci când publicați conținut nou. Această abordare asigură că postările tale vor fi accesate cu crawlere și indexate mai rapid. Vă recomandăm să utilizați un plugin precum Yoast SEO pentru a genera sitemap-uri cu ușurință.

Conținutul meu este vreodată eliminat de pe Google sau din alte motoare de căutare?

Google ar putea elimina o postare sau o pagină din indexul său dacă conținutul încalcă termenii și condițiile acestuia. Aceasta înseamnă că conținutul încalcă confidențialitatea, defăimarea, drepturile de autor sau alte legi în multe cazuri. De asemenea, Google elimină datele personale din indexul său, cum ar fi informațiile financiare sau medicale identificabile. În cele din urmă, Google ar putea penaliza paginile care folosesc tehnici SEO black hat.

Cum pot obține conținutul meu reindexat dacă a fost eliminat?

Puteți cere Google să vă reindexeze conținutul modificându-l pentru a respecta regulile de calitate ale motorului de căutare pentru webmasteri. Apoi, puteți trimite o cerere de reevaluare și puteți aștepta să vedeți răspunsul Google.

Cum pot împiedica motoarele de căutare să indexeze anumite pagini?

Puteți împiedica motoarele de căutare să indexeze anumite pagini adăugând o metaetichetă noindex la secțiunea <head> a paginii. Ca alternativă, dacă conținutul dvs. este un fișier media, îl puteți adăuga la un fișier robots.txt . În cele din urmă, Instrumentele Google pentru webmasteri vă permit să ascundeți o pagină utilizând instrumentul Eliminare adrese URL.

Concluzie

SEO este un domeniu larg care acoperă totul, de la algoritmii motoarelor de căutare până la tehnicile de optimizare off-page. Dacă ești nou în acest subiect, s-ar putea să te simți copleșit de toate informațiile. Din fericire, indexarea este unul dintre conceptele mai ușor de înțeles.

Indexarea motoarelor de căutare este un proces esențial care organizează conținutul site-ului dvs. într-o bază de date centrală. Crawlerele motoarelor de căutare analizează conținutul și arhitectura site-ului dvs. pentru a-l clasifica. Apoi, ei vă pot clasa paginile în paginile lor de rezultate pentru anumiți termeni de căutare.

Mai aveți întrebări despre indexarea motoarelor de căutare? Anunțați-ne în secțiunea de comentarii de mai jos!

Imagine prezentată prin Sammby / shutterstock.com