Indicizzare un sito web su Google, come fare?
Cos’è l’indicizzazione, le differenze con il posizionamento e come “aiutare” Google ad indicizzare il proprio sito web
Uno degli aspetti fondamentali che accompagna la creazione di un sito web professionale riguarda proprio la sua indicizzazione sui motori di ricerca e, nello specifico, su Google.
Il colosso di Mountain View è sempre attento a qualsiasi cosa si affacci sul mondo del web e quasi tutti i siti professionali vengono riportati automaticamente e velocemente fra i risultati delle sue ricerche.
Ma non è sempre così.
Al giorno d’oggi, lo sviluppo di un sito web e la sua pubblicazione sono operazioni che possono essere svolte anche dai meno esperti.
Ma un conto è “costruire” un sito internet, un altro conto è fare in modo che esso risulti visibile e accessibile agli altri utenti della rete, mentre ancora più complesso è ottenere un buon posizionamento per le parole chiave che ci interessano.
1. Cos’è l’indicizzazione del sito web
e le differenze con il posizionamento sui motori di ricerca
Un errore molto comune, commesso spesso dai meno esperti in ambito SEO e di gestione siti web, è quello di confondere l’indicizzazione con la fase di posizionamento sui motori di ricerca.
Quando una web agency pubblica in rete un nuovo sito Web, quest’ultimo non ha bisogno di essere conosciuto solo dagli utenti ma anche e soprattutto dai motori di ricerca. Fino a quando il sito web non verrà indicizzato su Google, non apparirà mai nei risultati dei motori di ricerca, risultando quindi inaccessibile agli utenti.
L’indicizzazione quindi è relativa all’inserimento dei nuovi contenuti nelle SERP di Google (in altre parole i “risultati” del motore di ricerca), mentre il posizionamento è lo step successivo, è molto di più. Comprende una serie di accorgimenti che il web designer attua per dare “maggiore visibilità” al sito web (tra cui l’ottimizzazione dei contenuti e del codice) affinché le pagine web raggiungano la prima pagina nei risultati di ricerca per le parole chiave d’interesse.
Di solito, l’indicizzazione di un nuovo sito web da parte degli spider o crawler di Google (Googlebot) avviene in completa autonomia. Questi software (detti anche bot) hanno il compito di scandagliare internet alla ricerca di nuovi link, nuove pagine, nuovi contenuti da registrare ed aggiungere all’indice di Google.
Da questo concetto scaturiscono due importanti considerazioni:
- Per facilitare il lavoro degli spider ed essere indicizzati nel minor tempo possibile, sarebbe meglio essere linkati da un sito già ben indicizzato presente in rete.
- Durante la fase di indicizzazione, Googlebot cerca anche di capire la frequenza con cui il sito viene aggiornato, in base a questo “tasso di aggiornamento” decide poi ogni quanto tempo rivisitarlo.
Da questo concetto si intuisce l’importanza del “mantenere frequentemente aggiornato” il proprio sito web perché è uno dei modi per indurre Googlebot a “passare più spesso”.
2. Come “aiutare” Google ad indicizzare il tuo sito web
I modi per inserire un sito su Google e per indicizzare un sito web sono molti, vediamone alcuni.
2.a. Creare una sitemap per indicizzare il proprio sito
La Sitemap è uno strumento che Google mette a disposizione di ogni web designer per accelerare la procedura di “spiderizzazione” del proprio sito, soprattutto se si hanno molte pagine da indicizzare. La Sitemap è un file in formato XML contenente tutte le URL del sito, che viene caricato all’interno del proprio spazio web e che comunica a Google le “novità” relative al nostro sito web. In questo modo Google avrà una panoramica completa di tutte le pagine da indicizzare.
La corretta implementazione del file sitemap . xml, effettuata secondo un protocollo standardizzato (disponibile all’indirizzo http://sitemaps.org/it), garantisce la corretta trasmissione dei dati fra il Crawler di Google e il proprio sito, favorendone così la velocità di scansionamento.
Ed inoltre, siccome il Protocollo Sitemap è un progetto indipendente, la Sitemap inserita nel proprio sito sarà valida non solo per Google, ma anche per gli altri motori di ricerca.
Per inviare la mappa del sito a Google è necessario accedere alla “Google Search Console” indicando il percorso corretto della sitemap (all’interno del nostro spazio web).
2.b. Indicizzare manualmente e gratis un sito segnalando l’URL a Google
Un altro modo gratuito per indicizzare un sito o una pagina web è segnalare il contenuto “manualmente” a Google.
E’ possibile infatti comunicare direttamente a Google, attraverso la “Google Search Console” (ex Webmaster Tools), la presenza di un nuovo sito attraverso il modulo “Add URL”, “Inserisci URL” o “controlla URL” (nella nuovissima Search Console). Qui è sufficiente inserire la home page (o qualsiasi altra pagina) del proprio sito e richiederne l’indicizzazione. Il sistema è molto intuitivo, semplice ed efficace.
Inviata la richiesta la Search Console di Google inserisce l’URL nella coda delle pagine che Googlebot deve scansionare. L’indicizzazione Google di nuovi URL infatti avviene relativamente in fretta (un paio d’ore al massimo), non è così per le richieste di reindicizzazione di un URL esistente, che è decisamente più lenta.
E’ bene precisare che questo strumento non influisce sul posizionamento (quindi sulla maggiore visibilità) che la pagina poi raggiungerà una volta ottenuto l’inserimento nell’indice di Google, ne sul tasso medio di aggiornamento del sito (stabilito autonomamente da Googlebot).
3. Altre risorse e conoscenze utili sull’argomento indicizzazione su Google
3.a. Gli RSS
Un altro metodo utilizzato da Google per l’indicizzazione di nuovi siti web sono gli RSS.
Da Wikipedia:
“RSS (sigla di RDF Site Summary, spesso riportato come Really Simple Syndication o Rich Site Summary) è uno dei più popolari formati per la distribuzione di contenuti Web; è basato su XML. L’applicazione principale per cui è noto sono i flussi che permettono di essere aggiornati su nuovi articoli o commenti pubblicati nei siti di interesse senza doverli visitare manualmente uno a uno.”
Con l’arrivo degli RSS i tempi di indicizzazione, che prima erano molto lunghi (soprattutto per i siti editoriali), hanno subito una drastica riduzione giungendo a sole poche ore dalla pubblicazione di un nuovo contenuto.
3.b. Il file Robots.txt e l’indicizzazione
Quando si parla di indicizzazione è bene sapere a cosa serve il file Robots.txt.
Quando si progetta un nuovo sito web, soprattutto quando si realizza un sito web con WordPress o un altro CMS, si può avere la necessità di rendere non visibili al motore di ricerca alcune sezioni o pagine del proprio sito (per esempio quando si vuole nascondere l’area di amministrazione – back-end – del proprio sito). Attraverso la collocazione nella cartella principale del proprio sito del file Robots.txt, con semplici comandi, possiamo dire esplicitamente quali aree il motore di ricerca deve indicizzare oppure no.
La corretta formattazione e creazione di questo file (Robots.txt) ed anche del file “.htaccess” rappresenta un’aspetto molto importante da considerare nella gestione del proprio sito web, soprattutto quando si utilizza un CMS (ad esempio WordPress). L’abbinamento infatti di WordPress con plugin che interagiscono o modificano questi file potrebbe influire negativamente sull’indicizzazione di alcune risorse del nostro sito web. Questo aspetto è molto importante per l'”indicizzazione sito WordPress”.
3.c. Link, indicizzazione, visibilità del sito e Social Network
Abbiamo visto che farsi linkare da siti autorevoli aiuta a velocizzare il processo di indicizzazione.
A questo proposito un’ottima risorsa che abbiamo a disposizione è utilizzare i social network: far conoscere un sito appena creato sui social network (Facebook, Twitter, Pinterest, LinkedIn, ecc.) è un metodo efficace per aumentare la visibilità del sito e la velocità di indicizzazione dei contenuti.
Anche collegare il sito da blog aziendali e forum tematici ha la sua importanza.
3.d. Come verificare la corretta visibilità e indicizzazione di un sito web su Google
Sono moltissimi i servizi online che ci permettono di verificare lo stato di indicizzazione del nostro sito. Questi servizi, oltre a verificare se il sito risulta indicizzato, ci danno a volte anche una indicazione sulle possibili cause di una mancata o difficile indicizzazione.
In realtà possiamo utilizzare direttamente Google per verificare lo stato d’indicizzazione di un sito web, attraverso l’operatore di ricerca “site:”. Digitando infatti nella barra di ricerca di Google “site:nomedelmiodominio.it” si possono trovare tutte le pagine già indicizzate (di quel dominio) e di conseguenza quelle che non lo sono.
Questa analisi può aiutarci a capire meglio se il nostro sito web ha qualche problema oppure no.
Una non corretta indicizzazione ci induce a pensare innanzitutto che Googlebot non riusce ad “analizzare” un determinato sito. A questo proposito gli ostacoli incontrati dagli spider possono essere molteplici.
Secondo la nostra esperienza nella maggior parte delle volte questi impedimenti risiedono in una errata configurazione dei file Sitemap, Robots.txt ed .htaccess. In casi meno ricorrenti le cause vanno rintracciate altrove.
Se non si possiedono le giuste competenze per affrontare queste problematiche è consigliabile rivolgersi ad esperti per la soluzione di questi inconvenienti. Infatti, il rischio connesso “al fai da te” è che si possa peggiorare ulteriormente la situazione, soprattutto se si usa un CMS come WordPress.
3.e. L’indicizzazione e le guide di Google
Oltre alle informazioni che ti ho fornito in questa guida, ci sono tantissime altre risorse utili per indicizzare ed inserire la tua pagina web su Google (e capire come lo indicizza) dopo la realizzazione di un sito web, le trovi online. Ma le guide ufficiali di Google sono decisamente le risposta migliore a qualsiasi nostro quesito sul motore di ricerca stesso:
4. Quali sono i tempi di indicizzazione dei nuovi contenuti?
Abbiamo visto che c’è differenza fra un sito appena creato e un sito già avviato, in entrambi i casi non è possibile dare dei tempi certi.
Un sito appena pubblicato deve “aspettare” il passaggio di Googlebot ed è quindi molto importante implementare tutte le strategie che abbiamo visto nei paragrafi precedenti in modo tale che l’indicizzazione avvenga nel minor tempo possibile. Con tutti questi accorgimenti l’indicizzazione del proprio sito potrebbe avvenire addirittura in poche ore. In caso contrario potrebbero essere necessarie molte settimane prima che il sito venga scansionato e indicizzato.
Per quanto riguarda i nuovi contenuti la velocità di indicizzazione è collegata soprattutto, come abbiamo visto prima, al tasso di aggiornamento attribuito da Google e quindi alla frequenza con cui il motore di ricerca verrà a visitare il nostro sito.
ATTENZIONE!
Il ranking del sito, la qualità dei contenuti e la loro l’ottimizzazione in ottica SEO, in altre parole … quanto il nostro sito piace a Google … sono fattori che influiranno sull’attenzione che il motore di ricerca avrà nei confronti del nostro sito, velocizzandone l’indicizzazione.