Ci rendiamo sempre più conto che l’ottimizzazione di un sito web non può prescindere dall’ottimizzazione del crawl budget di Google. In pratica chi gestisce un sito – di grandi o di piccole dimensioni non fa differenza – deve preoccuparsi ogni giorno di non far sprecare inutilmente il crawl budget a Google, o meglio non solo, deve far in modo che il crawl budget di Google nei suoi confronti sia più “cospicuo” che nei confronti dei propri competitors.
In che senso? Procediamo con ordine facendo alcune piccole premesse.
Tutto ciò che concerne il riediting dei contenuti del nostro sito deve essere improntato e influenzato da questo tipo di dogma: “far perdere tempo a Google è nocivo per il sito web che curiamo ogni giorno con gioia, apprensione, dedizione e passione”.
🙂
Detto questo, andiamo a vedere come dobbiamo comportarci in ottica SEO durante la potatura di un sito web, sempre considerando che Google non deve e non vuole sprecare inutilmente crawl budget e che noi da bravi SEO Specialist – ripetetelo a gran voce – vogliamo e dobbiamo fare qualcosa per incrementare/salvaguardare il crawl budget che Google dedica al nostro sito web.
Attenzione ad alcuni dettagli…
Come avete già potuto comprendere a volte si sente anche un po’ troppo spesso la frase “risparmiare crawl budget” che altro non è che un’espressione un po’ fuorviante, qui è corretto se mai dire “aumentare Crawl budget” che Google mette a disposizione per il nostro sito web.
…oddio in che senso?
Stiamo parlando in sostanza del lasso di tempo per cui Google è disposto ad occuparsi di noi, e sarebbe ancora più corretto precisare che “per fare questo, facciamo risparmiare tempo a Google, facendogli capire fin da subito quali sono le erbacce secche del nostro sito che non ci interessano più”…
Vedete tra potatura e crawl budget abbiamo trovato il nesso 🙂
Cos’è il Crawl Budget?
Partiamo da una definizione, cos’ è il crawl budget. Quando parliamo di crawl budget non facciamo altro che intendere il numero di volte che il bot di Google scansiona le pagine web comprese in un dominio in un determinato lasso di tempo.
Incidetevi sulla pelle questa definizione.
“Tagliamo le erbacce del nostro sito” e vediamo quali sono oggi i rimedi possibili: 301, 404, noindex/disallow, riediting del contenuto
Abbiamo analizzato 5 circostanze che chi si trova dinnanzi a contenuti da rieditare potrà sempre tenere a mente e non solo, potrà applicare il tutto al caso di specie tenendo fede alle concause e alle situazioni analizzate.
Spesso e volentieri quando andiamo di “potatura” ci ritroviamo di fronte a:
- 1) articolo/pagina mal posizionato con la keyword di riferimento o che più che altro non soddisfa l’intento di ricerca.
- 2) articolo/pagina posizionato con una keyword che è ancora salvabile
- 3) articolo/pagina non indicizzato
- 4) articolo/pagina nel limbo (non posizionato, ma presente nell’indice su Google)
- 5) articolo/pagina che non ci interessa più sia a livello di keyword che di contenuto
Riediting del Contenuto: quando, come e perché
Togliamoci subito il pensiero così i SEO Copywriter hanno già finito di leggere l’articolo.
A parte gli scherzi, quando ha senso intervenire lato contenuto? Solo in alcuni casi, proprio perché alcuni contenuti è meglio tagliarli via, farli annegare tra gli abissi del web e non pensarci più…. 🙁
Quando il posizionamento è situato tra la 35° e la 1° posizione allora facciamo SEO on Site lato contenuto. Questo è il dogma principale… lo avete già inciso sulla vostra pelle?
… ma ATTENZIONE, e se invece siamo oltre la 35° posizione… ?
301
Possiamo applicare un Redirect 301 quando:
- quando la medesima keyword è posizionata male in rapporto ad un’altra URL che è posizionata meglio (in sostanza si evita la cannibalizzazione…)
- quando abbiamo un piccolo posizionamento pertanto irrilevante, ovverosia parole chiave cercate da 20, 30, persone al mese, e magari questo posizionamento ricade su una kw correlata ad una principale posizionata più in alto. Ecco che in questo caso il Redirect diventa anche un micro incremento di “juice” tipico dei link interni, in pratica ci “reinderizziamo addosso la pagina che vogliamo cancellare” proprio come se ci mandassimo un link interno verso la pagina/URL che riteniamo dominante.
Quando si fa un 301 durante la potatura di un sito web, tenete sempre presente che siamo di fronte ad uno strumento ottimo quando vogliamo:
- salvare il posizionamento della URL pregressa,
- rinforzare il posizionamento della URL ospitante
Per farlo in modo corretto: bisogna sempre procurarsi una pagina di appoggio capace di accogliere a livello tematico/sarch intent la URL che verrà reindirizzata e comunque dobbiamo sempre tenere presente che, nel bene e nel male, un piccolo sforzo a livello di crawl budget ecco che Google lo pone in essere quando si tratta di redirect. Il 301 è pertanto un ottimo intervento ma non è il più leggero in assoluto in termini di crawl budget!
404
Sì ci sono anche le pagine 404 in questa trattazione 🙂
Applichiamo invece un “404” – banalmente mettiamo nel Cestino su WP la pagina di un contenuto che non ci serve più – quando siamo di fronte a:
- articoli non indicizzati* in realtà agire su un articolo manco presente nell’indice di Google è comunque un paradosso e non ha senso… però se proprio vogliamo far perdere tempo a Google…. 🙂 (non fatelo, perdete tempo anche voi stessi!)
- articoli che sono nel limbo tra il mancato posizionamento e la non indicizzazione: si intende articoli che non portano niente lato traffico ma che sono comunque presenti nell’indice di Google (articoli posizionati con keyword ben oltre la 40° posizione)
- articoli mal posizionati per la keyword che ci siamo posti fin dall’inizio come obiettivo
- articoli frutto di posizionamenti casuali, keyword che non ci interessa avere nelle prime pagine di Google
Se eliminiamo e dunque mettiamo nel cestino determinate URL/contenuti ecco che Google smaltirà da solo questi contenuti deindicizzandoli se è il caso.
Questa azione è pericolosa in termini di UI e UX (specie se dalla tua homepage sorgono innumerevoli link che portano a 404, inoltre nel contesto di un sito se si sta facendo tanta potatura non si può pensare di “ranzare” tutto così in questi termini solo perché è comodo a livello di crawl budget: nel senso ci vuole una certa cautela quando “creiamo di nostra sponte” dei 404!).
Abbiamo capito dunque che non non bisogna esagerare di 404 ma che bisogna saperli dosare all’interno del nostro sito, del resto Google sul versante 404 non è più severo come un tempo…
Peraltro sempre su WP quando si procede a “mettere pagine e articoli nel Cestino” ecco che SEO Yoast comunque toglie in automatico la URL dalla Sitemap, in pratica il contenuto resta soltanto nel DB ma non esiste più come pagina vera e propria percepibile da Google.
Non è poco, nel senso, stiamo parlando di una potatura pressoché definitiva in questo caso e che per forza di cose non pesa in termini di scansione e di crawl budget.
Ancora un ultimo sforzo…
Noindex
- Quando un articolo è indicizzato e ben posizionato e non lo volete più nell’indice di Google
- Quando un articolo è mal posizionato oltre la 40/50 posizione*
ecco che possiamo utilizzare il Noindex!
Ma attenzione, qui la faccenda si complica… facciamo ordine:
- articolo mal posizionato che volete espellere dall’indice
- articolo mal posizionato
nella prima delle ipotesi il noindex assolve alla sua funzione naturale: strappare via la URL dall’indice di Google... nell’ultima ipotesi invece è meglio utilizzare un 404 oppure un noindex? Eh lo so, qui viene il bello… voi infatti vi state chiedendo… quando è meglio usare un noindex e quando invece un 404?
Non esiste una regola precisa e ferrea, bisogna però tenere sempre presente che:
- Il noindex fa dannare eccome Google a livelli di crawl budget anche se al tempo stesso conserva all’apparenza una situazione stabile e dunque non di pericolo per la corretta UI di un sito lato utente. Vi ricordate.. prima vi avevamo detto, “dosate i 404, troppi fanno casino, pochi vanno bene” in termini di Usability.
- d’altro canto inserire diversi 404 è vero che non urta a livello di crawl budget ma non si può dire che è un ottima soluzione a livello di UI/UX
Disallow
ma attenzione e…. il nostro amico “Disallow”?
Ed eccoci di fronte ad un “altro nodo della potatura”… se il noindex è un provvedimento pesante e complesso in termini di crawl budget ecco che ci aiuta il Disallow a dirimere “tutti i casini” a livello di crawl che ci combina il noindex. Il Disallow secondo ormai la SEO moderna è il miglior provvedimento in assoluto per quanto riguarda il “non far sprecare crawl budget a Google”… ok,
però si deve sempre tener presente che il Disallow è un provvedimento che:
- è applicabile soltanto all’interno del file robots.txt (mentre il noindex si applica sempre all’interno della specifica pagina di riferimento, in sostanza “mai alla radice del sito”)
Il Disalllow non è un provvedimento che lede l’indicizzazione di una singola URL, nel senso, Google non perderà più tempo con la URL tacciata di Disallow proprio perché molto semplicemente eviterà di scansionarla! Badate bene che qualche utente potrebbe comunque intercettare la medesima URL nell’indice proprio perché il Disallow non la deindicizza. Il Disallow è in sostanza un provvedimento che ab origine dice a Google di non perdere tempo con quel determinato ramo del sito, tutto qui ;):
Approfondimenti su Disallow e Noindex
Conclusioni
So benissimo che alla fine di questo delirio alcuni rimarranno confusi e sbigottiti.
Il punto è che la “potatura” di un sito web quando orientata al risparmio del crawl budget è argomento complesso che lascia “basiti “più di un SEO Specialist e soprattutto, come vedete, le soluzioni per interventi corretti e performanti non mancano e sono tutte su per giù ricche di pro e di contro, nel senso, non esiste una soluzione nettamente migliore dell’altra… accettatelo, a volte nella SEO è semplicemente così.
Articolo realizzato con la collaborazione di Saverio Bruno di Saverio Web