Sei pronto a scoprire come un Content Delivery Network può cambiare le sorti del tuo sito?
Wow, allora resta con noi fino alla fine di questo articolo.
Qui su Wonize, ti raccontiamo in modo divertente e semplice come mai un CDN può fare la differenza per la tua strategia SEO.
E, occhio ai trabocchetti: a volte un CDN può causare problemi!
Ne abbiamo parlato anche in questo articolo:
Usare una CDN senza danneggiare la SEO.
Che cos’è un CDN?
Un Content Delivery Network (CDN) è un servizio che “congela” o “memorizza” il tuo sito su tanti server sparsi in giro per il mondo. Quando un utente chiede la tua pagina, il CDN la serve dal server più vicino.
Immagina un amico, che abita vicino al tuo cliente, con in casa una copia del tuo sito. Così, invece di dover fare chilometri (o meglio, “hops” di rete) per arrivare al tuo server principale, la pagina viene spedita dal server CDN più vicino. Risultato? Meno tempo di attesa, più velocità!
“Ma perché si usa?” ti starai chiedendo. Beh, l’idea è semplice: ridurre la distanza. Un CDN può salvare la vita al tuo sito se hai visitatori da tutto il pianeta. Meno latenza, più felicità per tutti.
Come un CDN sblocca un Crawling Extra
Non è solo questione di utenti soddisfatti.
Google ha spiegato che quando rileva che le pagine vengono servite da un CDN, tende ad aumentare la frequenza di scansione con Googlebot.
Wow, un bot che diventa più avido di pagine!
I consulenti SEO e i proprietari di siti adorano questa notizia.
Più crawling può significare che nuove pagine o aggiornamenti vengono indicizzati più in fretta.
Il concetto di “throttling” di Googlebot
Normalmente, Googlebot controlla quanto può spingersi sul tuo server prima di rallentarlo. Se vede che rischia di mandarlo in tilt, riduce la velocità di crawling.
Questa limitazione prende il nome di “throttling”. Ma se il bot si accorge che dietro c’è un CDN robusto, allora il freno si allenta. E così tante pagine vengono scansionate in un colpo solo.
Fantastico, vero? Sì, a patto che tutto funzioni a dovere.
Attento alla “Cache Fredda”
C’è un piccolo dettaglio che Google ama sottolineare.
Quando un CDN non ha mai visto una pagina prima, la cosiddetta “cache” è “fredda”. La prima volta, la pagina dovrà comunque essere servita dal tuo server originario per “scaldare” la cache del CDN.
Se hai, per esempio, “un milione di URL”, tutti quei link dovranno essere serviti almeno una volta dal tuo server, prima che il CDN possa realmente dare una mano. Questo significa che, durante il primo caricamento, Googlebot potrebbe dover aspettare il tuo server principale. Se lanci tante pagine nuove, potresti notare picchi di crawl. Tieni gli occhi aperti!
La “cache fredda” di un CDN funziona come la cucina di un ristorante che prepara ogni piatto solo su richiesta: finché il CDN non ha già una copia della pagina, deve rivolgersi al server principale per farsi inviare il contenuto.
In pratica, la prima volta che qualcuno (o Googlebot) visita una pagina nuova, il CDN non può consegnarla subito perché non ne possiede ancora una copia pronta.
Deve quindi chiederla al server originario, “scaldarla” e poi memorizzarla.
Se pubblichi migliaia di nuove pagine in un solo colpo, ogni pagina dovrà essere caricata almeno una volta dal server principale, generando un picco di richieste e di carico.
Quando la cache viene “riscaldata” e le pagine sono già memorizzate, il CDN può servirle più in fretta, alleggerendo il lavoro del tuo server e velocizzando la consegna dei contenuti agli utenti.
Quando i CDN ti remano contro
Eh già, ci sono anche lati negativi.
A volte, un CDN può mettere Googlebot nella lista nera e bloccare tutto.
Questo succede per vari motivi di sicurezza, ad esempio se il CDN percepisce attività insolite (un alto volume di richieste in un breve lasso di tempo).
Google definisce questo come un doppio scenario:
- Hard blocks.
- Soft blocks.
Hard blocks
Un hard block si verifica quando il CDN risponde con un grosso errore del server, tipo “500” (server error interno) o “502” (bad gateway).
Tradotto: Googlebot vede questi segnali e si spaventa. Pensa: “Caspita, c’è un casino sul server, meglio andarci piano.” Di conseguenza, riduce o interrompe il crawling. Se questi errori si ripetono troppo a lungo, Googlebot potrebbe smettere di indicizzare le pagine. In pratica, allarme rosso!
Se proprio devi inviare un messaggio di indisponibilità a Google, il codice giusto è “503”. Questo dice a Big G: “Tranquillo, è un problema temporaneo”.
Altra situazione spinosa è quando il server risponde con un “200” (cioè “Tutto OK!”) ma in realtà sta restituendo una pagina d’errore. In parole povere, Google legge una pagina “Vuota” o di errore come se fosse un contenuto valido. Che guaio! Potrebbe considerare queste pagine tutte uguali e cestinarle come se fossero contenuti duplicati. Recuperare da questo errore è più difficile che scalare l’Everest in infradito.
Soft blocks
Un soft block può accadere quando il CDN mostra un pop-up “Sei un umano?” a Googlebot. Questi cosiddetti “bot interstitials” dovrebbero in teoria comunicare un errore “503”. Così Google capisce che la pagina è momentaneamente bloccata. Altrimenti, l’IA di Mountain View vedrà solo il pop-up e penserà che il tuo sito non abbia alcun contenuto di valore. Non proprio l’effetto che vorresti, giusto?
Come verificare la situazione
Vuoi capire se il CDN sta rovinando tutto?
Usa lo strumento di ispezione URL nella Google Search Console. Metti l’URL interessato, vedi cosa ti risponde Google e scoprilo subito. Se il firewall del CDN (WAF) blocca alcune richieste, potresti vedere che Googlebot riceve errori o viene bandito. Controlla la lista degli IP bloccati e confrontala con la lista ufficiale degli IP di Google. Qualcuno di questi fa parte della tua black list? Ops, ecco spiegato il perché non vieni indicizzato.
Google suggerisce di fare ogni tanto un bel check per assicurarti che i crawler importanti possano accedere liberamente alle pagine del sito. Ricorda, la blacklist potrebbe riempirsi in automatico senza che tu te ne accorga.
CDN e scalabilità: un’amicizia da coltivare
Se ben configurato, un CDN non è male.
Ti dà un boost di velocità, ti fa guadagnare punti con Googlebot e rende i tuoi utenti felici.
Ma se cadi nella trappola di bloccare accidentalmente l’IP di Googlebot, tutto si trasforma in un disastro SEO.
Prevenire è meglio che curare: tieni sempre la guardia alta.
Non farti ingannare dai “Bot Interstitials”
Google si aspetta che, di fronte a un controllo umano, venga restituito un “503”. Se non succede, l’index potrebbe scomparire come polvere al vento. Meglio perderci qualche minuto a configurare correttamente il WAF piuttosto che piangere dopo. Non vorresti gridare “Nooo!” quando scopri che la tua amata landing page è sparita dalle SERP.
Che fare se accade il peggio?
Se noti che alcune pagine non compaiono più su Google, controlla i log del tuo CDN.
Potrebbe aver risposto in modo errato alle richieste di crawling.
Fornisci a Google i codici HTTP corretti e, se necessario, rimuovi i bot interstitials per un po’. A volte, basta togliere le barriere per far rifluire il traffico.
Poi, con calma, reimposti filtri e protezioni, facendo in modo che i crawler “buoni” (come Googlebot) passino senza problemi.
Se vuoi approfondire, Google ha pubblicato una nuova documentazione su “Crawling December: CDNs and crawling“. Là trovi tutti i consigli del team di Google. In più, se hai la passione per i “test di collaudo”, troverai dritte su come verificare la latenza del tuo sito e misurare quante richieste gestisce prima di andare in crisi.
Conclusione? No, solo un invito a curiosare!
Ehi, ecco la fine del nostro articolo, ma non una conclusione definitiva (non vogliamo annoiare con i soliti saluti lunghi!).
Sappiamo che l’argomento “CDN e SEO” è caldo e in costante evoluzione.
Se vuoi saperne di più, esplora la documentazione di Google, controlla i log, usa la Search Console… e soprattutto resta sintonizzato su Wonize! Qui, cerchiamo sempre di darti dritte utili, evitando (il più possibile) errori e noie tecniche.
Ricorda: una corretta configurazione del tuo CDN può fare la differenza tra essere primo in classifica o scomparire in un blackout digitale!
E con questa perla di saggezza, ti lasciamo sperimentare, testare e – se serve – smanettare un po’ con impostazioni e codici di risposta HTTP.
Scrivi un commento qui sotto per dire la tua.
Buon divertimento!