Come funziona Google?
COME FUNZIONA GOOGLE O UN MOTORE DI RICERCA?
(Piccola guida per i meno esperti)
Vediamo subito come funziona Google e proviamo ad immaginarlo come un’enciclopedia, hai presente quella cartacea? Decine di volumi, centinaia di pagine? Anche se i più giovani magari non ne hanno mai vista una. La più grande enciclopedia esistente. Anzi più di un’enciclopedia, con milioni di nuovi contenuti che si aggiungono ogni giorno ai miliardi già presenti. I contenuti del web e della mia enciclopedia possono essere di qualsiasi tipo, buoni o cattivi, di qualità o scadenti. Google grazie al suo algoritmo (software molto sofisticato che analizza tutte le pagine del web) premia, o cerca di premiare, secondo i suoi criteri, i contenuti di qualità.
Come fà Google ad analizzare e organizzare tutte le pagine del web?
Ritorniamo all’immagine dell’enciclopedia. Ogni volta che una nuova pagina web viene creata e inserita in internet, Google la analizza, la filtra, la scansiona, la memorizza, la cataloga e aggiunge un foglio alla nostra enciclopedia.
Per andare alla ricerca di queste pagine o siti web nuovi o aggiornati, Google usa i “Web Crawler” o “Spider” o “bot” o “GoogleBot”, dei veri e propri “cacciatori di contenuti”.
Per ogni argomento, parola o frase chiave (KEYWORD) e informazioni, Google organizza un indice (INDICIZZAZIONE) e mette tutti i contenuti in fila, in ordine di importanza collegando tra loro le pagine di uno stesso URL (indirizzo web) anche grazie all’utilizzo della SITEMAP (un file che mi dà la corretta composizione del sito web con tutte le sue pagine collegate attraverso dei LINK (collegamenti) come ad esempio tutte le pagine collegate attraverso il menu interno).
Quando una nuova pagina web viene creata o aggiornata e inserita in internet, Google la analizza, la filtra, la memorizza, la cataloga e aggiunge o modifica un foglio alla nostra enciclopedia. Per andare alla ricerca di queste pagine web nuove o aggiornate, Google usa i “Web Crawler” o “Spider” o “bot” o “GoogleBot”, dei veri e propri cacciatori di contenuti.
Dove vengono memorizzate le pagine web?
Tutti i contenuti vengono quindi indicizzati (messi all’interno di un indice), memorizzati e salvati in enormi data center in giro per il mondo e collegati tra loro. Facciamo uno sforzo e immaginiamoci questa quantità enorme di volumi di enciclopedia con miliardi di pagine, poste su scaffali di immense biblioteche. Nel caso di Google si tratta di “enciclopedie digitali” e “biblioteche digitali” molto ma molto più ricche di contenuti di una qualsiasi biblioteca fisica.
Cosa succede quando faccio una ricerca su Google, una “query di ricerca”?
Quando cerco qualcosa su Google, faccio un’interrogazione al motore di ricerca e digito una parola chiave o una domanda nella barra di ricerca. Digito ad esempio “come funziona Google?”.
Google cerca e sceglie nei suoi indici, all’interno dei data center, i risultati corretti e propone una selezione dei risultati, un elenco di indirizzi web (pagine web) che secondo lui sono quelle di maggior interesse, cioè più attinenti alla mia richiesta. Questa lista che mi viene proposta, si chiama SERP (Search Engine Results Page – pagina dei risultati del motore di ricerca).
Ma eccoci alla nostra gigantesca enciclopedia cartacea, pensiamo al nostro bibliotecario, il Sig. Google che prende il volume dell’indice, da buon bibliotecario si lecca il dito medio e sfoglia le pagine, trova le indicazioni per lo scaffale e il numero del volume corretto. Prende il volume, lo sfoglia e mi propone le pagine con i risultati più attinenti alla mia ricerca. Semplice no? Semplice come sfogliare un libro.
Come fà Google a classificare e ordinare le pagine?
In questo caso il motore di ricerca non funziona esattamente come un’enciclopedia, non mette tutto in ordine alfabetico. Google ha creato un algoritmo (programma, software) in continuo aggiornamento, che decide la rilevanza delle pagine a seconda della mia richiesta. Un software molto avanzato che si basa a grandi linee su più di 200 fattori, e decide chi merita la posizione migliore sulla SERP e premia i più virtuosi, cioè i contenuti più interessanti, con i primi posti.
Come fa Google ad essere così veloce nelle risposte?
Tutta questa ricerca viene fatta in tempi che mediamente si misurano in frazioni di secondo. Come inizio a digitare le prime lettere sulla barra di ricerca di Google, Big G (Google) si mette in moto e comincia già ad indicare e consigliare il possibile completamento della mia domanda. Questo si chiama “Google Instant” e permette al motore di ricerca di cominciare ad infilarsi nell’indice giusto per riuscire a dare la migliore risposta nel minor tempo possibile. Per la velocità di Google parliamo comunque di velocità della luce che non è solo un modo di dire. Google è il bibliotecario più veloce al mondo.
Per ogni keyword (parola o frase chiave) o domanda, Google organizza un indice (indicizzazione) e mette tutti i contenuti in fila, li memorizza e li salva in immensi data center in giro per il mondo, “biblioteche digitali” sempre pronte alla consultazione.
Ma Google mi propone sempre i risultati migliori? Non sempre…
Ricordiamoci che la qualità dei contenuti viene decisa da un algoritmo che non è perfetto e, nonostante i continui perfezionamenti, non lo sarà mai. Si mormora che l’algoritmo di Google capisca più o meno come una bambino di 5 anni. Per niente male per un software ma non sufficiente a definire una reale qualità delle pagine web. Ma poi quale sarebbe la reale qualità e utilità delle pagine che meglio possono rispondere alle mie domande e alle mie esigenze? Qui potremmo aprire un dibattito infinito… Potremmo chiederlo al bibliotecario, il Sig. Google, ma non ci svelerà mai completamente i suoi segreti. Per questo motivo, ogni giorno migliaia di tecnici SEO (Search Engine Optimization – professionisti che si occupano di costruire e gestire pagine web per migliorare il posizionamento nei risultati di ricerca) si alzano e lottano per scalare le classifiche e capire cosa vogliono gli utenti e Google.
Ecco come funziona in modo un pò più tecnico il motore di ricerca Google
In questa infografica che Studio Samo ha estrapolato da Google Inside Search vediamo molto chiaramente tutte le fasi che ho descritto sopra, dall’analisi e memorizzazione delle pagine web, al momento della ricerca da parte di un utente, alla fase del posizionamento e pubblicazione sulla pagine dei risultati di ricerca (SERP).
Perchè ho parlato sempre e solo di Google?
Perchè gli altri motori di ricerca (Yahoo, Bing, Baidu, Yandex…) pur funzionando più o meno nello stesso modo, hanno quote di mercato molto basse. Google ha quasi il monopolio del mercato mondiale, è usato da più del 90% delle persone, in Italia andiamo addirittura sopra il 94%.
Courtesy of: Stats Counter Global Stats
Piccolo dizionario (senza pretese)
- INDICIZZAZIONE – E’ un’operazione che Google fà per inserire nel proprio indice le pagine web, salvando tutto nei propri database;
- SERP (Search Engine Research Page) – E’ la pagina dei risultati che ci appare dopo aver effettuato una ricerca con Google;
- SNIPPET – E’ quella porzione di testo che appare nella SERP, cioè nella pagina dei risultati del motore di ricerca con titolo, link e descrizione del sito o pagina web;
- SEO (Search Engine Optimization) – E’ quella serie di ottimizzazioni tecniche per migliorare il posizionamento delle pagine nella classifica del motore di ricerca;
- WEB CRAWLER, SPIDER, BOT, GOOGLEBOT – Sono dei programmi che esplorano i contenuti delle pagine web e decidono il loro valore e la loro importanza;
- SITEMAP – E’ un file formato da una mappa in cui si forniscono a Google tutte le informazioni riguardanti il proprio sito web;
- QUERY – E’ una interrogazione, una domanda che viene fatta ai database dei motori di ricerca per fornire delle risposte alle nostre domande.
Qui la nostra storia su Google, sull’enciclopedia e il bibliotecario finisce. Spero di essere riuscito nell’intento di spiegare come funziona Google nel modo giusto. Grazie per avermi seguito fin qui. Ok… appeno lo vedrò vi saluterò il bibliotecario. A presto!