La prima realtà su Internet che ha brevettato un sistema di tracciamento degli inbound link è stata Google, con il suo algoritmo chiamato PageRank. Questo articolo illustra come influisce l’algoritmo PageRank sulla classifica dei risultati di ricerca.
Il PageRank è un valore assegnato in modo individuale a ciascuna pagina di un sito web, ed è determinato principalmente in base al valore delle altre pagine che a queste sono collegate.
Il calcolo assegna iterativamente un indice di merito ad ogni pagina pubblicata su Internet, basandosi principalmente sulla media ponderata dei PR delle altre pagine che la collegano con un link. Il risultato dell’algoritmo matematico si avvicina al concetto umano di “importanza”, o popolarità, valorizzando la possibilità di una visita alla determinata pagina.
Procedura di calcolo del valore PageRank
L’algoritmo PageRank brevettato da Google è segreto. Tuttavia, grazie alle informazioni già pubblicate e alla deduzine e studio del fenomeno, è possibile risalire al modo in cui Google calcola questo valore.
Per iniziare, osserviamo come è modellato il comportamento dell’utente che naviga sulla rete Internet. Parte da una pagina, clicca, e salta da una risorsa all’altra seguendo i link ipertestuali che trova.
Presumiamo che parte da una pagina qualsiasi. Ad un certo momento cliccherà su un link che lo porterà ad un’altra pagina. Ma esiste sempre anche la possibilità che l’utente abbandoni la sessione di navigazione senza più seguire altri outbound link, terminando la propria sessione dopo la lettura del contenuto della pagina corrente. L’algoritmo PageRank considera la probabilità di questo evento pari allo 0,15, su ogni pagina. La probabilità, quindi, che il nostro utente segua un link nella pagina è pari a 0,85, considerando in questa fase che ciascun link ritrovato abbia lo stesso valore.
Se l’utente continua a navigare un lungo periodo di tempo, visiterà di più le pagine che sono più popolari e di meno le pagine meno popolari – sarà più difficile cadere su un link che punta ad una pagina meno popolare.
Il PageRank di una specifica pagina è definibile quindi come la probabilità che un utente la possa visitare. Di conseguenza, la somma delle probabilità per tutte le pagine esistenti è pari ad uno, in quanto l’utente dovrà sempre essere su una pagina web in un particolare momento.
Visto però che è poco comodo lavorare con questi valori espressi in percentuali di probabilità, il PageRank potrà essere trasformato matematicamente in un valore di più facilmente comprensione.
Sulla base del modello di ranking descritto sopra
Ogni pagina pubblicata sulla rete Internet (anche se non ha nessun link verso di sé) inizialmente ha un valore superiore allo zero, anche se molto basso. Esiste una piccola probabilità che qualcuno per caso immettesse il nome della pagina nel suo browser per visitarla. Le landing page sono esempi tipici.
Ciascuna pagina che ha un outbound link distribuisce parte del suo PR alla pagina referenziata. Il valore acquisito dalle pagine di destinazione linkate è inversamente proporzionale con il numero totale dei link presenti sulla pagina dalla quale provengono – più link in uscita da una pagina meno PR verrà allocato tramite ciascuno di essi.
Al valore dei link in uscita è applicato anche un filtro di “attenuazione”, che riduce il PR distribuito dello 15%. Questo è equivalente alla probabilità, descritta sopra, che l’utente abbandoni la visita senza cliccare sui link.
Hanno valore più alto i link che provengono da pagine con PR alto, possibilmente da siti con argomenti simili, e ancora meglio se non “ricambiati”. Le pagine dai quali provengono i vostri inbound link, inotre, non dovrebbero avere troppi link link in uscita.
E’ quindi implicitamente importante non avere troppi outbound link, specialmente dalla home page.
L’importanza del PR è fondamentale anche perchè questo “passa valore” anche ai link interni del sito.
Come influisce il valore del PageRank sul posizionamento nei risultati di ricerca
E’ stata usata la parola “potrebbe” perchè l’algoritmo puro del PageRank descritto sopra non è più utilizzato nel ranking. La versione nuova, parte di cui è tuttora segreta, sarà illustrata più sotto in questo articolo. L’applicazione dell’algoritmo del PR sulla classifica dei risultati di una ricerca è facile. Dopo che il motore trova un numero di documenti rilevanti (usando criteri testuali interni) questi potranno essere ordinati secondo il valore del PR, in quanto potremmo supporre che una pagina con un numero più alto di inbound link rilevanti e qualitativi contiene più informazioni utili.
Quindi, l’algoritmo PageRank “spinge verso l’alto” i documenti che sono più popolari anche al di fuori dal motore di ricerca.
Ma attualmente il PageRank non è usato direttamente nell’algoritmo di posizionamento. Questo può essere anche ovvio, in quanto il PR puro caratterizza soltanto il numero di link qualitativi al sito, ma ignora completamente il testo dei link e il contenuto delle pagine di provenienza. Questi fattori sono importanti nel PR, e sono stati inseriti nell’algoritmo successivamente. Si suppone che attualmente l’algoritmo di ranking di Google posiziona le pagine secondo il PageRank tematico, enfatizza quindi l’importanza dei link da pagine con contenuti relazionati o tematiche simili. I dettagli precisi sono conosciuti solo dagli sviluppatori dell’algoritmo, ma ad alcuni elementi si può risalire o si possono dedurre e quindi applicare nel SEO, come descritto nel capitolo successivo.