L’immagine qui sopra è il formato base di un link ed è la struttura meglio ‘digerita’ dai motori di ricerca per la sua semplicità. Il referral link indica ai vari search engines la pagina linkata in modo chiaro, mentre l’anchor text è utile ai lettori per capire subito l’argomento trattato che troveranno all’interno della pagina linkata.
Queste due righe (di ripasso) mi servivano per introdurre l’argomento link e quando sono o meno valutati dai vari motori. Infatti, provo a semplificare il più possibile il discorso in merito agli algoritmi alla base dell’indicizzazione e posizionamento delle pagine web nei risultati di ricerca.
Sapete tutti come per Google & Co, un link ad una specifica pagina è considerato come un ‘voto positivo’ e, più sono i links verso quella pagina, maggiore è la sua reputazione e più in alto nella SERP essa comparirà per specifiche keywords.
Lo so che è difficile riassumere tutto in tre righe, ma il discorso è sostanzialmente quello appena fatto. Occorre, altresì sapere che non tutti i links all’interno di una pagina hanno lo stesso valore e, inoltre, cosa ancora più importante, non tutti i links sono visti e valutati dai motori di ricerca.
Quest’ultima affermazione diviene basilare nel momento in cui si pensa che, inserendo uno o più link all’interno della pagina, questi siano sempre e comunque presi in considerazione dai search engines. Non è così, occorre saperlo, e qui voglio elencarvi proprio alcune situazioni classiche in cui i links sono totalmente ignorati dagli spiders di Google e simili.

Links in un form
Il web pullula di forms (sottomissione di dati ecc) che si trovano all’interno di pagine web. Siano essi semplici (composti solo da drop down) o nettamente più complessi, gli spiders non pongono alcuna attenzione a loro e, qualsiasi links sia presente in un form o venga passato quando si inviano dati con un form, è puntualmente ignorato dai crawlers dei search engines.
Links in Javascript
Forse, in tal caso, molti di voi erano al corrente del fatto che i links presenti all’interno di uno script javascript risultano trasparenti ai crawlers. La sola e unica struttura sintattica prevista e digerita è il puro e semplice html.
Ecco perché, si consiglia sempre, di realizzare codice html pulito.Infatti, tanto più ‘pulita’ e ben organizzata è una pagina html, tanto più facile sarà per uno spider riuscire ad analizzare proficuamente il codice e valutarne i links contenuti.
Links che puntano a pagine bloccate
Come bene sapete, il file robots.txt è utilizzato dai vari webmasters per bloccare l’accesso a determinate directories o URL precise. Qualora un link presente all’interno di una pagina web punti proprio verso una url bloccata a valle dal robots.txt, logicamente il link sarà totalmente ignorato dagli spiders.
Links accessibili solo tramite motori di ricerca
Google e compagnia sanno che alcuni webmasters vogliono creare contenuti solo per i motori e non per gli umani. Questo non è tollerato con la conseguente penalizzazione di questa procedura. Infatti, può accadere che si voglia inserire/nascondere links in path o directory dove nessun utente può arrivare, ma dove riescono ad accedere solo i vari spiders dei search engines. Ma, questi ultimi, scoprendo la cosa, ignorano i links suddetti o danno loro un peso quasi nullo in termini di ranking.
Links in flash e java
Esattamente come per il javascript, anche i links inseriti in applicazioni flash o java vengono bypassati dai crawlers. Inutile, quindi, qualsiasi attività del genere se le vostre applicazioni sono costruite o basate interamente sui due linguaggi suddetti.
Links in pagine con cento e più links
Anche se non c’è nulla di sicuro al 100%, è convinzione (soprattutto per ragioni di spam) che gli spiders riescano ad indicizzare e valutare non più di 100 links per pagina. Quindi, se inserite un numero di links superiore all’interno di una pagina web, molto probabilmente nessun crawlers riuscirà a valutarli.
Links con nofollow
La struttura base del link presentata ad inizio articolo é, come detto, un formato base. Il tag <a>, infatti, ha molti attributi e, tra questi, esiste anche il famoso rel=”nofollow” che, in sostanza, dice esplicitamente ai motori di ricerca di non seguire e di non valutare quello specifico link cui l’attributo è applicato.
Pertanto un link del genere :
<a rel=”nofollow” href=”http://pecciola.com”>Blog di Pecciola</a>
verrà ignorato dai vari spiders in modo totale.
A tal proposito, però, va precisato un aspetto fondamentale. Quando si parla di motori di ricerca si pensa quasi sempre solo a Google. D’accordo che parliamo del search engine per eccellenza e quello che porta più traffico ai vari siti/blog, ma, in tal caso, ad esempio, non tutti i motori si comportano allo stesso modo.
Infatti, mentre per Google i links con attributo nofollow sono ignorati in toto, per Yahoo! e Bing servono comunque per scoprire nuove pagine e contenuti anche se essi non avranno impatto sul ranking. Infine, Ask.com addirittura afferma che tale attributo non inficia assolutamente il lavoro del proprio spider che valuta il link allo stesso identico modo di quelli senza attributo.
Una precisazione, direi, doverosa e molto importante per coloro che cercano traffico anche su altri search engines.

