Como Manejan Los Buscadores el Identificador de Fragmentos en URLs

En una conversación sostenida con algunos colegas hace unos meses atrás, estuvimos analizando el uso del símbolo “#” en las URLs y sus repercusiones en el posicionamiento en buscadores. Este símbolo es conocido como “pound” en los Estados Unidos y “hash” en otras partes del mundo.

El tema volvió a resurgir nuevamente hace poco en Twitter por lo que considero importante clarificar esto de una vez por todas.

Identificador de Fragmentos en URLs

Análisis del Problema de Fragmentos en URLs

Algunos Consultores de SEO eran de la opinión, y tal ves todavía lo sean, que URLs que contenían al final el símbolo # eran completamente diferentes que aquellas que no lo contenían. Como ejemplo analicemos la entrada sobre contenido duplicado con las siguientes URLs:

  1. http://www.spanishseo.es/contenido-duplicado-problemas-soluciones/
  2. http://www.spanishseo.es/contenido-duplicado-problemas-soluciones/#comment-24.

La primera URL corresponde a la dirección Web del artículo, mientras que la segunda corresponde a un comentario dejado por uno de nuestros lectores en esa entrada. La diferencia entre ambas URLs se da al final de la segunda con el anexo de #comment-24.

El uso del símbolo pound o hash (#) es de uso común y existen otras aplicaciones en las cuales se emplea en adición a los comentarios en blogs:

  1. Para localizar secciones en una página o documento Web a través del identificador de fragmento (fragment identifier) en combinación con la etiqueta <a> y los atributos href y name como en este ejemplo http://www.spanishseo.es/clientes/#1. El identificador de fragmento es #1.
  2. Conjuntamente con el uso de la etiqueta <!–more—> en entradas de blogs para separar el contenido que se muestra en la primera página del texto completo de la entrada. El siguiente en un ejemplo de cómo sería el URL: http://www.tuwebsite.com/2008/11/26/nombre-de-la-entrada/#more-421.
  3. Para presentar diferente contenido a los usuarios y a los buscadores con fines de manipulación, técnica conocida como cloaking. Esto se puede llevar a cabo con combinación de JavaScript y también puede usarse en Flash.
  4. Como mecanismo de seguridad en URLs sin SSL (Secure Socket Layer), y resistente al segundo factor de autenticación de phising con un bookmark. Este mecanismo requiere una combinación de JavaScript y HTML, y puede ser usado en cualquier aplicación Web sin necesidad de modificaciones al navegador.

Los Buscadores y el Identificador de Fragmento (#) en URLs

En el artículo titulado partes de una URL publicado el 14 de Agosto del 2007, Matt Cutts explica que

al parecer Google estandariza las URLs al remover cualquier fragmento de la URL.

Más recientemente, en las preguntas y respuestas del Tercer Chat Online de Webmasters llevado a cabo el 22 de Octubre del presente año, John Mueller, Analista de Webmaster Trends de Google Zürich, respondió a un participante anónimo quien pregunto: ¿Google remueve los fragmentos de URL? En otras palabras, ¿es el enlace a /path/#fragment el mismo que /path/?

La respuesta por parte de Mueller fue contundente:

Si, removemos los fragmentos de URL ya que son procesados en el lado del cliente y no son relevantes cuando la información es obtenida de tu servidor.

En cuanto a Yahoo! y Live Search de Microsoft, no se puedo encontrar información oficial ya sea a través de sus blogs o representantes que indique el uso y manejo del Identificador de Fragmento en URLs.

Test de verificación de URLs con # en Buscadores

Las pruebas de verificación de URLs se llevaron a cabo con dos operadores de búsqueda avanzados: “inurl” y “allinurl”. El primer operador indica al buscador que presente resultados que contengan la palabra entre comillas en el URL. Si se tienen dos o más palabras claves, entonces es necesario que cada una de ellas sea precedida por inurl.

El segundo operador de búsqueda indica al buscador que presente resultados que contengan todas las palabras claves. En tal sentido, inurl:#read inurl:more es igual que allinurl:#read more.

El operador de búsqueda allinurl solamente funciona en Google. Al parecer nunca funciono en Yahoo! y Live/MSN Search desactivo su uso el 28 de Marzo del 2007. De la misma forma que allinurl, el operador inurl no funciona en Live/MSN Search.

Los tests de verificación se llevaron a cabo el 28 de Noviembre a las 3:46pm Mountain Time en Denver, Colorado. Las siguientes cuatro diferentes variaciones fueron analizadas utilizando como idioma el Inglés:

  • inurl:#more
  • inurl:#
  • inurl:&#
  • allinurl:#read more

Resultados del test de verificación de URL

Se revisaron los primeros 800 resultados en Google y 1000 resultados en Yahoo! de búsquedas realizadas utilizando los operadores antes mencionados.

Google

inurl:#more : 40,300,000 resultados

inurl:# : 0 resultados

inurl:&# : 1,830,000,000 resultados

allinurl:#read more : 135,000 resultados

Yahoo

inurl:#more : 13,000,000 resultados

inurl:# : 0 resultados

inurl:&# : 0 resultados

Live/Microsoft

De los más de 5,000 resultados de Live/Microsoft que fueron analizados, solamente en una instancia se ubico una URL que contenia el símbolo #. La búsqueda por “#read more” retorno 1,360,000,000 resultados.

El resultado número 444 retorno una URL que incluía el identificador de fragmentos tal como se aprecia en la siguiente imagen:

Identificador de Fragmentos en Live - MSN

Conclusiones

  1. Al parecer Google no indexa URLs que contengan el símbolo #, tal como lo estipularan algunos representantes del buscador. Las pruebas realizadas arrojaron 0 resultados en las búsquedas de URLs que contengan el símbolo #. Ambos operadores de búsqueda utilizados en esta investigación se encuentran activos y funcionando.
  2. De acuerdo a lost test llevados a cabo en Yahoo!, los resultados no arrojaron URLs que contenieran el símbolo #. Sin embargo, so se logro localizar información oficial de Yahoo! respecto al manejo del Identificador de Fragmentos en URLs. Información encontrada en forums y blogs nos hacen pensar que el operador de búsqueda “allinurl” nunca funciono. A la fecha dicho operador no funciona. En ambos casos sería conveniente contar con una respuesta oficial por parte de representantes del buscador.
  3. En cuanto a Live / MSN, de todas las URLs revisadas solo en un caso se encontró una URL conteniendo el símbolo #, lo que nos hace pensar que podría existir otros casos similares. Sin embargo, se requiere mayor investigación para poder concluir que Live / MSN incluye el símbolo # en algunas URLs. No se encontró información oficial que nos permita conocer el manejo del Identificador de Fragmentos en URLs. De otro lado, ambos operadores de busqueda utilizados en esta investigación se encuentran desactivados de acuerdo a fuentes oficiales del buscador.

Popularidad de esta página: 74%

Compártenos:

  • E-mail this story to a friend!
  • del.icio.us
  • Google
  • BarraPunto
  • Ma.gnolia
  • Meneame
  • MisterWong
  • Technorati
  • BlogMemes Sp
  • Blogsvine
  • Pownce
  • Propeller
  • StumbleUpon
  • Wikio

Información Relacionada:

Comentarios

1 respuesta para “Como Manejan Los Buscadores el Identificador de Fragmentos en URLs”

  1. Link Love 20 | uLove-Tech - No es otro blog de Wordpress - Lunes 23 de Marzo de 2009 (9:34 pm)

    [...] Como Manejan Los Buscadores el Identificador de Fragmentos en URLs. Spanish SEO [...]

¿Tiene algo que decir?






Subscribe without commenting