Algoritmo de Google, versión 2006
La ambición de cualquier persona que comienza a trabajar en SEO y tiene nociones de estadística, es tratar de hacer una ingeniería inversa del algoritmo de Google para entender cómo es que el buscador rankea los millones de documentos de su base de datos. Pero el criterio de Google es cada vez más complejo (y ya no es solamente algorítmico, como vimos en una cita reciente de Matt Cutts). Entonces, ya es casi absurdo tener la pretensión de explicar cada uno de esos cientos de factores, pero no por eso el SEO ha dejado de ser interesante, sino más bien todo lo contrario.
Randfish, de SEOMOZ, reseñó los elementos que tiene en cuenta Google para rankear sus documentos. Tomando como base su post, haciendo algunos cambios, traduje el listado, no sin antes recordar que siempre van a quedar elementos afuera y que esto es solamente un ejercicio. Quien diga que puede explicar el algoritmo de Google en su totalidad, o bien está mintiendo, o se llama Larry Page.
Uso de palabras clave en los contenidos:
* En el título
* En los Headers
* En el texto
* En links internos apuntando a la página
* En el dominio o en la URL
Relevancia del dominio:
* Historia de registro de dominio
* Tiempo de vida del dominio
* Fuerza de los links apuntando a ese dominio
* Vecindario del dominio basado en links entrantes y salientes
* Patrón de uso a lo largo de la vida de un dominio
* Tipo de dominio (.gov, .edu, etc)
Calidad de los links entrantes:
* Tiempo de existencia los links
* Calidad de los dominios que linkean
* Calidad de los documentos que linkean
* Texto que se usa para linkear (anchor text)
* Texto alt que se usa en los links entrantes
* PageRank de los links
* Tema de los sitios que mandan links
Comportamiento de los usuarios
* CTR histórico del documento en los resultados de búsqueda
* Tiempo que los usuarios pasan en la página hasta que hacen otra búsqueda
* Búsquedas del dominio
* Todo tipo de datos de comportamiento de los usuarios venidos de su Toolbar, Analytics, alianzas, etc.
Calidad del contenido:
* Calificación puesta a mano por analistas que potencialmente trabajarían para Google
* Sentido del contenido (procesamiento del lenguaje natural)
* Metadata (tipo de contenido)
* Aumentos manuales en los resultados (ej: wikipedia)
Penalidades (restan)
* Sandbox
* Sobre optimización
* Técnicas conocidas como Black Hat
* Penalizaciones manuales




























Alvaro dijo
31 de October del 2006 a las 6:02 am
Gracias por la info, desde luego que resulta interesante. Desde hace tiempo me surge una pregunta:
Google rastrea cada página creada de forma dinámica (ASP, PHP,..) que toman toda la info de la BBDD de la misma manera que rastrea un documento html?
Un saludo y gracias
Álvaro
Andrés dijo
31 de October del 2006 a las 5:32 pm
Alvaro,
Siempre que lo pueda acceder con su robot, la respuesta es si.
Para saber más al respecto, justamente acaban de publicar novedades en su blog de webmasters
http://googlewebmastercentral.blogspot.com/2006/10/update-to-our-webmaster-guidelines.html
Saludos,
janes dijo
1 de November del 2006 a las 4:29 pm
Más que interesante. Espero que definitivamente acabe con las empresas que prometen posicionarte en primer lugar.
Denken Über » Week-log.197 dijo
4 de November del 2006 a las 3:38 pm
[...] - JUANPO y su “hijo caminando”.. felicitaciones :) - Serial Blogger, hizo una critica a una charla de una consultora de tecnología y se armó una MUY buena discusion e los comentarios.. donde la empresa entró con buena onda… - Kusor.net y otro libro recomendado… Programar en PHP - Virus Mental con una excelente reseña de DMZ un comic “rojo” - fresqui se pergunta si hay una ¿Doble moral? - Error500 y el modelo de Metacafe frente a YouTube…. - Nedial y el nacimiento de Ruralbot, una implementacion de Google CoOp - EndOfWires y un conflicto con la redes pagas… - Juanra Martínez y un detalle que los medios no miraron en “la chuleta de Fernando Alonso” - Netadblog y algunos cambios en el algoritmo de Google - Error500 y el Málaga Valley - M o n u z cambia de URL y se presenta con un “chiste de salon” :P - Emezeta y la 2.0 de Chuck Norris - Linotipo y una implementacion de Typepad en LastMinute… muy bien pensada :) - Celularis y la nueva version de Gmail Mobile. - Ricardo Galli cuenta la inversión de MV en meneame… y mas felicitaciones para el [...]
SGS dijo
16 de November del 2006 a las 6:04 pm
Buen post. Aunque lo intentamos aplicar y muchas veces no obedece todo como se comenta…No cabe duda que las acciones SEO son más complejas de lo que la gente piensa.
Guti dijo
26 de November del 2006 a las 6:37 am
Muy útil Andrés. Muchas gracias.
Referencias sobre Google » eCuaderno dijo
7 de February del 2007 a las 1:07 pm
[...] PageRank Algoritmo de Google, versión 2006 Publicadas las patentes solicitadas por Google Google’s PageRank Explained and how to make the most of it [...]