Factores SEO 2014/2012

Correlación de datos: factor versus posición en las SERPs.

Leyenda del estudio

Factores SEODescripción del factor201220132014
Se refiere al conjunto de +1 conseguidos por una URL a través de Google+.0.410.400.33
Hace referencia la número de comparticiones de la URL en Facebook.0.370.340.28
Es el conjunto de todas las métricas evaluadas en Facebook.0.350.340.28
Comentarios que se han realizado desde Facebook.0.330.330.27
Número de clics en "Me gusta" de Facebook: Expresión social de agrado frente a un contenido.0.300.310.25
Interacciones recibidas mediante "pins" en la red social Pinterest.-0.290.27
Mensajes enviados a través de Twitter mencionando la URL.0.250.280.24
Factores SEODescripción del factor201220132014
Cantidad de enlaces externos que apuntan a nuestro sitio web.0.360.340.31
Cálculo en % de enlaces con el atributo "nofollow" respecto a los enlaces follow.0.150.250.23
La Visibilidad SEO es un factor propio de Searchmetics para medir la calidad de los links. Cada herramienta tiene el suyo.-0.200.26
Es el % de enlaces entrantes que contienen entre las palabras clave: preposiciones, artículos, adverbios, pronombres y algunos verbos. Por ejemplo "SEO en Barcelona" y no "SEO barcelona"0.050.180.16
Indica el número de palabras que componen el Anchor Text (texto del enlace).-0.140.11
% sobre la cantidad de links externos que proceden del mismo país de la URL analizada.-0.110.07
Informa acerca del % de enlaces externos que contienen la palabra clave buscada.0.100.060.17
Factores SEODescripción del factor201220132014
Longitud de una URLNúmero de carácteres de la URL que aparece en el resultado de búsqueda.-0.160.10
Posición de la palabra clave en el Title (Caracter)Este factor valora la concordancia entre la posicion de la palabra clave en el Title y la posición en los resultados del buscador.-0.120.10
Posición de la palabra clave en el Title (Palabra)Valora la relación entre la posición en la que se encuentra la palabra clave en el Title en cuanto al resto de palabras y la posición del resultado.-0.110.10
La URL no es un subdominioIndica que la URL analizada no pertenece a un subdomino o otras subpáginas de este dominio.-0.070
Existencia de descripciónEste factor considera que nuestra página web contenga un Meta Description.-0.060.05
Existencia de H2Este factor considera la existencia o no, en el documento, de un encabezado H2.0.0320.050.07
Velocidad de cargaLa velocidad de carga de una web influye no sólo en SEO sino también en la experiencia de usuario, que influye a la vez en el ranking.-0.040.11
Existencia de H1Evalúa la presencia de H1 en el código de nuestra página web y si ello influye en el posicionamiento web.0.0140.030.05
Palabra clave en el dominioHace referencia a la existencia o no de la palabra clave buscada en el nombre del dominio.0.110.03-0.02
Integración de VideoValora la incorporación de vídeos que ayudan a hacer más atractivo los contenidos de una página web.-0.030.05
Palabra clave en el DescriptionEsta métrica analiza si la palabra clave buscada por el crawler esta presente en el tag Meta Description.0.030.020.01
Palabra clave en la URLMuestra si la palabra clave forma parte de la URL del documento resultante, también llamado SLUG.0.040.01-0.01
Palabra clave en el TitleAnaliza la existencia de la palabra clave en el Title del sitio web.-0.0200.02
Factores SEODescripción del factor201220132014
Número de enlaces internosEsta métrica calcula el número total de links internos que apuntan al documento resultante en las SERPS.-0.150.16
Longitud HTMLMide acerca del tamaño del código HTML y su influencia en el posicionamiento web.0.1180.130.14
Número de palabrasEs la contabilización del número total de palabras que podemos encontrar en el documento web.-0.120.110.13
Palabra clave en el BodyMide la presencia o no de la palabra clave en el body del documento.-0.110.15
Palabra clave en links externosCalcula la aparición de palabras clave en los links internos que componen la estructura interna del documento posicionado.-0.110.11
Longitud de carácteres de textoEstá directamente relacionado con el número de palabras, pero en este caso se refiere al número de carácteres que componen el texto de un sitio web.-0.110.13
Links internos autoreferenciandoseSon vínculos que se enlazan y se refieren al mismo documento que aparece posicionado.-0.110.10
Palabra clave en los links internosCalcula la aparición de palabras clave en los links internos que enlazan al documento.-0.110.10
Número de links externosEs la suma de todos los links que enlazamos desde el documento hacia contenido externo.-0.090.08
Número de imágenesCantidad de imágenes que se pueden encontrar en la página web.0.040.080.05
Palabra clave en el H2La palabra clave está incluida en el H2 del documento.-0.020.030.02
Enlaces Publicitarios (no Adsense)Aparición o no de anuncios de publicidad con enlaces y no procedentes de Google Adsense, en el sitio web.-0-0.03
Enlaces PublicitariosAnuncios publicitarios incluyendo la red de Adsense.-0.040-0.03
Adsense BlocksPresencia de anuncios de Adsense en el documento posicionado.-0.04-0.01-0.03
Longitud de caracteres del TitleIndica la longitud del Title contando el número de caracteres que contiene.-0.04-0.01-0.01
AdsenseEs la publicación de anuncios de Google en una página web.--0.01-0.03
Palabra clave en el H1Presencia de la palabra clave en el H1 de nuestra página web.-0.03-0.03-0.03

Los factores del 2014 son datos reales, publicados por SearchMetrics el 8/9/2014.

Factores SEO 2014

[ACTUALIZACIÓN 9/9/2014]
Ya tenemos el nuevo estudio del 2014 de Searchmetrics sobre los Factores SEO. No parecen haber sufrido grandes modificaciones respecto a los publicados en el 2013. Confirman que el contenido relevante sigue siendo "el factor". Lo podemos identificar por datos como el número de palabras, longitud del HTML, integración de video y número de shares.

Otra tendencia clara es la optimización técnica. Velocidad de carga, arquitectura de linking interno y la optimización de Title y Metadescriptions. No es tanto favorecer a los que lo hacen bien, sino perjudicar a los que no siguen las recomendaciones. Esto es requisito BÁSICO. También tenemos que tener en cuenta la relación entre la velocidad de carga y el aumento del rebote. El tiempo de descarga ha aumentado respecto al año pasado, situándose en 1,27 segundos, seguramente por la inclusión de más contenido textual y gráfico (foto y video).

Recordaros que una correlación 0 la produce la presencia de ese factor en todos los resultados. Lo que indica que es un factor que todos los sites están trabajando bien. Más abajo explico que es una Correlación y sus 4 posibles causas que pueden dar como consecuencia una correlación entre 2 factores A y B.

En Google.com, entendamos que el estudio es en el .com y no en el .es, la importancia de la palabra clave en dominio y URLs ha caído drásticamente. Esto no esta pasando en Google.es ... aún.

Bajada de la diferenciación entre las primeras posiciones y últimas respecto a los shares sociales y la confirmación de los enlaces como factor relevante. Lo que no dice el estudio es el grado de confianza (naturalidad) de esos enlaces, sólo la inclusión de la palabra clave. Yo creo que veremos cambios sobre estas densidades este año. El listón de lo no permitido seguirá subiendo.

La novedad este año del estudio de factores, es la inclusión del CTR (con una correlación del 0,67)y Rebote, señales muy fuertes de relevancia y muy difíciles de manipular.

La alta correlación de Google+ y sus +1 con un mejor posicionamiento, que ya produjo revuelo en el 2013, es un ejemplo claro de "Correlation does not imply causation". Rand Fishkin ha comentado dos posibles explicaciones aquí y la posible relación entre +1 y personas más propensas a enlazar. Lo que para mí parece la explicación más plausible es la identificación de personas REALES en esta red por parte de Google. O sea no son los +1 son las personas identificadas (mobile + agenda teléfonos + círculos + traqueo IPs + ... FOAF [Friend Of A Friend] como bien dice Bill Slawski sobre la última patente de Google). Clarísimamente el AuthorRank sigue más vivo que nunca.

Dan Petrovic en este fantástico post realiza un estudio sobre la co-occurrece y la relación semántica entre personas e intereses en Google Books, y como Google ya no necesita Schema para identificarnos semánticamente y relacionar los datos. No vivimos en el 2012.

LA CONFIANZA, será uno de los factores a tener muy en cuenta en el 2015.

Qué es una concordancia de datos

A diferencia de lo que muchos SEOs piensan, los estudios de Moz y SearchMetrics no representan factores de posicionamiento SEO, sino una concordancia de datos entre el dato analizado y la presencia del mismo en los resultados de búsqueda.

“Correlation is not causation.”

Una concordancia de datos no implica una causalidad, ni el valor implica que sea más o menos importante, sino que el dato está más o menos presente en los primeros resultados de la SERP y no en los últimos.

Como ejemplo de esto podemos observar el dato “Palabra clave en el Title” cuya concordancia es 0. ¿Eso significa que no tiene importancia, qué no es relevante? NO, esto demuestra que el dato está presente en todos los resultados de la SERP, por lo cual la concordancia es CERO lo que demuestra que no hay correlación.

Tampoco es real que una concordancia alta demuestre una causalidad. Que los primeros resultados tengan un número mayor de Google Plus “+1” no implica que esto mejore el posicionamiento. Es más lógico pensar que un gran site o un gran contenido obtiene mayores Shares sociales al igual que enlaces, y que al obtener una mejor posición este efecto es multiplicado, lo que ayuda a marcar más la diferencia entre los primeros resultados y los segundos.

NOTA: Para profundizar sobre la causalidad y la historia de la causa y efecto, podéis leer los trabajos de Judea Pearl como éste.

También puede resultar que muchos de esos datos tengan entre ellos una Relación Espuria, relación matemática en la que dos acontecimientos no tienen conexión lógica, aunque se puede implicar que la tienen debido a un tercer factor no considerado llamado "factor de confusión". Este tipo de relaciones se dan bastante en la matemática estadística. También se llama "falacia de la causa simple".

Tampoco se tiene en cuenta que hay cientos de factores que Google tiene en cuenta y que influyen en la naturalidad, como la Co-citation, la Co-occurrece, autoría …

Causas que pueden llevar a una concordancia de datos entre A y B

  1. Que B sea la causa de A.
  2. Que haya un tercer factor desconocido que sea realmente la causa de la relación entre A y B (Relación Espuria).
  3. Que la relación sea tan compleja y numerosa que los hechos sean simples coincidencias.
  4. Que B sea la causa de A y al mismo tiempo A sea la de B, que sea una relación sinérgica o simbiótica donde la unión cataliza los efectos que se observan.

Co-citation y co-occurrence

En SEO una cita puede ser un enlace, una mención de marca, un teléfono ... Se dice que r1 y r2 están co-citados (citados juntos) porque ambos aparecen citados en un tercer documento A, al menos desde la perspectiva del autor citante. Cuanto mayor sea la frecuencia de citación mayor será la afinidad temática entre ellos.

Pero esto no es suficiente para establecer la relación entre estas dos citas. El otro factor a medir es la co-occurrence, que es la distancia entre las dos citas dentro del documento mencionante. Este valor que se mide en CPA (Análisis de Proximidad de la Cita) ayuda a establecer una hipótesis de relación real. Si la mención está muy próxima es que temáticamente está relacionado. Cuanto más alejado esté, la probabilidad de que sea casual es mayor. Además Google es muy capaz de saber en que parte del documento se producen las citas, al principio del documento, al final del mismo como fuente, en blogroll... pudiendo establecer una mejor hipótesis de su relación.

“La co-occurrence puede ser el nuevo Anchor Text en 2014.”
- By Rand Fishkin -
Twittea esto

La co-occurrence no sólo se produce entre enlaces o citas sino que también puede verse en la relación entre palabras o lo que es más interesante, en la relación entre un enlace y las palabras que figuran alrededor de ese enlace. Como comentaba ya Rand Fishkin en Mayo 2013, "la co-occurrence puede ser el nuevo Anchor Text en 2014".

La mejora del algoritmo de Penguin sobre esquemas y naturalidad de enlaces seguramente irá sustituyendo la fuerza del Anchor Text por otros valores como la co-occurrence. Hay varias patentes de Google que indican cómo mide la co-occurrence entre palabras, y uno concretamente sobre esta y la relación con el ranking de documentos.

Si queréis profundizar más os recomiendo leáis las referencias sobre co-citation y co-occurrence que hemos publicado al final de post.

Google a través de John Mueller ha reconocido en un HangOut que sigue estos enlaces aunque no sean enlaces. Algo que ya conocíamos hace bastante tiempo, debido a que en WMT empezaron a aparecer enlaces y errores 404 ahí donde no había un enlace, sólo una URL en texto.

Si queréis seguir vuestras menciones de marca os recomiendo dos herramientas SEO: Google Alerts y Mention.

Recursos

Ranking y Factores SEO



Co-citation y co-occurrence