#69 Los "niños mimados" de Google
Tenemos fuertes evidencias de que Google favorece a los sitios web de grandes medios y a ciertos foros, como Reddit o Quora. Pierden los de siempre: los editores independientes.
🔎 En la edición anterior de la newsletter comenté en detalle la reciente historia de amor entre Google y Reddit (a la que ahora podría incorporarse Quora [EN]). También os ofrecí mi opinión al respecto y cómo pienso que esta situación tiene los días contados a medida que el spam consiga colonizar los foros para aprovechar el boost de visibilidad actual.
Pero el amor de la gran G por el User Generated Content es en realidad un fenómeno bastante reciente. Existe otra tipología de sitios web que vienen ocupando su corazón desde hace muchos años, me refiero a las páginas de los grandes editores corporativos.
¿Quién no ha buscado en Google alguna recomendación o reseña de productos y se ha encontrado con un resultado como este?
Es evidente que Google mima a las grandes editoriales y que éstas le devuelven el favor manipulando el algoritmo para posicionar reseñas de productos (con sus correspondientes enlaces de afiliados) en las primeras posiciones del buscador.
El caso es que Reddit y Quora son plataformas más o menos minoritarias en España, pero la cuestión de las reseñas corporativas sí nos afecta directamente.
👉 Esta semana he tenido la ocasión de leer en profundidad el artículo de HouseFresh [EN], donde se quejan precisamente de esto. Este sitio web se dedica al análisis de humidificadores, purificadores de aire y productos similares para el hogar. Se trata en todo caso de reseñas genuinas, porque adquieren (o les prestan) el producto y lo analizan en persona y en profundidad.
Comentan cómo las grandes editoriales estadounidenses (BuzzFeed, Rolling Stone, Forbes, Popular Science o Better Homes & Gardens) crean páginas de recomendaciones de productos sin realizar pruebas reales. Simplemente parafrasean material de marketing (con IA ahora es más sencillo si cabe) e información de listados de Amazon.
Como podréis imaginar, estos sitios logran colocar en primeras posiciones sus páginas “best of” sin apenas esfuerzo y sin tener que realizar pruebas reales y esto se debe a:
La enorme autoridad que atesoran estos dominios.
El supuesto sesgo que aplica Google y que le beneficia frente a pequeños editores.
La confianza adicional del usuario que reconoce la marca/editorial.
Google ha introducido actualizaciones (Google Product Review Updates) para tratar de mitigar este problema, pero no ha sido suficiente. Los sitios web más grandes siguen dominando los resultados de búsqueda y ganando dinero al recomendar productos que no han probado.
Según HouseFresh, aunque Google ha compartido pautas para evaluar la calidad de las reseñas, éstas no se aplican por igual a todos. Los grandes sitios de medios no siguen las mismas normas que las webs independientes.
En el post de HouseFresh se demuestra con multitud de ejemplos y capturas cómo estos medios seleccionan para sus páginas de reseñas aquellos productos con un coste superior, independientemente de su calidad, con el objeto de conseguir las mayores comisiones de venta posibles.
La respuesta de Google [EN] ha sido decir que se toma en serio las acusaciones, que no realizan verificaciones manuales y que están trabajando para mostrar una mayor diversidad de resultados que incluya tanto a publicaciones pequeñas como grandes. Vamos, lo esperado.
👉 En mi opinión, aunque Google no muestre preferencia de forma deliberada por los grandes editores, es evidente que hay señales en su algoritmo que favorecen a éstos, debido no sólo a las interacciones de los usuarios (¿Hola, Navboost?) sino también a la confianza preexistente.
🙃 Por terminar con un punto de humor, comentaros que el post en Reddit que apunta al artículo de HouseFresh supera en el ranking al original. Cosas de Google…
🔬 Un completo estudio de SE Ranking sobre los snippets de Google SGE [EN] ha analizado 100.000 palabras clave, con diferentes intenciones y volúmenes de búsqueda en 20 nichos distintos, para tratar de comprender mejor cómo funciona y cómo afecta al SEO. Los resultados desvelan el impacto significativo que va a representar este cambio para los resultados de búsqueda:
El 64% de las palabras clave analizadas obtienen una respuesta SGE o un botón “Generar”.
La longitud promedio del texto del fragmento SGE es de aproximadamente 3485 caracteres.
El número más común de enlaces en la respuesta de SGE (después de expandirse) es de 8.
El 85,5% de los fragmentos de SGE se vinculan a uno o más dominios de los 10 resultados orgánicos principales.
quora.com, local.google.com (Google Maps) y wikipedia.org son los dominios más enlazados en SGE.
Las palabras clave del nicho Alimentos y Bebidas activan fragmentos de SGE con mayor frecuencia, mientras que el nicho de Noticias y Política obtiene respuestas de SGE con menos frecuencia.
Los fragmentos de SGE que contienen texto aparecen en las SERP junto con fragmentos destacados aproximadamente el 25% de las veces.
Es más probable que las palabras long tail generen respuestas potenciadas con IA.
Los anuncios en la parte superior de las SERP acompañan a los fragmentos de SGE con más frecuencia que los anuncios de compras, pero los anuncios de compras tienden a aparecer encima del fragmento de SGE.
👉 Lo interesante de este tipo de estudios es ver la evolución de esta tecnología, lo que permite atisbar de alguna manera la visión que tiene Google de la misma y en última instancia estar preparados para su eventual despliegue.
Algo llamativo es que, frente al primer análisis que SE Ranking realizó a finales de 2023 [EN], se han dado varios cambios de especial calado:
En 2023 sólo alrededor del 4% de las palabras clave no lograron activar un fragmento de SGE. Esta vez, ha sido el 12,3%
También hubo un gran cambio en el promedio de enlaces incluidos en los fragmentos de SGE. En 2023, eran alrededor de 28 enlaces. El 45% de esos enlaces aparecieron en los 10 primeros resultados de búsqueda orgánicos. Ahora, después de expandir el fragmento de SGE, arroja un promedio de 8 enlaces, y el 85,5% de ellos se superponen con los principales resultados orgánicos.
Es decir, menos “activaciones” de SGE y mayor coincidencia de los enlaces mostrados con el TOP 10 de las SERP orgánicas.
💼 También me ha parecido interesante este análisis en bloomberry.com [EN] de 5 millones de empleos freelance en upwork.com desde noviembre de 2022 (un mes antes del lanzamiento de ChatGPT) hasta febrero de 2024. El objetivo del mismo era conocer el impacto que ha tenido la IA en estos puestos de trabajo, analizándolos por categorías. El motivo de estudiar precisamente el mercado freelance responde a la asunción de que las grandes empresas suelen tardar más en adoptar herramientas de IA.
👉 Se ha observado que la mayoría de las categorías laborales en realidad tuvieron un aumento en el número de empleos desde que se lanzó ChatGPT, con la excepción de 3 categorías que tuvieron grandes caídas. Por resumiros un poco los resultados obtenidos:
Disminución muy notable en trabajos de redacción, servicio al cliente y traducción en Upwork desde el lanzamiento de ChatGPT.
Los trabajos de diseño web, diseño gráfico, desarrollo de software y producción de vídeo han sido los más resilientes y no han visto ninguna caída en la demanda (e incluso han aumentado). Queda por ver si esto se debe a que las herramientas de inteligencia artificial aún no son lo suficientemente buenas para estos casos de uso, o si el público en general aún no ha aprendido cómo usarlas de manera efectiva.
Actualmente, la gran mayoría de las empresas no se están centrando en capacitar o perfeccionar sus propios LLM, debido a la falta de un aumento en los trabajos de anotación de datos o aprendizaje automático.
El caso de uso más popular, con diferencia, para la IA en este momento es el desarrollo de chatbots.
🤖 Otro post que os dará que pensar este fin de semana es este de Tom Siegfried en ScienceNews.org [EN] acerca de por qué los grandes modelos de lenguaje no se encaminan hacia la capacidad de comprensión humana.
👉 Muchos expertos insisten en que los LLM no entienden (todavía) realmente el mundo (al menos no en ningún sentido que corresponda a la comprensión humana).
En un nuevo artículo [EN] en arXiv.org, Melanie Mitchell y la coautora Martha Lewis de la Universidad de Bristol en Inglaterra muestran que los LLM todavía no igualan a los humanos en la capacidad de adaptar una habilidad a nuevas circunstancias.
Los LLM no poseen la capacidad de manejarse con precisión en situaciones que no se definieron previamente en su entrenamiento. En palabras de Mitchell:
“Ser confiable y hacer lo correcto en una situación nueva es, en mi opinión, el núcleo de lo que realmente significa comprender”.
La comprensión humana, dice, se basa en “conceptos”, básicamente modelos mentales de cosas como categorías, situaciones y eventos. Los conceptos permiten a las personas inferir causa y efecto y predecir los resultados probables de diferentes acciones, incluso en circunstancias que no se habían encontrado previamente.
"Creo que lo realmente notable de las personas es que podemos abstraer nuestros conceptos a nuevas situaciones a través de analogías y metáforas".
La autora del artículo no niega que la IA algún día pueda alcanzar un nivel similar de comprensión inteligente. Pero la comprensión de las máquinas puede resultar diferente de la humana. Nadie sabe qué tipo de tecnología podría lograr esa comprensión y cuál podría ser su naturaleza.
💰 Tumblr y WordPress se estarían preparando también para vender datos de usuarios a Midjourney y OpenAI [EN], según una fuente con conocimiento interno sobre los acuerdos y la documentación interna que hace referencia a los acuerdos.
👉 Podríamos estar ante otra forma de monetizar por parte de plataformas que mantengan el control de los contenidos generados por usuarios en sus acuerdos de licencia. Está por ver qué recorrido tiene esto y si genera malestar en los editores que publican en estos CMS.
💔 Una encuesta muestra que al 68% de los SEOs les gusta menos Google ahora que en el pasado [EN]. Curiosamente sólo el 6,5% dijo que les gustaba más tal como es ahora.
👉 No me parecen resultados sorprendentes. Los problemas con la calidad de la búsqueda, las promesas de mejorar mes tras mes (y no cumplir) y el impacto negativo en los negocios y vidas de algunas personas han contribuido a esta percepción negativa. Además, los documentos revelados en las investigaciones del Departamento de Justicia de EEUU tampoco han ayudado a mejorar la imagen de la gran G.
👀 ¿Posible actualización del algoritmo de Google a la vista? [EN] Aunque no se ha confirmado oficialmente, ha habido fuertes indicios entre el 28 y el 29 de febrero. La comunidad SEO ha notado un aumento en la agitación y algunas herramientas de seguimiento de ranking de terceros están mostrando un aumento en la volatilidad. Permaneced vigilantes…
[Esta semana en Substack]
¿Cómo afecta el tráfico Web en el posicionamiento SEO de tu negocio?
En esta edición de su newsletter, Rafa Villaplana se plantea la pregunta de si el tráfico web que recibimos de canales distintos al orgánico afecta nuestra visibilidad en SEO
Checklist · Mejora tu Substack con estas 30 acciones rápidas
Victor Millán te da 30 acciones que puedes implementar a lo largo de 30 días para mejorar tu newsletter, blog y espacio en Substack.
How to keep a Post ranking in the Top 5 on Google? (AMA) [EN]
Grant Mucha, en su newsletter Holistic SEO, nos da las claves para reforzar cualquier URL que tengas entre los 5 primeros puestos en Google.
[Más lecturas SEO/IA]
Generar contenido con abundante texto usando Google Gemini, por Lino Uruñuela.
7 reasons why your AI content sucks (and how to fix it) [EN], por Brad Smith.
Google Search Console vs Google Business Profile Insights Why Don’t They Match Up: A Case Study of 78 Listings & 1,560 Keywords [EN], por Joy Hawkins.
20 Ways to Monetize Your Newsletter [EN], por TG y EJ White
Totalmente de acuerdo, especialmente acerca de los niños mimados de Google. En Mundo Deportivo se habla de recetas, afeitadores y un montón de cosas que no tienen nada que ver con el deporte, y sale muy arriba en las serp. Se supone que Google preferiría webs especializadas, pero en la realidad no es así.
Me pregunto si no es mejor crear un periódico o revista de noticias y añadir de todo, en vez de crear canales especializados, si el tráfico orgánico mediante Google es importante.