Google modificó su algoritmo y crea artículos propios

Recientemente Google publicó un artículo sobre su nuevo algoritmo, el cual toma diferentes extractos de diversas webs y genera artículos “coherentes”. ¿La finalidad? Ante la pregunta de un usuario Google puede responder creando sus respuestas en el momento sin tener que enviarlos a otra web.

Funcionamiento del algoritmo “Paraphrasing”

Este algoritmo funciona de manera similar al generador de fragmentos destacados: resume el contenido de una web, extrayendo el contenido relevante y descartando lo que considera no lo es. A esto lo han denominado “extractive summaries” (resúmenes atractivos) porque justamente realizan eso: extraer contenidos de una web y armar un nuevo artículo. Luego se suman al algoritmo llamado “abstractive summary” (resumen abstracto) y así arman el contenido.

La nueva investigación de Google ha descubierto una forma de unir lo mejor de ambos enfoques. Usan “resúmenes extractivos” para extraer los hechos importantes de los documentos web y luego aplican el enfoque “abstracto” para parafrasear el contenido. Este enfoque crea un nuevo documento basado en la información que se encuentra en la web y crea la propia versión de Wikipedia de Google.

De acuerdo con Google:

“Mostramos que la generación de artículos en inglés Wikipedia se puede abordar como un resumen multidocumento de documentos originales”.

Esto significa que Google puede salir y recopilar información sobre un tema de varias páginas web y “Utilizamos el resumen extractivo para identificar groseramente la información relevante

El siguiente paso es usar:

“... un modelo abstracto neuronal para generar el artículo“.

Esto significa que Google tomará los significados extraídos y usará un “modelo abstracto neuronal” para resumir esos hechos (extraídos de muchos sitios web) en frases y párrafos de aspecto natural para crear un artículo. Y que estos artículos han pasado de manera exitosa el “examen” humano.

Mostramos que este modelo puede generar párrafos fluidos y coherentes de múltiples oraciones … Cuando se les presentan documentos de referencia, demostramos que pueden extraer información objetiva relevante reflejada en … evaluaciones humanas“.

Los fragmentos destacados son el primer paso

Los fragmentos destacados son un ejemplo de Resumen Extractivo. Es el proceso de tomar una página web completa y luego desechar las palabras y frases irrelevantes manteniendo solo las pocas oraciones que comunican la respuesta a una pregunta.

¿Algoritmo de Google resume su contenido?

Este algoritmo consiste en resumir “documentos múltiples” y resumirlos. Esto se puede aplicar a los libros. Esto se puede aplicar a bases de datos de fuente abierta. Pero esto también se puede aplicar a cualquier página web pública, incluido su contenido.

La investigación utiliza los temas de Wikipedia como la búsqueda de búsqueda y los resultados del motor de búsqueda como fuente para los resúmenes extraídos  que luego se parafrasean para crear nuevos artículos. Este algoritmo también hizo una prueba lado a lado al generar también un segundo conjunto de artículos usando solo las referencias citadas por Wikipedia.

Cómo es el proceso

Utilizan los temas de Wikipedia como consultas de búsqueda y los resultados de las SERPS como el material de origen para la generación de páginas nuevas que mostrarán el resultado a una pregunta sin mostrar un enlace a la web.

El documento de investigación no menciona si Google mostrará su propio contenido creado a partir de su contenido. Tampoco se discute si Google agregará enlaces a los materiales fuente, ya sea como parte de los SERP o como un enlace a pie de página.

Google ya no necesita mostrar nuestro contenido

El trabajo de investigación concluye que su experimento es exitoso. Google puede generar su propio contenido respondiendo así la pregunta de un usuario sin necesidad de que deba ingresar en una web para obtener la respuesta.

Esto es lo que dice el documento de investigación de Google:

Hemos demostrado que la generación de Wikipedia se puede abordar como un problema de resumen de múltiples documentos …

Esa frase “multi-documento” significa cualquier documento que esté disponible libremente, incluidas sus páginas web y las páginas web de tus competidores.

Y esto es lo que dice el informe sobre el éxito del algoritmo:

Este modelo supera significativamente las arquitecturas codificadoras-decodificadoras tradicionales en secuencias largas, lo que nos permite condicionar muchos documentos de referencia y generar artículos coherentes e informativos“.

Eso significa que Google puede usar muchas páginas web para generar artículos “coherentes” e “informativos”. Veremos cómo continúa esta nueva experiencia ya que a largo plazo puede llegar a ser contraproducente si las webs dejan de actualizar y generar contenido ya que Google no las tomará en cuenta.

¿Utilizará Google este algoritmo con el asistente de voz?

Un algoritmo como este es perfecto para la búsqueda mediante el asistente de voz (búsquedas realizadas a través de un teléfono móvil o un dispositivo con acceso a Internet). Este asistente busca responder a las preguntas como si fuera una persona real, brindando información y comentarios como respuesta a la consulta realizada.

¿Qué nuevos rumbos nos está preparando y deparando la gran G?

Paraphrasing algoritmo google

Fuente: https://www.searchenginejournal.com/

Deja un comentario

Tu dirección de correo electrónico no será publicada.

Información sobre protección de datos.
  • Responsable: Paula Alvarez
  • Fin del tratamiento: controlar spam, gestión de comentarios
  • Legitimación: tu consentimiento
  • Comunicación de los datos: No se comunicarán los datos a terceros salvo por  obligación legal
  • Derechos: Acceso, rectificación, portabilidad, olvido.
  • Contacto: hola@estamosonline.net