19 de julio de 2025

Los términos clave para saber en el tráfico y la monetización de AI Bot

A medida que la IA generativa reforma cómo se produce el contenido, se raspa, resume, resume y monetizan, el nuevo vocabulario para describir esos procesos está recortando diariamente en la industria de los medios. En mazos de estrategia, conversaciones de licencias, informes de investigación y reuniones de puertas cerradas, los editores están navegando por una... Leer más

Estos son los números que deben saber en la posible compra de IPG en Omnicom

Los negociadores de la publicidad se están preparando para un aumento en 2025

En mazos de estrategia, conversaciones de licencias, informes de investigación y reuniones de puertas cerradas, los editores están navegando por una avalancha de nuevos términos, incluidos «tráfico de clic cero», «agentes de rag» y «protocolo de contenido modelo».

Aquí hay un Jerga Buster para ayudar a dar sentido al vocabulario emergente de Ai-Media Economics, lo que significan estos términos y por qué importan ahora.

Pay-poro

Cómo suena: Una clase de fitness para niños pequeños

Lo que significa: Una idea emergente (y una táctica de negociación) donde las compañías de IA pagaban a los editores cada vez que un bot rastrea su sitio para ingerir contenido. No es una suma global como un acuerdo de licencia, pero cobraría por cada bocado digital. Entonces, cada vez que un LLM se arrastra y se reclla en un sitio, pagaría una cantidad previa al acorden al editor. Queda por ver si se escala.

Pago por querer

Cómo suena: Un hábito de Google muy caro

Lo que significa: Este parece ser el concepto de pago de IA favorecido entre algunos hasta ahora. Es un modelo propuesto donde a los editores se les paga cada vez que su contenido impulsa una respuesta generada por IA. Entonces, no cuando está rastreado, sino cuando se usa. (El argumento es que un rastreo podría alimentar múltiples resultados de consulta, que a los editores no se les pagaría).

Agente de IA

Cómo suena: Un asistente de robot con su propia agenda

Lo que significa: Uno de los términos calurosos del año, estos bots usan tecnología de IA generativa para completar las tareas en nombre de un usuario. Pueden actuar como asistentes virtuales. Es un bot AI más sofisticado (a veces utilizado indistintamente, pero los «bots» generalmente realizan tareas más simples en un formato de conversación, a menudo con respuestas con guiones a las indicaciones) que pueden actuar de forma independiente. Pueden comprar comestibles y reservar reservas de restaurantes a instancias de un usuario. De acuerdo a Definición de Googlelos bots son «reactivos», mientras que los agentes de IA son «proactivos».

Agente de usuario de IA

Cómo suena: Un avatar en un mundo virtual

Lo que significa: Este término también se usa a menudo indistintamente con el «agente de IA», pero los agentes de usuarios de IA interactúan específicamente con el contenido en línea en nombre de un usuario. Por ejemplo, un usuario podría preguntarle a un sistema de IA: «¿Qué es Google Zero?» El sistema le diría al agente de usuarios de IA que recupere esa información, rastrearía sitios como Digiday’s para obtener esa información, y luego el sistema AI generaría una respuesta al usuario en función de esa información. Algunos ejemplos de los principales agentes de usuarios de IA incluyen: GPTBOT, Google-Extended, Claudebot, Anthropic-AI, PerplexityBot, ByTespider y ChatGPT-User.

Agente de trapo

Cómo suena: Un espía que la luna se realiza como un verificador de hechos

Lo que significa: Hay muchos tipos diferentes de bots que arrastran la web para obtener información, y este es uno de ellos. Abreviatura de la generación aumentada de recuperación, un proceso técnico para extraer información del contenido para dar a un LLM y mejorar la calidad de su producción: estos agentes de IA buscan la web y recuperan información actualizada y reciente para responder a las indicaciones de los usuarios en chatbots de IA como ChatGPT. Las respuestas generadas a menudo incluyen citas en fuentes originales de información. El proceso a veces se llama «inferencia», que se refiere al momento en que un modelo de IA responde una pregunta.

Crawler de datos de entrenamiento

Cómo suena: Un robot hambriento de contenido que nunca duerme.

Lo que significa: A diferencia de un agente de RAG, este tipo de AI Bot recopila datos para entrenar LLM, como Meta’s Llama o OpenAI’s GPT. Estos bots recorren la web y descargan contenido para crear grandes conjuntos de datos para enseñar una LLM cómo generar respuestas a las preguntas.

Algunas compañías tecnológicas separan los rastreadores web que usan para capacitar a sus modelos de IA de los bots que raspan la web para obtener información en tiempo real, para que los editores puedan bloquear esos bots. Pero algunos, como Google, no.

Por ejemplo, Google-Extended es el bot de Google que rastrea Internet para entrenar sus modelos de IA. Esto se puede bloquear con robots.txt (ver más abajo). Mientras tanto, Googlebot rastrea los sitios para la indexación de búsqueda y para potenciar los resultados en tiempo real en sus resúmenes de IA Chatbot Gemini y AI, los resúmenes generados por la IA de Google en sus resultados de búsqueda. Se ha convertido en un verdadero punto de conflicto para los editores, que no pueden bloquear el bot y proteger su contenido de ser utilizado para capacitar a los productos de IA de Google, sin eliminarse de los resultados de búsqueda.

El raspado de Bot Rag superó la actividad de raspado de los bots de capacitación este año, según un informe de Tollbit, un mercado de datos para editores y compañías de inteligencia artificial.

«Los rasguños de rag serán mucho más numerosos a medida que los agentes de IA continúen aumentando, mientras que los raspes para la capacitación serán mucho menos y potencialmente más valiosos. También es más difícil fijar el contenido de la capacitación, mientras que el uso de RAG es más fácil de fijar y puede ser dinámico porque es un acceso constante y recurrente», dijo Toshit Panigrahi, cofundador de Tollbit y CEO.

Protocolo de contexto del modelo

Cómo suena: Un libro de reglas de ciencia ficción

Lo que significa: Este marco, creado por AI Company Anthrope, es una forma de indexar contenido y enchufarlo a un LLM para que pueda extraer directamente la información de un conjunto de datos. Si RAG es como un puente desde un sistema de IA hasta contenido en línea, MCP es como un sistema de IA conectado directamente a la salida de ese contenido.

Por ejemplo, un usuario podría llevar todas sus suscripciones de noticias y conectarlas a un chatbot para que pueda acceder a todo su contenido de noticias en esa interfaz, en lugar de ir al sitio de un editor para obtener esa información, según Nicholas Diakopoulos, profesor de periodismo computacional en la Universidad Northwestern.

Eso puede sonar aterrador para un editor que ya ve disminución del tráfico en el sitio, pero esta podría ser otra plataforma para la distribución de contenido e incluso la monetización, dijo Diakopoulos.

«Como usuario final … puedo obtener todo el valor del contenido al que me suscribo a través de cualquier interfaz que quiera. Y creo que ese tipo de pensamiento orientado al usuario puede tener algún valor», dijo. «¿Hay actualmente un mercado para eso? No es que pueda ver, pero podría haber uno, y creo que las organizaciones de noticias podrían estar a la vanguardia de inventar ese mercado».

Robots.txt

Cómo suena: Instrucciones para máquinas bien portadas

Lo que significa: Este humilde archivo de texto le dice a los bots qué partes de nuestro sitio se les permite gatear. En teoría, es como un signo de «mantener fuera» para los raspadores de IA. Pero en la práctica, la mayoría de los LLM lo ignoran, lo leen mal o lo fluyen por completo. Algunos incluso crearán un nuevo rastreador bajo un nuevo nombre si se le ha dicho a su original que deje de gatear. Bane de los editores.

Google Zero

Cómo suena: Una nueva película distópica donde nadie gana

Lo que significa: En el momento en que Google ya no es la puerta de enlace a Internet y se convierte en un motor de respuestas con AI para las consultas de los usuarios. Esta nueva era está siendo impulsada por las descripciones de IA. Sería el final de un canal de tráfico clave para los editores.

Relación de rastreo a referencias

Cómo suena: Una extraña clase de matemáticas

Lo que significa: Esto se refiere a la relación de los rastreos de la página web a las referencias de la página web, por plataforma. Cloudflare rastrea estocon datos que muestran que la relación rastrea a la referencia de las compañías de IA es masiva en comparación con la de Google. (Por ejemplo, en junio de 2025, Google rastrea los sitios web aproximadamente 14 veces por cada referencia, en comparación con la relación rastreo a referente de OpenAI de 1.700: 1). En otras palabras, los bots están raspando los sitios de los editores, mucho más de lo que están refiriendo a las personas reales a esos sitios.

Navegador AI

Cómo suena: El navegador que te conoce mejor que tu mejor amigo

Lo que significa: Los navegadores han recorrido un largo camino desde el OG Internet Explorer. Estas nuevas plataformas impulsadas por la tecnología AI no solo muestran enlaces a sitios y proporcionan una puerta de enlace a la web. Pueden realizar tareas, comprender el lenguaje natural, enviar correos electrónicos, generar informes y reuniones de libros. Los navegadores de IA notables incluyen DIA (de Browser Company of New York), Comet (de Perplexity) y el navegador de OpenAi, según los informes, próximamente.

LLM Content Ingest API

Cómo suena: Un batido para robots

Lo que significa: La iniciativa del IAB Tech Lab para crear un estándar de mercado para el raspado de bot con consumo de editores, que atribuye y compensa a los editores cuando se raspa su contenido. Apoya tanto el pago por tren como el pago por QUIERA.

Botón rojo

Cómo suena: Algo de una película de espías

Lo que significa: El «botón rojo» de Cloudflare (lanzado el 1 de julio) es básicamente un interruptor de pánico para que los editores bloqueen los rastreadores de IA. Se conoce cariñosamente entre los editores como el botón rojo.

Nlweb

Cómo suena: Una red futurista creada por Aliens

Lo que significa: Protocolo web de lenguaje natural de Microsoft que debutó en mayo. El objetivo detrás del proyecto NLWEB es facilitar que los propietarios de sitios web agregue «interfaces conversacionales» (como chatbots) a sus sitios. También puede ayudar a que los sitios web sean más fáciles de acceder por agentes de IA que admiten MCP. Microsoft cree que esta será la nueva versión de HTML. Podría ser el marco para más modelos de monetización de tráfico BOT.

A2A

Cómo suena: Un tipo de batería

Lo que significa: Un protocolo de Google llamado Agent2Agent, anunciado en abril. Tiene como objetivo crear un lenguaje común para ayudar a los agentes de IA que se basan en diferentes marcos para «hablar» entre sí y crear un sistema más interoperable. Al igual que NLWEB, también es compatible con MPC. Fue donado a la Fundación Linux sin fines de lucro en junio.

Marketing Digital