Perplexity responde Cloudflare, apelando para interesses do usuário; veja análise

Willian Porto
18 Min Read

Perplexity diz que tem focado no uso para o usuário final; entretanto, maior controvérsia está em quem decide o que pode ou não ser utilizado.

A recente disputa entre Perplexity e Cloudflare trouxe à tona uma questão crucial sobre o futuro da internet: quem controla o acesso e o uso do conteúdo online na era da inteligência artificial?

Recentemente, Perplexity defendeu seu modelo de “agentes impulsionados pelo usuário” como uma evolução natural da interação humana com a informação, em resposta à Cloudflare, criticando o conteúdo anterior como equivocado.

Isso levanta preocupações legítimas sobre a autonomia das empresas e a sustentabilidade de seus modelos de negócio. A controvérsia não é apenas um embate técnico, mas um debate fundamental sobre a ética, a economia e a governança da informação na era digital. Ou seja, sobre o futuro da informação na Web.

Os bots maliciosos e decisões empresariais

Perplexity argumenta veementemente que seus “agentes impulsionados pelo usuário” são fundamentalmente diferentes dos rastreadores tradicionais, pois só acessam conteúdo quando um usuário real faz uma pergunta específica, sem armazenar ou treinar modelos com essa informação.

- Assine nossa Newsletter -

Eles chegam a afirmar que classificar esses assistentes como “bots maliciosos” seria “criminalizar clientes de e-mail e navegadores da web“, sugerindo que a Cloudflare estaria agindo como um “guardião” que decide o que é tráfego legítimo. Essa comparação, no entanto, simplifica demais a complexidade da interação de um assistente de IA com o conteúdo da web.

Historicamente, o protocolo robots.txt foi estabelecido como um acordo de cavalheiros na internet, permitindo que os proprietários de sites indicassem a rastreadores automatizados (como os de mecanismos de busca) quais partes de seu site poderiam ser indexadas ou não.

Era uma ferramenta para gerenciar a carga do servidor, proteger dados sensíveis e, crucialmente, controlar a forma como a propriedade intelectual era consumida. Embora Perplexity afirme que seus agentes operam de forma diferente dos rastreadores que constroem bancos de dados massivos, declarando que “os agentes impulsionados pelo usuário da Perplexity não armazenam a informação nem treinam com ela“, a distinção entre “buscar para um usuário” e “rastrear para indexação” pode ser muito tênue do ponto de vista da carga do servidor, do consumo de recursos e, mais importante, do uso de propriedade intelectual.

Cada requisição, seja ela de um bot tradicional ou de um “agente do usuário”, consome largura de banda e recursos do servidor. Se milhões de tais requisições ocorrem diariamente, o impacto pode ser significativo para sites menores ou com infraestrutura limitada.

A liberdade das empresas em decidir o que deve e o que não deve ser usado nas respostas por IA é um ponto central e muitas vezes negligenciado. Se um site investe pesadamente na criação de conteúdo original, na pesquisa, na redação e na curadoria, ele tem o direito de controlar se esse conteúdo pode ser prontamente resumido e apresentado por uma IA, potencialmente desviando o tráfego direto e a monetização (como anúncios ou assinaturas) que viriam da visita ao site original.

- Assine nossa Newsletter -

A analogia com navegadores e clientes de e-mail falha aqui, pois esses são ferramentas que exibem o conteúdo em sua forma original, permitindo que o usuário interaja diretamente com o site, veja seus anúncios e contribua para suas métricas de tráfego. Um assistente de IA, por outro lado, processa, reempacota e sintetiza o conteúdo, transformando-o em uma nova forma de consumo que pode contornar completamente os mecanismos de monetização do criador original. Isso levanta questões sobre a apropriação de valor e a compensação justa na economia da informação.

O malefício é o que destrói um negócio

Perplexity acusa a Cloudflare de que “o superbloqueio prejudica a todos” e de criar uma “internet de duas camadas onde seu acesso não depende de suas necessidades, mas de se suas ferramentas escolhidas foram abençoadas por controladores de infraestrutura“, sugerindo que isso “prejudica a todos” e cria uma “internet de duas camadas”.

Essa é uma preocupação válida sobre a centralização do poder na web. No entanto, o que Perplexity pode considerar uma ferramenta útil e inovadora, um criador de conteúdo pode ver como uma ameaça existencial ao seu modelo de negócio, transformando o “útil” em “malefício”.

- Assine nossa Newsletter -

Considere o impacto econômico para diferentes tipos de negócios online:

  • Sites de Notícias e Mídia: Estes dependem criticamente de visualizações de página, cliques em anúncios e assinaturas. Se um assistente de IA pode extrair a essência de suas reportagens, manchetes e análises e apresentá-las diretamente ao usuário, sem que este precise visitar o site, o valor do conteúdo original diminui drasticamente. As visualizações caem, a receita de publicidade despenca, e o negócio se torna inviável. A capacidade de financiar jornalismo investigativo e reportagens de qualidade é comprometida.
  • Blogs e Criadores de Conteúdo: Muitos blogueiros e criadores de conteúdo monetizam através de marketing de afiliados, vendas de produtos digitais ou anúncios contextuais. Se o conteúdo é resumido por uma IA, o tráfego que levaria a essas conversões é perdido. O esforço e o custo de produção de conteúdo original não são recompensados.
  • E-commerce e Sites de Revisão: Embora Perplexity mencione “comparar avaliações de produtos“, se um assistente de IA pode fornecer um resumo conciso das melhores ofertas ou das características de um produto sem direcionar o usuário para a página do produto ou para o site de e-commerce, as vendas e as comissões podem ser afetadas.

A questão não é apenas sobre a “intenção” do bot (ser “malicioso” ou “útil”), mas sobre o impacto econômico direto e a apropriação de valor.

Se o modelo de negócio de um criador de conteúdo é baseado na atenção e no tráfego diretos, qualquer tecnologia que subverta isso, mesmo que seja para “servir ao usuário”, pode ser percebida como prejudicial.

A capacidade de um assistente de IA de fornecer respostas concisas e imediatas, sem a necessidade de o usuário navegar por diversas páginas, embora conveniente para o usuário, pode ser o golpe final para a viabilidade de muitos negócios online que dependem do tráfego direto.

Isso pode levar a uma “corrida para o fundo” na qualidade do conteúdo, pois os criadores não terão incentivo financeiro para produzir material aprofundado e original se ele puder ser facilmente extraído e reempacotado sem compensação. A “internet de duas camadas” pode, de fato, surgir, mas não apenas pela ação de “controladores de infraestrutura”, mas também pela erosão do valor do conteúdo original, marginalizando os criadores em favor dos agregadores de IA.

A guerra fria

Perplexity não poupa críticas à Cloudflare, acusando-a de “conseguir errar quase tudo sobre como os assistentes de IA modernos realmente funcionam“, de “atribuir erroneamente milhões de requisições“, e de ter “erros técnicos na análise da Cloudflare que não são apenas embaraçosos — são desqualificadores“.

As alegações de que a Cloudflare confundiu o tráfego da Perplexity com o da BrowserBase (um serviço de navegador em nuvem de terceiros que Perplexity usa ocasionalmente), e que a empresa buscou um “momento de publicidade inteligente“, são acusações sérias que minam a confiança na competência da Cloudflare em sua área de atuação principal, que é justamente a segurança e a gestão de tráfego web.

Se as afirmações de Perplexity forem verdadeiras, isso levanta questões significativas sobre a capacidade da Cloudflare de distinguir entre diferentes tipos de tráfego automatizado, o que é crucial para sua função como provedora de segurança e infraestrutura.

Entretanto, como você já deve ter observado, a atual guerra é mais sobre narrativos do que sobre ajuda real às empresas que realmente precisam. Observe que tanto com o anúncio ao Pay to Crawl quanto essa guerra declarado contra Perplexity colocam a Cloudlfare como guardiã dos servidores e dos documentos presentes.

Por mais que possamos concordar com vários dos argumentos de Cloudflare, precisamos considerar seus objetivos de… negócios.

falta de transparência da Cloudflare, conforme destacado por Perplexity (“Como a Cloudflare convenientemente ofuscou sua metodologia e se recusou a responder a perguntas que ajudariam nossas equipes a entender“), agrava a situação, dificultando a resolução técnica e a compreensão pública da disputa.

Nesse cenário, a resposta da Perplexity visa desqualificar o debate no aspecto técnico, sem necessariamente, entrar no mérito ético e legal. Veja:

De acordo com a empresa, a publicação de um “diagrama técnico supostamente mostrando o ‘fluxo de trabalho de rastreamento da Perplexity’ que não se parece em nada com o funcionamento real da Perplexity” é particularmente embaraçosa para uma empresa que se posiciona como autoridade em tráfego web. Perplexity conclui que “os sistemas da Cloudflare são fundamentalmente inadequados para distinguir entre assistentes de IA legítimos e ameaças reais. Se você não consegue distinguir um assistente digital útil de um scraper malicioso, então provavelmente não deveria estar tomando decisões sobre o que constitui tráfego web legítimo.

No entanto, mesmo que a Cloudflare tenha cometido erros técnicos em sua análise inicial, a controvérsia subjacente permanece: como equilibrar a inovação da IA e o acesso à informação com os direitos dos criadores de conteúdo e a necessidade de modelos de negócio sustentáveis na web?

A disputa destaca a falta de clareza e de um consenso sobre novas regras de engajamento para a IA na web. O que é “legítimo” e o que é “abusivo” está sendo redefinido, e a linha entre o que é “útil para o usuário” e o que é “prejudicial para o criador” é cada vez mais borrada. A sugestão de Perplexity de “Basta perguntar” (referindo-se à possibilidade de a Cloudflare ter entrado em contato para entender seus sistemas) aponta para a necessidade de um diálogo e colaboração mais proativos na indústria, em vez de bloqueios e acusações públicas.

A questão principal: sites são privados

A essência do argumento da Perplexity reside no desfoque entre um “bot” tradicional e um “agente do usuário”. Eles afirmam que um assistente de IA funciona “assim como um assistente humano“, buscando informações em tempo real apenas quando solicitado por um usuário, e que “a informação é usada imediatamente para responder à sua pergunta. Ela não é armazenada em bancos de dados massivos para uso futuro, e não é usada para treinar modelos de IA.

Isso levanta questões práticas profundas: um IA agindo em nome de um usuário é verdadeiramente indistinguível do próprio usuário em termos de direitos de acesso à web?

Se um assistente de IA é visto como uma extensão do usuário, então as restrições tradicionais de robots.txt ou a detecção de bots podem parecer arbitrárias. No entanto, a escala e a velocidade com que esses “agentes” podem operar são ordens de magnitude maiores do que a capacidade de um humano.

O que acontece quando milhões de usuários simultaneamente pedem a seus assistentes de IA para resumir o mesmo artigo de notícias? Isso pode gerar um volume de tráfego que se assemelha a um ataque DDoS, mesmo que a intenção não seja maliciosa.

A Perplexity também menciona que a Cloudflare alegou “rastreamento furtivo” e “táticas de personificação”. Se um agente de IA não se identifica claramente (por exemplo, através de um user-agent string específico) ou tenta contornar as restrições de um site, isso pode ser interpretado como uma violação da autonomia do proprietário do site, independentemente da intenção final de “servir ao usuário”.

A evolução da interação com a web exige que os padrões existentes, como robots.txt, sejam revisitados ou que novos protocolos sejam desenvolvidos para acomodar a natureza dos agentes de IA, garantindo que os sites possam diferenciar entre tráfego benéfico e prejudicial, e que os criadores de conteúdo tenham controle sobre como seu trabalho é consumido.

Nesse sentido, um portal pode, se achar relevante, bloquear até mesmo acessos humanos, como já acontece como os paywalls tradicionais. Ao se tratar de um conteúdo de determinado site, apenas ele tem autonomia para decidir mudanças profundas na experiência do usuário. Pode um conteúdo ser acessado por bots? Eles são interessantes para nossa estrutura? Conversam com nossa estratégia? Nos são benéficos?

Interesses mútuos

A controvérsia entre Perplexity e Cloudflare é um microcosmo de um debate maior que a internet precisa enfrentar.

De um lado, temos a promessa de assistentes de IA que tornam a informação mais acessível e personalizada para os usuários, impulsionando a inovação e a conveniência. Do outro, a preocupação legítima dos criadores de conteúdo e das empresas que dependem do tráfego direto para monetizar seu trabalho e sustentar sua existência.

Sem um diálogo claro e a criação de novas normas que respeitem tanto a inovação quanto a sustentabilidade dos negócios online, corremos o risco de criar uma web onde a “liberdade” de acesso por IA pode, paradoxalmente, levar à inviabilidade e ao desaparecimento de muitas fontes de conteúdo valiosas.

É importante que as empresas, os criadores de conteúdo e os desenvolvedores de IA trabalhem juntos para definir um caminho que permita a evolução da interação com a informação sem destruir os ecossistemas que a produzem. Algumas soluções potenciais incluem:

  • Desenvolvimento de Protocolos para Agentes de IA: Além do robots.txt, poderíamos ter novos padrões que permitam aos sites especificar como os agentes de IA podem interagir com seu conteúdo, talvez com diferentes níveis de permissão para sumarização, extração de dados, etc.
  • Identificação clara de Agentes de IA: Exigir que todos os agentes de IA se identifiquem de forma transparente e consistente, permitindo que os sites os diferenciem de rastreadores maliciosos e apliquem políticas específicas.
  • Modelos de compensação e compartilhamento de receita: Explorar formas pelas quais os criadores de conteúdo possam ser compensados pelo uso de seu material por assistentes de IA, seja através de micro-pagamentos, modelos de licenciamento ou compartilhamento de receita de publicidade.
  • Mecanismos de Opt-in/Opt-out mais granulares: Dar aos proprietários de sites controle mais refinado sobre se e como seu conteúdo é acessado e usado por diferentes tipos de IA.
  • Diálogo contínuo e construção de confiança: Promover fóruns e discussões entre todas as partes interessadas para estabelecer diretrizes éticas e práticas para a IA na web.

No Brasil, por exemplo, editores se referiram a Perplexity de forma negativa, afirmando que ela se abstêm dos debates sobre remuneração dos conteúdos utilizados.

A resolução desta disputa e de outras semelhantes moldará o futuro da internet. É uma oportunidade para construir uma web mais justa e sustentável, onde a inovação da IA coexiste com o respeito pelos direitos dos criadores e a viabilidade dos modelos de negócio que produzem o conteúdo que alimenta a própria IA.

Nos principais países, é difícil imaginar que criadores e Big Techs consigam chegar a acordos sem a intermediação governamental. Por isso, provavelmente, precisamos que todos os atores definam em conjunto as regras, visando o bem da coletividade e da democracia.

Na resposta, Perplexity se apoia nos interesses do usuário. Mas tais experiências só devem ser consideradas quando benéfica para a empresa-fonte. Não é possível na Web desconsiderar a fonte da informação, visando um possível interesse no usuário.

Publisher e Especialista em SEO | Web |  + posts

Publisher do "Não é Agência!" e Especialista de SEO, Willian Porto tem mais de 21 anos de experiência em projetos de aquisição orgânica. Especializado em Portais de Notícias, também participou de projetos em e-commerces, como Americanas, Shoptime, Bosch e Trocafone.

TAGGED:
Compartilhe este artigo