Recentemente, o julgamento do caso “Andrea Bartz, Charles Graeber, e Kirk Wallace Johnson vs. Anthropic PBC” trouxe à tona discussões cruciais sobre direitos autorais e “Fair Use” (Uso Justo) na era da Inteligência Artificial.
A decisão do tribunal, que concedeu “Fair Use” para o uso de obras protegidas por direitos autorais no treinamento de Modelos de Linguagem Grande (LLMs) e para a digitalização de cópias físicas adquiridas, enquanto negou “Fair Use” para cópias obtidas de fontes piratas, redefine as fronteiras éticas e legais do conteúdo digital.
No cenário digital atual, em que o conteúdo é parte fundamental dos portais de notícias e conteúdo, surge a indagação: como utilizar conteúdo existente de forma ética e legal? A resposta muitas vezes reside no conceito de “Fair Use” (Uso Justo), uma doutrina legal que permite o uso limitado de material protegido por direitos autorais sem a necessidade de permissão do detentor dos direitos.
Entender o “Fair Use” é vital para criadores de conteúdo, profissionais de marketing e qualquer um que opere online, especialmente em um contexto onde a linha entre inspiração e infração pode ser tênue.
O Que é “Fair Use”?
O “Fair Use”, ou Uso Justo, é uma defesa legal contra alegações de infração de direitos autorais. Ele reconhece que, em certas circunstâncias, o uso de material protegido por direitos autorais para fins como crítica, comentário, notícias, ensino, bolsa de estudos ou pesquisa pode ser permitido sem a necessidade de permissão do detentor dos direitos.
A Seção 107 da Lei de Direitos Autorais dos EUA estabelece quatro fatores que devem ser considerados ao determinar se um uso é justo:
- O propósito e o caráter do uso, incluindo se tal uso é de natureza comercial ou para fins educacionais sem fins lucrativos;
- A natureza da obra protegida por direitos autorais;
- A quantidade e a substancialidade da porção usada em relação à obra protegida por direitos autorais como um todo; e
- O efeito do uso sobre o mercado potencial ou o valor da obra protegida por direitos autorais.
Esses fatores são ponderados em conjunto, e nenhum deles é determinante por si só.
Principais casos de repercussão e suas implicações para portais
O documento que analisa o caso “Bartz et al. v. Anthropic PBC” fornece insights valiosos sobre como o “Fair Use” é interpretado na era da Inteligência Artificial e do conteúdo massivo.
1. Treinamento de LLMs (Modelos de Linguagem Grande)
No cerne do caso Anthropic, está a questão de saber se o uso de milhões de livros protegidos por direitos autorais para treinar LLMs, como o Claude, constitui “Fair Use”.
- A Ponderação e os Argumentos do Tribunal: O tribunal considerou o treinamento de LLMs “extraordinariamente transformador“. A finalidade do uso não era replicar as obras, mas sim permitir que o LLM “girasse uma esquina acentuada e criasse algo diferente“, ou seja, textos novos.
A intenção não é que o LLM produza cópias literais, mas sim que aprenda padrões de escrita para gerar conteúdo original. Os autores argumentaram que o treinamento de LLMs era análogo a treinar uma pessoa para ler e escrever, e que, portanto, a Anthropic deveria ser excluída de tal uso.
O tribunal refutou, afirmando que “todos leem textos, e então escrevem novos textos… fazer com que alguém pague especificamente pelo uso de um livro cada vez que o lê, cada vez que o recorda da memória, cada vez que o usa posteriormente ao escrever coisas novas de novas maneiras seria impensável“.
Eles também contestaram a alegação dos autores de que o treinamento visava memorizar elementos criativos, argumentando que os LLMs da Anthropic não reproduziram ao público os elementos criativos ou o estilo expressivo identificável de um autor, e que a Lei de Direitos Autorais não se estende a “métodos de operação, conceitos ou princípios“.
Adicionalmente, a alegação de que computadores não deveriam fazer o que as pessoas fazem foi distinguida de casos anteriores, sendo o uso em questão mais alinhado com a geração de novo texto legal, que já foi considerado uso justo.
Quanto à quantidade e substancialidade, embora obras inteiras fossem copiadas, o tribunal considerou razoável, pois o uso era “o mais ortogonal possível” ao uso ordinário de um livro, e não havia alegação de que as saídas do LLM fossem infratoras. A necessidade de usar esses livros, mesmo que não “estritamente necessário”, foi justificada pelo volume monumental de texto exigido para treinar um LLM. - Repercussão evidente: “O propósito e o caráter de usar obras protegidas por direitos autorais para treinar LLMs para gerar novos textos foi quintessencialmente transformador. Como qualquer leitor que aspira a ser escritor, os LLMs da Anthropic treinaram em obras não para correr à frente e replicá-las ou suplantá-las, mas para virar uma esquina acentuada e criar algo diferente.” Este ponto é crucial para o desenvolvimento da IA e para portais de conteúdo, pois sugere que a ingestão de vastas quantidades de dados para treinamento, visando a geração de conteúdo original, pode ser protegida pelo “Fair Use”.
- Implicações para Portais de Conteúdo: Para portais de conteúdo, isso significa que ferramentas de IA que geram conteúdo podem ser amplamente utilizadas, desde que seu objetivo seja produzir material original e não cópias ou parafraseados de obras existentes. O foco deve ser na transformação dos dados de entrada em algo novo e distinto, o que pode agilizar a criação de artigos, resumos, e outros formatos de conteúdo para engajar a audiência.
2. Digitalização de cópias físicas adquiridas
Outro ponto abordado no caso é a digitalização de milhões de livros físicos comprados pela Anthropic para sua biblioteca central.
- A ponderação e os argumentos do Tribunal: O tribunal considerou a mudança de formato de cópias impressas para digitais como “Fair Use” por uma razão diferente da do treinamento. Não se tratava de criar novas cópias, mas de “substituir as cópias impressas que havia comprado para sua biblioteca central por cópias digitais mais convenientes, economizadoras de espaço e pesquisáveis para sua biblioteca central“.
A finalidade era facilitar o armazenamento e a busca, sem adicionar novas cópias ou redistribuir as existentes. O tribunal citou casos anteriores, como a digitalização para economizar espaço (Texaco), para expor informações sobre a obra (Google Books), ou para “time-shifting” (Sony Betamax), contrastando com situações onde a digitalização resultou na multiplicação de cópias compartilhadas (Napster).
O tribunal enfatizou que, embora a Anthropic seja uma entidade comercial, o cerne da preocupação do “Fair Use” com o uso comercial é proteger os detentores de direitos autorais de explorações indevidas.
Como a Anthropic já havia adquirido as cópias impressas legalmente e não criou novas cópias para compartilhar ou vender, a mudança de formato não usurpou os direitos reservados ao autor. A ideia de que os autores poderiam querer cobrar mais por cópias digitais foi rejeitada, com o tribunal citando que a Constituição não sugere um direito de dividir mercados ou cobrar preços diferentes pelo mesmo livro. - Repercussão evidente: “Aqui, por razões mais estreitas do que a Anthropic oferece, a mera mudança de formato foi um uso justo. Armazenamento e pesquisabilidade não são propriedades criativas da obra protegida por direitos autorais em si, mas propriedades físicas da moldura ao redor da obra ou propriedades informacionais sobre a obra.” Isso estabelece um precedente importante para a digitalização de acervos próprios.
- Implicações para Portais de Conteúdo: Embora menos direta para a criação de conteúdo, esta decisão é relevante para a gestão de grandes bases de dados e arquivos de conteúdo em portais. Empresas podem digitalizar seus próprios materiais para fins de pesquisa e análise interna, o que pode indiretamente informar estratégias de conteúdo ao facilitar o acesso a informações para curadoria de conteúdo e pesquisa.
3. Cópias piratas de biblioteca
O ponto mais controverso e onde a Anthropic não obteve sucesso foi em relação às cópias obtidas de sites piratas.
- A Ponderação e os Argumentos do Tribunal: O tribunal rejeitou a alegação de “Fair Use” para as cópias piratas.
Mesmo que algumas dessas cópias fossem usadas para treinamento de LLMs (um uso transformador), a aquisição inicial de milhões de livros de fontes piratas para “construir uma biblioteca central, de propósito geral, de textos” não foi considerada “Fair Use”.
A Anthropic “não tinha direito de usar cópias piratas para sua biblioteca central“. A Anthropic argumentou que sua má-fé na pirataria não deveria “curto-circuitar” a análise de uso justo, mas o tribunal reiterou que a análise objetiva mostrava a pirataria como um substituto para cópias pagas.
A tentativa da Anthropic de justificar a pirataria como um “atalho” para um uso altamente transformador foi rejeitada, com o tribunal afirmando que o uso objetivo é o que importa. A distinção do caso Texaco foi enfatizada, pois, ao contrário da Anthropic, a Texaco havia comprado as cópias.
O tribunal também refutou a ideia de que as cópias não estavam disponíveis para compra legal, apontando que a pirataria foi uma escolha deliberada. Diferentemente de casos onde cópias iniciais foram transformadas imediatamente em formas alteradas (como miniaturas para motores de busca), as cópias de texto completo da Anthropic foram mantidas “para sempre”.
A distinção com os casos do Google Books também foi crucial: no Google Books, as bibliotecas tinham cópias autorizadas e os usos eram para fins específicos e diretos (apontar para as obras, atender deficientes visuais, backup), com controles rigorosos. A Anthropic não tinha cópias autorizadas inicialmente e não implementou controles semelhantes. O tribunal concluiu que a pirataria inicial “plainamente deslocou a demanda pelos livros dos autores, cópia por cópia”, e que permitir tal prática “destruiria todo o mercado editorial“. - Repercussão Evidente: “Construir uma biblioteca central de obras para estar disponível para qualquer número de outros usos foi em si o uso para o qual a Anthropic adquiriu essas cópias. Um uso posterior foi fazer outras cópias para treinar LLMs. Mas nem todo livro que a Anthropic pirateou foi usado para treinar LLMs. E, cada cópia de biblioteca pirateada foi retida mesmo que fosse determinado que não seria usada. Pirataria de cópias para construir uma biblioteca de pesquisa sem pagar por ela, e para reter cópias caso se mostrem úteis para uma coisa ou outra, foi um uso próprio – e não um uso transformador.”
Essa é uma distinção crucial: o uso subsequente transformador (treinamento de LLMs) não “abençoa” a pirataria original. - Implicações para Portais de Conteúdo: O simples fato de uma LLM adquirir uma obra é o suficiente para o treinamento. O que é vedado, apenas, é consegui-lo por meio de pirataria. Nesse sentido, as empresas teriam amplo direito de acessar um conteúdo público para treinar seus modelos.
Pontos controversos da decisão
A decisão no caso Anthropic, embora busque equilibrar o avanço tecnológico com a proteção dos direitos autorais, não está isenta de controvérsias.
Por um lado, a declaração de que o treinamento de LLMs é um “uso quintessencialmente transformador” é vista por muitos como um reconhecimento vital da inovação no campo da IA.
Permite que empresas continuem desenvolvendo modelos que podem processar e gerar texto de maneiras complexas e úteis, sem serem paralisadas por litígios de direitos autorais a cada dado de treinamento.
Argumenta-se que, assim como humanos aprendem com textos existentes para criar novos, as IAs deveriam ter essa prerrogativa, especialmente se as saídas não forem cópias diretas ou substitutos de mercado. Esta interpretação ampla de “transformador” pode ser um alívio para a indústria de IA, que depende de vastos datasets.
No entanto, essa mesma interpretação levanta preocupações significativas. Críticos argumentam que permitir o uso irrestrito de obras protegidas por direitos autorais para treinamento de IA, mesmo que seja para um “uso transformador”, desvaloriza o trabalho criativo original.
Entende-se que o trabalho de terceiros foi utilizado sem o devido pagamento. Em alguns casos, a própria obra pode se tornar dispensável. Tome, por exemplo, como nos casos julgados, um livro. Mesmo que o modelo não faça citações diretas, ele é capaz de resumir e fornecer aos usuários as informações necessárias.
Além disso, teme-se que se as editoras e os autores não forem compensados pelo uso de suas obras no treinamento de LLMs, o incentivo para criar e publicar novos conteúdos diminuirá.
A distinção entre “aprender” e “memorizar” no contexto da IA é complexa e pode ser difícil de fiscalizar, levando a receios de que a “memorização” de obras pelos LLMs possa levar, eventualmente, à geração de conteúdo derivado que concorra diretamente com o original, mesmo que de forma sutil. A decisão abre uma “caixa de Pandora” para a exploração de obras criativas sem compensação justa.
A negação do “Fair Use” para cópias piratas, por outro lado, é amplamente aplaudida. Reforça a importância da legalidade na aquisição de dados e serve como um forte lembrete de que a má-fé na obtenção de material não será perdoada sob a doutrina do “Fair Use”. Esta parte da decisão estabelece um limite claro e necessário para a indústria, garantindo que a inovação não venha às custas da pirataria desenfreada. Contudo, para algumas empresas, pode representar um desafio logístico e financeiro na curadoria de grandes volumes de dados de treinamento, forçando-as a investir em licenciamento ou em métodos de aquisição mais caros.
Em suma, a decisão do tribunal sobre o caso Anthropic representa um marco importante na intersecção entre tecnologia e direito autoral. Enquanto pavimenta o caminho para a inovação em IA, ela também levanta questões complexas sobre a proteção do trabalho criativo na era digital, e é provável que continue a ser objeto de debate e futuros litígios.
Publisher do "Não é Agência!" e Especialista de SEO, Willian Porto tem mais de 21 anos de experiência em projetos de aquisição orgânica. Especializado em Portais de Notícias, também participou de projetos em e-commerces, como Americanas, Shoptime, Bosch e Trocafone.
- Willian Portohttps://naoeagencia.com.br/author/naoeagencia/
- Willian Portohttps://naoeagencia.com.br/author/naoeagencia/
- Willian Portohttps://naoeagencia.com.br/author/naoeagencia/
- Willian Portohttps://naoeagencia.com.br/author/naoeagencia/