24 de junho de 2025
compartilhe
EUIPO publica relatório sobre desenvolvimento da IA generativa sob a perspectiva dos direitos autorais
Em maio de 2025, o Escritório de Propriedade Intelectual da União Europeia (EUIPO) publicou o relatório “The Development of Generative Artificial Intelligence from a Copyright Perspective” (Desenvolvimento da Inteligência Artificial Generativa sob a Perspectiva dos Direitos Autorais), que analisa os desafios e oportunidades trazidos pela inteligência artificial generativa (GenAI) no contexto do direito autoral europeu.
O objetivo do estudo é esclarecer como a GenAI interage com os direitos autorais do ponto de vista técnico, jurídico e econômico. Para isso, o documento examina como conteúdos protegidos por direitos autorais são utilizados no treinamento de modelos de GenIA, qual é o marco legal aplicável na União Europeia, como os titulares podem reservar seus direitos por meio de mecanismos de opt-out e quais tecnologias existem para marcar ou identificar conteúdos gerados por IA.
Inicialmente, o estudo esclarece que a GenAI coleta dados (frequentemente por meio de técnicas como web scraping), muitas vezes protegidos por direitos autorais, e os processa para gerar novos conteúdos. Esse processo inicial de alimentação e treinamento da GenAI é denominado no estudo de “GenAI Input”, sendo definido como o conjunto de etapas que compreendem a coleta de dados, sua anotação, limpeza e processamento, além das fases de treinamento da IA — que incluem desde o pré-treinamento do modelo até o ajuste fino, com o objetivo de otimizar a execução de tarefas específicas. Também integra esse processo a eventual inclusão de dados adicionais para a etapa de aprendizado por reforço (reinforcement learning).
É também explicado no relatório que, além da GenAI utilizar conteúdos protegidos por direitos autorais em seu treinamento, ela pode acabar por também os utilizar na criação direta do novo conteúdo. Isso porque, devido ao custo e à complexidade do treinamento de sistemas de GenAI, a tecnologia de Geração Aumentada em Tempo Real (RAG) tem sido cada vez mais utilizada. Essa tecnologia combina a GenAI com mecanismos de busca para acessar informações atualizadas na internet e gerar saídas mais recentes, sem a necessidade de retreinar o modelo completamente. O conteúdo criado pela GenAI recebe o nome de “GenAI Output”.
Em seguida, o documento apresenta o panorama legal da União Europeia (UE) sobre o uso de conteúdo protegido por IA, destacando a Diretiva sobre Direitos de Autor no Mercado Único Digital (CDSM) e a Lei de Inteligência Artificial da União Europeia (AI Act). A Diretiva CDSM estipula exceções ao direito exclusivo de reprodução dos titulares de direitos autorais. No seu artigo 3º da norma garante a possibilidade de mineração de dados (TDM) para treinamento de sistemas de IA, sem a autorização do titular dos dados, desde que realizada com fins de pesquisa científica (Artigo 3º). Já no seu artigo 4º, a diretiva prevê a possibilidade de TDM para treinamento de sistemas de IA, em qualquer caso, desde que respeitados os direitos dos titulares, que podem exercer o chamado “opt-out” para impedir o uso de suas obras sem autorização. Já o AI Act impõe regras ao uso de IA na UE, exigindo respeito aos opt-outs de TDM, transparência nos dados de treinamento e identificação legível das saídas geradas por GenAI.
Na dimensão econômica, o estudo destaca acordos diretos de licenciamento entre titulares de direitos autorais e desenvolvedores de GenAI para uso de conteúdos protegidos no treinamento desses sistemas. Esses acordos são impulsionados por fatores como a escassez de dados de qualidade e o equilíbrio de poder nas negociações. Setores como imprensa e publicações científicas despontam como os mais preparados para aproveitar essas oportunidades, especialmente em aplicações baseadas em recuperação aumentada por geração (RAG).
O documento também analisa as soluções técnicas e jurídicas disponíveis para que titulares de direitos possam preservar suas obras na fase de Input. Nesse sentido, o Protocolo de Exclusão de Robôs (REP) é um dos mecanismos de opt-out para TDM. O REP é usado por sites para tentar controlar o acesso de robôs de coletas de dados. Entretanto, o estudo observa que o REP não é um mecanismo eficaz, servindo apenas como uma solução temporária.
Como não há uma solução única e eficaz para viabilizar o opt-out, o estudo indica que diversas medidas legais e técnicas são combinadas para proteger os direitos autorais. As medidas de natureza jurídica para a reserva de direitos mencionadas no documento incluem declarações unilaterais dos titulares de direitos autorais; restrições contratuais de licenciamento; e os termos e condições de uso dos sites.
Já as medidas técnicas para a reserva de direitos, além do REP, incluem: soluções desenvolvidas especificamente para possibilitar a exclusão de conteúdos da TDM, como os protocolos de reserva para TDM; soluções que estão sendo adaptadas para esse fim, como as iniciativas de autenticidade de conteúdo da C2PA; e ainda soluções em fase de desenvolvimento, que visam criar uma infraestrutura mais ampla para a gestão de direitos autorais no ambiente online, como a infraestrutura Liccium Trust Engine ou a plataforma Open Rights Data Exchange da empresa Valuenode. Adicionalmente, o estudo aponta que o EUIPO desempenha papel crucial no suporte técnico e na conscientização sobre a gestão das reservas de direitos aplicadas à GenAI.
Por fim, o relatório aponta que o AI Act exige transparência sobre os outputs gerados por sistemas de GenAI e avalia soluções para identificar e divulgar a natureza desse conteúdo gerado. Essas medidas incluem rastreamento de proveniência, detecção de conteúdo gerado por IA e processamento para reidentificação, cada uma com vantagens e limitações. Além disso, desenvolvedores adotam técnicas como filtros e edição do modelo para mitigar riscos de violações de direitos autorais nas saídas geradas.
A documento pode ser acessado através do link: Desenvolvimento da Inteligência Artificial Generativa pela Perspectiva dos Direitos Autorais