MUNDO
OpenAI training data ‘contains millions’ of NYT and Daily News works

PUBLICADO
5 meses atrásem
Millions of stories published by sites including The New York Times and The New York Daily News have been found in three weeks of searching OpenAI’s training dataset.
The news publishers are currently trawling through data to find instances of their copyrighted work being used to train OpenAI’s models – but they say the tech company should be forced to provide the information itself.
They are now asking for a court order requiring OpenAI to “identify and admit” which of their copyrighted content was used to train each of its large language models between GPT-1 and GPT-4o.
According to the ChatGPT creator, which objected to the request, the publishers have asked for information about almost 20 million pieces of content mentioned in the case, “effectively resulting in almost 500 million requests”.
The publishers told the court on Friday that their requests to the AI company for help with inspecting the data “would be significantly reduced if OpenAI admitted that they trained their models on all, or the vast majority, of News Plaintiffs’ copyrighted content”.
Thanks for subscribing.
A letter to the court also stated: “While they have already found millions of News Plaintiffs’ works in the training datasets, they do not know how many more works are yet to be uncovered – information that OpenAI, as the party that chose to copy these works, should be ordered to provide.”
The New York Times was the first major news publisher to file a copyright case against OpenAI and its partner Microsoft in December last year.
The New York Daily News and seven sister publications, all owned by Alden Global Capital, followed suit in April and the two cases have since been combined after OpenAI and Microsoft argued they “involve nearly identical allegations relating to the same new technology”.
In the new letter, the news publishers argued that identifying which of their copyrighted work was taken and used to train the GPT models is “foundational to these cases and informs the scope” of their claims.
“But News Plaintiffs and OpenAI have a fundamental disagreement about who is responsible for identifying this information.”
The publishers said they have served numerous requests since February for information about what’s in OpenAI’s training datasets, to which the tech company replied: “OpenAI will make available for inspection, pursuant to an inspection protocol to be negotiated between the parties, the pretraining data for models used for ChatGPT that it locates after a reasonable search.”
After long-running negotiations, since last month the news publishers have been inspecting OpenAI’s training data under strict conditions, previously described by the court as a “sandbox” (meaning a highly controlled environment in which only certain applications can be run).
But the news publishers said they initially faced “severe and repeated technical issues” stopping them from being able to “effectively and efficiently” carry out the search and “ascertain the full scope of OpenAI’s infringement”.
They complained that the process is “time-consuming, burdensome, and hugely expensive” and said they had spent the equivalent of 27 days via lawyers and experts in the OpenAI sandbox but were “nowhere near done”.
The New York Times Company results published on Monday revealed it has so far spent at least $7.6m on the case against OpenAI and Microsoft.
OpenAI: Training data searches are ‘uncharted waters’
OpenAI responded within the same letter that the publishers’ complaints about the inspection have either been resolved or are being actively discussed. It blamed the issues on consultants for the publishers “overwhelming the file system with malformed searches”.
OpenAI added: “Taking a step back, everyone agrees the parties are navigating uncharted waters with training-data discovery.
“There are no precedents for such discovery, where Plaintiffs seek access to several hundred terabytes of unstructured textual data. OpenAI cannot easily identify the specific content that Plaintiffs are interested in, so it did exactly what Rule 34 allows: it invited Plaintiffs to inspect the data as it is kept in the ordinary course. There is no ‘sandbox’. Rather, because the data is far too voluminous to produce, OpenAI built the hardware and software that Plaintiffs need to inspect.
“Specifically, OpenAI organised hundreds of terabytes of training data in an object-storage file system for Plaintiffs’ exclusive use; it built an enterprise-grade virtual machine with the computing power to access, search, and analyse the datasets; it installed hundreds of software tools and tens of gigabytes of Plaintiffs’ data upon their request; and it managed the necessary firewalls and secure virtual private network to support the inspection.”
OpenAI said it would continue to help the publishers overcome technical challenges provided they “engage in good faith” but added: “Unfortunately, this has not always been the case,” accusing them of delaying the process for months and submitting “hundreds of irrelevant requests”.
Representatives for the Authors Guild and progressive newsbrand Raw Story Media have also viewed the OpenAI training data for their own cases.
OpenAI previously asked a judge to force The New York Times to hand over its journalists’ confidential notes, a move the publisher warned would have “serious negative and far-reaching consequences” and was ultimately denied in September.
Email pged@pressgazette.co.uk to point out mistakes, provide story tips or send in a letter for publication on our “Letters Page” blog
Relacionado
MUNDO
Ventos fortes Ver voos cancelados e árvores derrubadas – DW – 12/04/2025

PUBLICADO
11 minutos atrásem
12 de abril de 2025
Residentes em partes do norte China foram avisados para não sair no sábado, pois os ventos da força de Gale fizeram com que centenas de vôos fossem cancelados.
A mídia estatal relatou que os serviços ferroviários também foram suspensos, pois ventos potencialmente recordes vieram de um “sistema de vórtice frio” que se formou sobre a Mongólia.
A administração meteorológica da China (CMA) disse que as condições climáticas severas começaram na sexta -feira e espera -se que durassem até o fim de semana.
“Os ventos mais fortes são esperados durante o dia de 12 de abril, com velocidades de vento em algumas estações de observação se aproximando ou até superando registros históricos para o mesmo período desde 1951”, afirmou a CMA em comunicado.
Pequim também emitiu seu primeiro alerta de laranja, o segundo nível mais alto possível, em um aviso de ventos fortes no fim de semana.
Quais foram os impactos dos ventos?
Até 699 vôos foram cancelados nos dois aeroportos de Pequim até sábado à tarde, enquanto as linhas ferroviárias de alta velocidade viram serviços suspensos, disse a emissora estatal CCTV.
Atrações turísticas, incluindo o Palácio de Verão, o Templo do Céu, o Zoológico de Pequim e o Parque Temático do Universal Studios, o fechamento temporário foi imposto.
As autoridades de Pequim também adiaram uma meia-maratona que teria apresentado a Humanoid Robot Racers no domingo.
Nenhuma lesão foi relatada, mas 300 árvores na capital foram derrubadas e 19 veículos danificados, acrescentou CCTV.
Editado por Jenipher Camino Gonzalez
Relacionado
MUNDO
Us, Tom Otimista do Irã Strike, definido para falar mais na próxima semana – DW – 12/04/2025

PUBLICADO
42 minutos atrásem
12 de abril de 2025
Se um acordo americano-Irã cair, Donald Trump ameaçou “haverá um bombardeio” do Irã.
E antes das negociações em Omã, os EUA reforçaram claramente sua presença militar na região.
Ele mudou seis de seus bombardeiros mais avançados, o B-2, para a base militar dos EUA-Britânicos de Diego Garcia, no Oceano Índico, no início deste mês.
Especialistas dizem que a localização colocou os bombardeiros em uma posição ideal para operar no Oriente Médio. Os B-2s estão equipados para transportar as bombas mais pesadas dos EUA, bem como armas nucleares.
Em uma exibição de suas capacidades miliárias, os EUA também enviaram um segundo porta -aviões, o USS Carl Vinson Carrier Strike Group, para o Oriente Médio.
A mídia israelense informou na semana passada que os EUA haviam fornecido a Israel uma bateria adicional da área de alta altitude de alta altitude, ou a bateria.
Este é um sistema de alta altitude capaz de interceptar mísseis fora da atmosfera.
A mudança é amplamente vista como ajudando a se defender contra possíveis ataques de mísseis balísticos iranianos.
Israel também poderia lançar greve
Um ataque militar ao Irã não precisa necessariamente ser executado pelos Estados Unidos, também pode ser lançado por Israel.
Israel está agora em uma posição forte para atacar o Irã, conclui um novo Análise pelo Conselho Atlântico.
Isso ocorre porque o estado extremamente enfraquecido do Hezbollah “elimina uma opção de resposta importante no Irã há muito tempo para impedir uma greve israelense ou nos EUA”.
“A opção mais eficaz pode ser uma operação combinada dos EUA-Israelense”, descobre a análise.
Relacionado
MUNDO
Ataques mortais da RSF a acampamentos de fome de Darfur-DW-12/04/2025

PUBLICADO
1 hora atrásem
12 de abril de 2025
Um ataque por Força paramilitar do Sudão nos campos de Zamzam e Abu Shorouk para pessoas deslocadas em darfur teme -se ter deixado mais de 100 pessoas, incluindo 20 crianças, mortas ou feridas.
Coordenador residente e humanitário das Nações Unidas em Sudão Clementine Nkweta-Salami disse no sábado que a ofensiva das Forças de Apoio Rápido (RSF), paramilitar rebelde do Sudão, ocorreu por pelo menos dois dias, destruindo casas, mercados e instalações de saúde.
Sobre 700.000 pessoas deslocadas, muitas das quais agora estão presas sem refúgio seguromorando nos dois campos.
RSF acusado de estupro sistemático no conflito do Sudão
Para visualizar este vídeo, ative JavaScript e considere atualizar para um navegador da web que Suporta o vídeo HTML5
O que mais sabemos sobre o ataque?
Em um comunicado, Nkweta-Salami acrescentou que nove trabalhadores humanitários foram mortos “enquanto operava um dos poucos postos de saúde restantes ainda operacionais” no campo de Zamzam.
“Isso representa mais uma escalada mortal e inaceitável em uma série de ataques brutais a pessoas deslocadas e trabalhadores ajuda no Sudão desde o início desse conflito há quase dois anos”, acrescentou.
A Relief International, a última organização que presta serviços críticos no Zamzam Camp, informou que os trabalhadores humanitários que morreram eram seus colegas, incluindo médicos e motoristas, acrescentando que sua clínica foi ultrapassada.
“Este foi um ataque direcionado às pessoas mais vulneráveis e idosas, mulheres e crianças”, afirmou em comunicado.
O grupo disse que o mercado central em Zamzam, juntamente com centenas de casas improvisadas no campo, foram destruídas.
De acordo com a coordenação geral de pessoas deslocadas e refugiados, um grupo local em Dafur, os ataques forçaram cerca de 2.400 pessoas a fugir dos campos e da cidade de El-Fasher, a única cidade de Darfur não controlada pelo RSF.
O que o RSF disse?
O grupo paramilitar negou as alegações de atrocidades no campo de Zamzam, descartando -as como fabricadas. Afirmou que um vídeo recentemente divulgado, supostamente mostrando o sofrimento civil no campo, foi encenado pelo exército sudanese.
O RSF acusou o exército de orquestrar uma campanha de mídia usando atores e encenou cenas para incriminá -los falsamente, negando a responsabilidade por qualquer ataque a civis.
Dois anos de guerra no Sudão, sem fim à vista – Global US
Para visualizar este vídeo, ative JavaScript e considere atualizar para um navegador da web que Suporta o vídeo HTML5
O grupo paramilitar está trancado em uma luta cruel pelo poder com os militares sudaneses desde abril de 2023, criando o que se acredita ser a pior crise humanitária do mundo.
Ambas as partes foram acusadas de cometer crimes de guerra e violar o direito internacional humanitário, com dezenas de milhares morrendo na guerra e mais de 12 milhões de deslocados.
Acredita -se que cerca de 25 milhões de pessoas, quase metade da população do país, esteja enfrentando extrema fome.
Semanas recentes viram Os militares do Sudão ganham ganhos na capital Cartumlevando o RSF a aumentar sua ofensiva em regiões de Darfur ainda não sob seu controle. Os combates foram concentrados principalmente nessas duas províncias.
Por que a Guerra Civil do Sudão está longe de terminar
Para visualizar este vídeo, ative JavaScript e considere atualizar para um navegador da web que Suporta o vídeo HTML5
Editado por Jenipher Camino Gonzalez
Relacionado
PESQUISE AQUI
MAIS LIDAS
- POLÍTICA6 dias ago
As descobertas do TCU sobre gastos com cartão corp…
- POLÍTICA6 dias ago
Quem são o ‘pipoqueiro’ e o ‘sorveteiro’ citados p…
- POLÍTICA6 dias ago
A direita precisa mais de Nikolas do que de Malafaia
- MUNDO6 dias ago
Tempestades severas reivindicam 17 vidas, incluindo crianças – DW – 04/04/2025
Warning: Undefined variable $user_ID in /home/u824415267/domains/acre.com.br/public_html/wp-content/themes/zox-news/comments.php on line 48
You must be logged in to post a comment Login