► Подписывайтесь на телеграмм-канал «Минфина»: главные финансовые новости

Хотя большую часть данных удалось восстановить, юридическая команда NYT отмечает, что оригинальные названия файлов и структура папок были утрачены. Поэтому невозможно определить, где и как OpenAI могла использовать скопированные статьи издания.

NYT подало в суд на OpenAI и Microsoft в декабре 2023 года. Издание обвинило обе компании в использовании их материалов для обучения искусственному интеллекту. В свою очередь ИИ-компания назвала судебный иск безосновательным. Сейчас дело все еще находится на стадии раскрытия и все стороны передают документы, необходимые для сбора доказательств.

В рамках этого дела разработчик ChatGPT был вынужден показать изданию данные для тренировки больших языковых моделей, ранее державшихся в тайне. Для проверки этих данных OpenAI создала «песочницу» из двух виртуальных машин, в которых юристы NYT могли искать данные.

Специалисты потратили более 150 часов на сбор необходимых данных, прежде чем они были стерты на одном из устройств. Несмотря на попытки восстановить их, юристы издания отмечают, что специалистам придется начинать сбор данных с самого начала, что потребует немало человеческого ресурса. В то же время юристы также отмечают, что у них нет причин думать, что данные удалили специально, и эту ситуацию называют сбоем.