
Компания ByteDance, владелец TikTok, выпустила проект под названием OmniHuman-1. Это генератор deepfake-видео, который умеет "оживлять" изображения и синхронизировать видео с загруженным аудио.
В TechCrunch подчеркивают, что генерируемые OmniHuman-1 дипфейки получаются "пожалуй, самыми реалистичными" среди конкурентов. Они не ограничены по продолжительности, а в качестве основы можно использовать любой снимок, даже черно-белый.
Для создания дипфейка ИИ-модели достаточно одной фотографии и записи голоса. У пользователей есть доступ к нескольким настройкам, включая соотношение сторон и "пропорции тела" субъекта. А еще можно добавить взаимодействие посторонними предметами на фото, если они имеются.
Исследователи Bytedance говорят, что они обучили OmniHuman-1 примерно на 18 700 часах видеоданных с использованием нового подхода "omni-conditions", который позволяет этой ИИ-модели обучаться на гораздо более крупных и разнообразных наборах данных, чем предыдущие методы.
В качестве примера разработчики продемонстрировали сгенерированную лекцию Альберта Эйнштейна. У OmniHuman-1 есть бесплатная демоверсия. Правда, прямо сейчас она не работает.
Ранее компания OpenAI открыла доступ к поисковым инструментам ChatGPT Search для всех пользователей. Это делает ИИ-поиск ChatGPT прямым конкурентом Google и других популярных поисковиков.
УНИАН рассказывал, что Apple отключила ИИ-уведомления в iPhone из-за фейковых и пугающих заголовков. Несмотря на оптимизм Тима Кука в том, что для Купертино важно быть "лучшими, а не первыми", сотрудники Apple считают, что компания отстает в гонке ИИ минимум на 2 года.