Популярный аудиоредактор Audacity претерпел значительные изменения благодаря новому набору плагинов, основанных на искусственном интеллекте. Эти инструменты, разработанные на основе тулкита Intel OpenVINO AI, сосредотачиваются на точном редактировании аудиосигнала. Всего в Audacity добавлено шесть плагинов для генерации музыки и редактирования звука, каждый из которых опирается на одну из популярных моделей искусственного интеллекта, сообщили разработчики.
Два плагина, Music Generation и Music Style, используют модель Stable Diffusion и её ответвление Riffusion для генерации музыки в программе. Music Generation создает фоновые дорожки с музыкой, а Music Style изменяет стилистику уже существующих композиций. Кроме того, с помощью плагина Music Separation редактор может отделить вокал от аккомпанемента или разделить композицию на отдельные дорожки с инструментами.
Audacity также получил умные инструменты Noise Suppression и Whisper Transcription для редактирования записанного сигнала, позволяющие удалять фоновые шумы и транскрибировать шепот и обычную речь в текст. Эти инструменты могут быть особенно полезны для авторов подкастов, считают разработчики.
Менеджер по продукту Audacity, Мартин Кир, отметил, что цель внедрения плагинов на основе искусственного интеллекта - сделать редактор более привлекательным для пользователей. Он также подчеркнул, что плагины работают локально на компьютере пользователя, что важно с точки зрения конфиденциальности данных.
Умные плагины не включены в состав Audacity, но их установочные пакеты доступны в официальном репозитории на GitHub. Пока что эти инструменты доступны только для Windows, но разработчики планируют расширить поддержку для macOS и Linux в будущем.