В эпоху цифровых технологий искусственный интеллект (ИИ) становится все более распространенным, находя применение в различных секторах. Недавно мы стали свидетелями прогресса проекта Google по созданию музыки из простой «подсказки». Сегодня мы тоже находим это Мета отправился в это приключение, создающий языковые модели, способные генерировать аудио из текстового описания. Название этого революционного инструмента 'аудио ремесло».
Meta Audiocraft: новый горизонт для создания музыки, доступной каждому (или почти каждому)
Audiocraft — это инструмент на основе искусственного интеллекта, который использует три языковые модели: AudioGen, EnCodec и MusicGen. Цель состоит в том, чтобы позволить пользователям получать звуковые дорожки, начиная с простого текстового описания того, что они хотят услышать. Audiocraft может использоваться для создания как музыки, так и звука, а также предлагает возможности сжатия.
Среди трех моделей, MusicGen специально обучен для создания музыки из текста.. Для этого были использованы тысячи музыкальных произведений по лицензии Meta. Самая захватывающая новость заключается в том, что все три модели были выпущены в открытый источник, что означает, что любой может использовать их для создания инструментов и приложений. По словам Меты, эти шаблоны были специально разработаны для музыкальных исполнителей и звукорежиссеров с целью «вдохновения».
См. также: Новая стратегия Meta для таргетированной рекламы: разрешение пользователя
Шаблоны уже доступны и их код можно скачать через Обнимая лицо или связанная страница Github. MusicGen можно использовать для получения фрагментов песен, созданных ИИ, в то время как AudioGen может предоставить полезные звуки для производства музыки. EnCodec, с другой стороны, представляет собой инструмент сжатия на основе искусственного интеллекта.
Для создания музыкального произведения этого достаточно опишите музыку, которую хотите получить, и нажмите кнопку «Создать». Кроме того, описание можно сопровождать аудиофайлом или записью вашего микрофона, чтобы модель могла более точно обрабатывать тип музыки, которую вы хотите создать.
Сгенерированный звук будет представлять собой дорожку длиной примерно 12 секунд. Чтобы получить инструмент, который может генерировать более полные фрагменты, нам придется подождать, пока какой-нибудь разработчик создаст приложение на основе этих шаблонов. Мета предоставлена инструменты, теперь сообщество должно выяснить, что можно с ними сделать.