Новый курс в «Специалисте»: станьте профессионалом в использовании ИИ для обработки звука
В 2023 года в свет вышла «новая» песня группы The Beatles. В конце 1970-х Джон Леннон записал демо, которое так и не было издано. Более 40 лет спустя режиссер Питер Джексон с помощью нейросети отделил голос от инструментала, а Пол Маккартни и Ринго Старр, ныне живущие участники группы, записали свои партии. В итоге получилась песня Now and Then, которая заняла первое место в хит-параде Великобритании.
На заре использования искусственного интеллекта (ИИ) музыканты опасались, что нейросети отнимут у них работу. Сейчас очевидно, что ИИ не является конкурентом для креативных работников. Это полезный инструмент и незаменимый помощник в области создания контента.
В этой связи Центр «Специалист» подготовил в линейке курсов по нейросетям новую программу «Нейронные сети в компьютерной обработке звука. Фреймворк PyTorch и библиотеки librosa, torchaudio, SoundFile». Записывайтесь и осваивайте инструменты повышения эффективности и качества работы со звуком.
Что вы освоите
Современные нейронные сети, такие как WaveNet, Wav2Vec2, Whisper и DeepSpeech, сделали возможным настоящий прорыв в анализе и синтезе звука. Изучение этих технологий в рамках курса позволяет освоить работу с инновационными архитектурами, учит адаптировать модели к конкретным задачам, позволяет участвовать в разработке прорывных аудиотехнологий.
- Вы научитесь основам работы с PyTorch.
- Углубите свои знания по Python.
- Познакомитесь с обработкой речи и звука средствами нейронных сетей и Python.
- Познакомитесь с тестированием нейронных сетей и их применением в микросервисах.
Программа курса предусматривает самостоятельную работу (выполнение домашних заданий) и контроль знаний (тестирование). Особое внимание в новой версии курса уделено проведению мастер-классов, где даются углублённые знания по прикладным задачам обработки звука, таким как:
- разработка системы ASR на основе Wav2Vec2 и/или Whisper;
- разработка модели для выделения событий на наборе данных UrbanSound8K;
- разработка базовой TTS-системы на основе Tacotron2;
- разработка модели удаления шума в наборе данных DNS Challenge.
Первая нейросеть, произведения которой вышли на музыкальном лейбле, – это стартап Endel. Однако Warner Music подписала контракт не с ИИ, а с его создателями. Учитесь руководить нейросетью, и ваши навыки в работе со звуком обязательно будут востребованы.