Image-Based Audio Diffusion

Cameron Rohn · Category: frameworks_and_exercises

Use image diffusion models that generate spectrogram images from audio embeddings and then convert them back to audio via a decoder adapter.