Versatile Diffusion

Перевод:

Первая унифицированная многоточечная многомодальная рамка диффузии. Универсальная Диффузия может естественно поддерживать преобразование изображения в текст, вариацию изображения, текст в изображение и текстовую вариацию, а также может быть дополнительно расширена до других приложений, таких как разделение семантического стиля, двойное направляемое поколение изображений и текстов, редактирование скрытых изображений-текстов-изображений и другого. В будущих версиях будут поддерживаться более многомодальные функции, такие как речь, музыка, видео и 3D.

Описание

Перевод:

Первая унифицированная многоточечная многомодальная рамка диффузии. Универсальная Диффузия может естественно поддерживать преобразование изображения в текст, вариацию изображения, текст в изображение и текстовую вариацию, а также может быть дополнительно расширена до других приложений, таких как разделение семантического стиля, двойное направляемое поколение изображений и текстов, редактирование скрытых изображений-текстов-изображений и другого. В будущих версиях будут поддерживаться более многомодальные функции, такие как речь, музыка, видео и 3D.

На английском: The first unified multi-flow multimodal diffusion framework. Versatile Diffusion can natively support image-to-text, image-variation, text-to-image, and text-variation, and can be further extended to other applications such as semantic-style disentanglement, image-text dual-guided generation, latent image-to-text-to-image editing, and more. Future versions will support more modalities such as speech, music, video and 3D.

Добавлено: 2022-11-15 21:00:00

Детали

На входе

,

На выходе

,

Основано на

Задача