Description
Новая и улучшенная версия Kandinsky 2.1 наследует лучшие практики от Dall-E 2 и Latent diffusion, представляя при этом несколько новых идей. В качестве текстового и изображенческого кодировщика он использует модель CLIP и предварительный (отображающий) диффузию изображений между скрытыми пространствами модальностей CLIP. Такой подход повышает визуальную производительность модели и раскрывает новые возможности в смешении изображений и манипулировании изображениями с помощью текста.
На английском: New improved Kandinsky 2.1 inherits best practicies from Dall-E 2 and Latent diffusion, while introducing some new ideas. As text and image encoder it uses CLIP model and diffusion image prior (mapping) between latent spaces of CLIP modalities. This approach increases the visual performance of the model and unveils new horizons in blending images and text-guided image manipulation.
Добавлено: 2023-05-17 21:00:00