近日,微软亚洲研究院联合北京大学、微软AzureAI,共同开发了全新的AI视觉生成技术"NUWA-Infinity:自回归overautoregressivegenerationforinfinitevisualsynthesis”,引发热议。通过这项技术,文字可以自动生成图像或学习图像生成扩展图像等应用。
以前OpenAI的DALLE2,Google的Imagen或者Parti都可以直接通过文本生成图像,但是分辨率只有1024×1024。而"NUWA-Infinity:自回归overautoregressivegenerationforinfinitevisualsynthesis”可以生成高达4096×1024的高清图像。
不仅如此,这项技术还可以从现有图像中学习,以便根据相同的架构将其扩展为更大、更清晰的图像,以及视频转换等。,具有五种特定功能:
使图像移动(图像动画)
基于文本生成视频(文本到视频)
从文本生成图像(文本到图像)
图像加印
图像生成(图像生成)