最先进的文本到图像转换技术
Imagen研究亮点
我们表明,大型预训练的冻结文本编码器是非常有效的文本到图像的任务。
我们表明缩放预训练文本编码器的大小比缩放扩散模型的大小更重要。
我们介绍了一种新的阈值扩散采样器,它能够使用非常大的无分类器的指导权重。
我们引入了一种新的高效U-Net架构,它计算效率更高,内存效率更高,收敛速度更快。
在COCO上,我们实现了7.27的最新COCO FID并且人类评价者发现Imagen样本在图像-文本对齐方面与参考图像不相上下。
数据统计
数据评估
关于Imagen特别声明
本站AItools人工智能导航网站提供的Imagen都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由AItools人工智能导航网站实际控制,在2024年7月16日 上午10:29收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,AItools人工智能导航网站不承担任何责任。