OpenAI revelou uma rede neural conhecida como DALL-E que converte texto em imagens impressionantes – como estas fotos de um bebê panda em um tutu segurando um sabre de luz:
OpenAI disse em uma postagem de blog que o sistema é uma versão de 12 bilhões de parâmetros do modelo de linguagem GPT-3:
Descobrimos que ele tem um conjunto diversificado de recursos, incluindo a criação de versões antropomorfizadas de animais e objetos, combinando conceitos não relacionados de maneiras plausíveis, renderizando texto e aplicando transformações a imagens existentes.
DALL-E – uma mala de viagem com os nomes do artista surrealista Salvador Dalí e do robô da Pixar WALL-E – foi treinado em um conjunto de dados de pares de texto-imagem extraídos da internet.
Isso permite a criação de imagens inteiramente novas explorando a estrutura de um prompt – incluindo objetos fantásticos combinando ideias não relacionadas que nunca foram alimentadas no treinamento.
[Read: Meet the 4 scale-ups using data to save the planet]
Ele pode produzir algumas imagens seriamente impressionantes de pontos de referência, locais, animais híbridos e designs de diferentes décadas. Mas a OpenAI admite que nem todos os resultados são bem-sucedidos.

A empresa disse que o sistema às vezes falha em desenhar alguns dos itens especificados e confunde as associações entre os objetos e seus atributos especificados:
Geralmente, quanto mais longa a string que DALL-E é solicitada a escrever, menor a taxa de sucesso. Descobrimos que a taxa de sucesso aumenta quando partes da legenda são repetidas. Além disso, a taxa de sucesso às vezes melhora conforme a temperatura de amostragem da imagem diminui, embora as amostras se tornem mais simples e menos realistas.
DALL-E também costuma refletir estereótipos superficiais ao responder a perguntas sobre fatos geográficos, como bandeiras, cozinhas e vida selvagem local. Esta deficiência é particularmente significativa à luz do crescente preocupações sobre os preconceitos dos modelos de linguagem extensa.
A OpenAI disse que planeja analisar os impactos sociais de modelos como o DALL-E. Mas a empresa acredita que o sistema mostra “que a manipulação de conceitos visuais por meio da linguagem agora está ao nosso alcance”.
Você pode experimentar uma demonstração controlada de DALL-E para você em o site da OpenAI.
Publicado em 6 de janeiro de 2021 – 12:49 UTC
Fonte: thenextweb.com