IA de texto para imagem: as ferramentas do Google criam fotos impressionantes, mas o Bing foi mais rápido

O Google tem lidado com isso há muitos anos inteligência artificial e também os utiliza no campo de reconhecimento de imagem, processamento de imagem e tarefas semelhantes. Já no ano passado, foram apresentados três projetos com os quais as fotos podem ser geradas de forma totalmente dinâmica. Isso significa que você tem tecnologias fortes na manga que criam possibilidades completamente novas, mas ainda não foram usadas. Mas é provável que isso mude em breve.

Nas últimas semanas, demos a vocês os três jovens projetos do Google apresentados, todos os três têm o mesmo propósito e são baseados em diferentes abordagens. Todas as três tecnologias podem gerar dinamicamente uma imagem ou foto com base em uma descrição, que deve corresponder aos desejos do usuário. Extensas galerias de demonstração e também pequenas áreas de teste foram publicadas para que todos possam ter uma impressão dessas tecnologias por si mesmos.

Os resultados são realmente impressionantes, porque, pelo menos à primeira vista, quase nenhuma imagem mostra que ela realmente não existe, mas foi criada dinamicamente pela IA. Ele vai muito além de apenas juntar motivos conhecidos, mas na verdade parece balançar o próprio pincel digital e gerar formas/objetos/cenas adequadas. As pessoas estão cientes do perigo potencial de tal tecnologia e, portanto, só a ofereceram de forma muito limitada e não para uso público. Por enquanto, ninguém fora da equipe do projeto deve ser capaz de criar imagens de forma totalmente dinâmica.

Mas agora a tecnologia está aqui e o Google não vai desenvolvê-la e aperfeiçoá-la e depois mantê-la trancada. Em particular, o início da quarta-feira Criador de imagens do Bing vai colocar o Google sob pressão, porque mais uma vez o Bing se tornou pioneiro em uma área em que o Google pesquisa e entrega resultados úteis há muitos anos. Então você está quase sendo forçado a abrir uma dessas ferramentas muito em breve.

festa 5Apenas algumas semanas atrás, foi dito que as tecnologias deveriam ser trazidas ao mercado com muito cuidado e que o gerador completo não deveria ser publicado para todos os usuários em nenhuma circunstância. Pouco tempo depois, as primeiras funções como o Criador de papel de parede de Pixel ou um Gerador de gráficos para Google Slides conhecido. Isso seria o começo, mas há alguns dias as coisas foram feitas em torno do universo GPT e do Bing, então o Google dificilmente pode continuar pisando no freio.

A Microsoft também está ciente do perigo de tais geradores e, portanto, já possui extensas listas de bloqueio de motivos ou combinações que não podem ser criadas na primeira fase de teste. Além disso, fotos de celebridades ou pessoas aleatórias não podem ser criadas ou usadas. Seria um grande problema para o Google aplicar filtros semelhantes e depois oferecer sua própria ferramenta para as massas.

De qualquer forma, isso promete muita emoção nos próximos anos e talvez em algum momento se aplique a regra de que você não precisa desenvolver e pesquisar tudo o que é tecnicamente possível. Porque não podemos esquecer que ainda estamos no começo dessas tecnologias, que podem mudar muito. Qual é o valor da evidência fotográfica hoje se cada motivo pode ser facilmente criado em questão de segundos? O Photoshop não se importava.

Artigos relacionados