Runway lança dois novos recursos de IA de vídeo e uma iniciativa de pesquisa de “modelo mundial geral”

Início / Inteligência Artificial / Runway lança dois novos recursos de IA de vídeo e uma iniciativa de pesquisa de “modelo mundial geral”

A ‘startup’ Video AI Runway apresenta dois novos recursos para seu gerador de vídeo. A empresa também almeja um objetivo mais alto com seu projeto de pesquisa de modelo mundial de longo prazo.

Com o “Texto-to-Esperece”, a Runway implementa vozes sintéticas no editor de vídeo. A empresa oferece diversas vozes para você escolher que seguem determinadas características como jovem, madura, feminina, masculina, etc. Esse recurso está disponível em todos os planos.

Outra novidade é a função Rácio, que permite converter um vídeo criado em diversos formatos, como 1:1 ou 16:9, com um único clique. Isso facilita criar vídeos para diferentes canais.

Modelos mundiais gerais para vídeos melhores – e muito mais

A Runway também anunciou uma nova iniciativa de pesquisa: a empresa quer desenvolver o que chama “modelos mundiais”. Os modelos mundiais destinam-se a promover a IA através de sistemas que possam compreender e simular o mundo visual.

Um modelo mundial é um sistema de IA que desenvolve uma representação interna de um ambiente para simular eventos futuros nesse ambiente. O objetivo de um modelo mundial geral é mapear e simular situações e interações do mundo real.

Um exemplo de tal modelo é GAIA-1 de Wayve, desenvolvido a partir de dados visuais e textuais para controlar veículos autônomos com base na compreensão do ambiente. No entanto, este cenário é limitado e controlado.

Um modelo de vídeo como Gen 2 pode ser considerado um modelo mundial “muito antigo e limitado” porque desenvolveu uma compreensão básica da física e do movimento para geração de vídeo, escreveu a Runway. No entanto, segundo a empresa, ele ainda é limitado em suas capacidades e tem problemas com movimentos complexos de câmeras ou objetos.

A Runway está atualmente trabalhando em vários desafios de pesquisa, incluindo o desenvolvimento de modelos que possam produzir mapas consistentes do ambiente e modelos realistas do comportamento humano.

O chefe de pesquisa de IA da Meta, Yang LeCun, concorda que a IA necessita primeiro de um modelo mundial e de uma compreensão básica do mundo para realizar progressos significativos. Linguagem, como nos grandes modelos de linguagem de hoje, não é suficiente como base de conhecimento para alcançar uma IA semelhante à humana.

O projeto de pesquisa Runway, que se baseia no treinamento multimodal, ou seja, texto, áudio, imagem, vídeo e outros pontos de dados, está caminhando em uma direção semelhante, à medida que o multimodal se torna a nova norma no desenvolvimento do modo de IA.

Roberto Magalhães

O cérebro editor por trás do Tecnologico.online, é um entusiasta apaixonado por tecnologia. Canaliza sua fascinação para criar conteúdo envolvente e informativo. Sua dedicação à inovação reflete-se nos artigos que produz, abrangendo uma ampla gama de tópicos tecnológicos. Com um olhar atento para as últimas tendências e desenvolvimentos, busca tornar...

Voltar para o blog

Deixe um comentário

Os comentários precisam ser aprovados antes da publicação.