Apple pode dar um ‘impulso de IA’ para futuros iPhones e iPads, veja como

Início / Inteligência Artificial / Apple pode dar um ‘impulso de IA’ para futuros iPhones e iPads, veja como

Apple poderia saltar à frente dos concorrentes na integração de IA de dispositivos com a infusão de uma nova proposta de avatar 3D animado e Modelo de aprendizagem de línguas com IA, implementando a tecnologia em dispositivos com recursos limitados em breve. Estes poderiam muito bem ser os futuros iPhones e iPads. A gigante tecnológica com sede em Cupertino publicou recentemente dois novos artigos dedicados às mesmas tecnologias.

Vamos dar uma olhada no que está acontecendo com a mente dos engenheiros e especialistas em tecnologia com as tecnologias propostas.

Usando HUGO para criar modelos 3D animados mais preCISOs

No primeiro trabalho de pesquisa, Apple propôs uma nova tecnologia chamada HUGS para criar avatares 3D animados. HUGO significa Suas gaussianos human e usa uma técnica chamada Respingos Gaussianos 3D usado para renderizar modelos 3D em tempo real usando dados da realidade colocados em um espaço 3D.

Apple deixa entender que a ênfase será “desenredar” uma cena estática capturada em um “vídeo monocular com um pequeno número de (50-100) quadros” dentro de “Avatar humano totalmente animável em 30 minutos.”

A fabricante do iPhone diz no resumo do trabalho de pesquisa que usará o Modelo de corpo SMPL para inicializar os gaussianos humanos. A tecnologia MIL tem uma deficiência; ela não consegue renderizar detalhes mais nítidos, como roupas e cabelos, e é aí que entram os gaussianos 3D. 

A gigante da tecnologia afirma que planeja utilizar HUGO para que os gaussianos 3D “se desviem do modelo do corpo humano”, capturando detalhes como cabelos e roupas e renderizando modelos 3D animados. Espera-se que esta abordagem resulte em avatares 3D animados mais realistas e precisos.

“Propomos otimizar em conjunto os pesos de mesclagem linear para coordenar os movimentos de gaussianos individuais durante a animação. Nossa abordagem permite a síntese de novas poses do ser humano e a síntese de novas visões do humano e da cena. Nós alcançamos qualidade de renderização de última geração com uma velocidade de renderização de 60 FPS e sendo ∼100× mais rápido para treinar em relação ao trabalho anterior.”, diz Apple.

Reduzindo a carga de dados e melhorando a efiCiência do uso de memória de disposiTIvos com recursos limitados

No segundo trabalho de pesquisa, a Apple descreveu o desafio de executar grandes modelos de linguagem (LMMS) como GPT-3, OUT e Palma em dispositivos com pouca memória. A gigante da tecnologia pretende fabricar dispositivos com pouca memória capaz de executar modelos avançados de aprendizagem de línguas com IA.

Diz que como os LMMS “podem conter centenas de bilhões ou até trilhões de parâmetros”, é
difícil carregá-los e executá-los em “dispositivos com recursos limitados”. Todo o modelo deve ser carregado na DRAM. para inferência, o que “limita severamente o tamanho máximo do modelo que pode ser executado”.

Você precisaria de uma capacidade DRAM. maior apenas para carregar o modelo, o que não é possível com dispositivos com recursos limitados.

Para remediar isso, a Apple propõe “para armazenar os parâmetros do modelo na memória flash, que é
pelo menos uma ordem de magnitude maior que a DRAM
”. Os parâmetros necessários podem, então, ser carregados da memória flash durante a inferência, evitando assim a ideia de ajustar todo o modelo na DRAM.

O gigante da tecnologia descreveu o uso de duas técnicas para reduzir a carga de dados nos dispositivos e também para tornar o uso da memória mais eficiente. Estes são Janelas e Agrupamento de linha-coluna.

Apple iPad

A Apple afirma no artigo de pesquisa que tem “demonstrou a capacidade de executar LLMs com até o dobro do tamanho da DRAM disponível alcançando, uma aceleração na velocidade de inferência de 4 a 5x em comparação com os métodos de carregamento tradicionais na CPU e de 20 a 25x na GPU.”

A gigante da tecnologia acredita que é um avanço crucial na “implantação de LMMS avançados em ambientes com recursos limitados, expandindo assim a sua aplicabilidade e acessibilidade”.

Roberto Magalhães

O cérebro editor por trás do Tecnologico.online, é um entusiasta apaixonado por tecnologia. Canaliza sua fascinação para criar conteúdo envolvente e informativo. Sua dedicação à inovação reflete-se nos artigos que produz, abrangendo uma ampla gama de tópicos tecnológicos. Com um olhar atento para as últimas tendências e desenvolvimentos, busca tornar...

Voltar para o blog

Deixe um comentário

Os comentários precisam ser aprovados antes da publicação.