Na última terça-feira (5) os pesquisadores da Nvidia apresentaram uma nova tecnologia da empresa que poderá levar os deepfakes para um outro nível: um novo tipo de IA que consegue criar vídeos deepfake de maneira bem mais precisa do que as tecnologias atuais.
O algoritmo criado pela Nvidia se diferencia das atuais IAs usadas em vídeos deepfakes especialmente em dois pontos: o primeiro deles é que, enquanto as IAs atuais necessitam de uma grande base de dados (vídeos ou fotos) da pessoa ou objeto que se quer introduzir digitalmente em um vídeo, a nova IA da Nvidia consegue fazer isso com apenas uma única foto da pessoa. A segunda diferença está na capacidade de alterações possíveis: enquanto as IAs atuais apenas conseguem fazer apenas a troca de objetos já presentes no vídeo (por exemplo, trocar um rosto pelo outro), a da Nvidia consegue, a partir de uma foto, criar até mesmo movimentos realistas baseado na imagem base.
No vídeo divulgado pela empresa mostrando alguns usos da IA, é possível ver que, a partir de uma única foto de corpo inteiro de qualquer pessoa, dá para criar um vídeo onde ela aparece dançando toda uma coreografia complexa. A IA da Nvidia também permite que a partir de qualquer vídeo feito com um celular (como um Stories para o Instagram) se faça a transposição dos movimentos da boca da pessoa para a de outro vídeo - permitindo, por exemplo, a criação de um vídeo onde alguma celebridade está falando o que quer que você queira que ela fale.
Outra possibilidade é no uso de aplicativos de mapas, permitindo fazer modificações digitais em gravações de câmeras automobilísticas.
O sistema criado pela Nvidia funciona criando “modelos” de animações a partir de vídeos adicionados em seu banco de dados, e a partir daí consegue escanear qualquer imagem e incluí-la nesses modelos gerados de forma “realista”. Colocamos a palavra entre aspas porque ainda não é possível dizer se a IA realmente funciona tão bem quanto a Nvidia está vendendo, já que o vídeo divulgado pela empresa utiliza apenas imagens de baixa definição, sendo impossível garantir que esses vídeos de pessoas dançando gerados a partir de poucas fotos realmente não possuem defeitos visíveis em uma qualidade maior.
Mas, caso essa nova IA da Nvidia realmente consiga entregar o que promete, ela deverá trazer várias novas possibilidades de uso para a indústria do entretenimento - principalmente a dos videogames, que atualmente necessitam utilizar esquemas de capturas de movimento extremamente caros e complicados para fazer com que a movimentação dos personagens seja realista.
Ao mesmo tempo, este tipo de IA pode também criar uma nova ameaça para a sociedade como um todo. Como já explicamos em nossa série de reportagens especiais sobre deepfakes, é cada vez mais difícil identificar se um vídeo publicado na internet é real ou não, e uma melhoria em IAs deste tipo só tornará um cenário que já é complicado ainda mais complexo.
O algoritmo criado pela Nvidia se diferencia das atuais IAs usadas em vídeos deepfakes especialmente em dois pontos: o primeiro deles é que, enquanto as IAs atuais necessitam de uma grande base de dados (vídeos ou fotos) da pessoa ou objeto que se quer introduzir digitalmente em um vídeo, a nova IA da Nvidia consegue fazer isso com apenas uma única foto da pessoa. A segunda diferença está na capacidade de alterações possíveis: enquanto as IAs atuais apenas conseguem fazer apenas a troca de objetos já presentes no vídeo (por exemplo, trocar um rosto pelo outro), a da Nvidia consegue, a partir de uma foto, criar até mesmo movimentos realistas baseado na imagem base.
No vídeo divulgado pela empresa mostrando alguns usos da IA, é possível ver que, a partir de uma única foto de corpo inteiro de qualquer pessoa, dá para criar um vídeo onde ela aparece dançando toda uma coreografia complexa. A IA da Nvidia também permite que a partir de qualquer vídeo feito com um celular (como um Stories para o Instagram) se faça a transposição dos movimentos da boca da pessoa para a de outro vídeo - permitindo, por exemplo, a criação de um vídeo onde alguma celebridade está falando o que quer que você queira que ela fale.
Outra possibilidade é no uso de aplicativos de mapas, permitindo fazer modificações digitais em gravações de câmeras automobilísticas.
O sistema criado pela Nvidia funciona criando “modelos” de animações a partir de vídeos adicionados em seu banco de dados, e a partir daí consegue escanear qualquer imagem e incluí-la nesses modelos gerados de forma “realista”. Colocamos a palavra entre aspas porque ainda não é possível dizer se a IA realmente funciona tão bem quanto a Nvidia está vendendo, já que o vídeo divulgado pela empresa utiliza apenas imagens de baixa definição, sendo impossível garantir que esses vídeos de pessoas dançando gerados a partir de poucas fotos realmente não possuem defeitos visíveis em uma qualidade maior.
Mas, caso essa nova IA da Nvidia realmente consiga entregar o que promete, ela deverá trazer várias novas possibilidades de uso para a indústria do entretenimento - principalmente a dos videogames, que atualmente necessitam utilizar esquemas de capturas de movimento extremamente caros e complicados para fazer com que a movimentação dos personagens seja realista.
Ao mesmo tempo, este tipo de IA pode também criar uma nova ameaça para a sociedade como um todo. Como já explicamos em nossa série de reportagens especiais sobre deepfakes, é cada vez mais difícil identificar se um vídeo publicado na internet é real ou não, e uma melhoria em IAs deste tipo só tornará um cenário que já é complicado ainda mais complexo.
Fonte: https://canaltech.com.br/inteligencia-artificial/nova-ia-da-nvidia-promete-criar-os-melhores-deepfakes-qu-voce-pode-ver-154599/