O Google anunciou uma atualização significativa no editor de imagens com inteligência artificial do Gemini, elevando o patamar das edições digitais. Agora, o aplicativo oferece recursos avançados que permitem misturar fotos, trocar cenários e até mesmo alterar roupas de personagens, tudo isso mantendo uma consistência visual impressionante. Esta inovação promete expandir as possibilidades criativas para usuários que buscam resultados mais realistas e complexos em suas edições.
Desenvolvida pela equipe da Google DeepMind, a novidade foca em edições mais complexas e fluidas. As imagens geradas ou modificadas por esta ferramenta virão com uma marca d’água visível, identificada como “ai”, e uma identificação digital invisível, a SynthID. Essa medida visa garantir a transparência sobre a origem do conteúdo, deixando claro que se trata de uma criação assistida por inteligência artificial.
Preservação da Identidade em Edições de Imagens com IA
Um dos pontos cruciais desta atualização é a capacidade do Gemini de preservar a identidade de pessoas, animais ou personagens mesmo após extensas modificações na imagem. Isso significa que, ao mudar o cenário, aplicar novos figurinos ou transformar o estilo da foto, o rosto e as características principais permanecem consistentes e reconhecíveis. Este avanço é fundamental para garantir que as edições mantenham um alto nível de realismo e evitem resultados artificiais ou distorcidos que poderiam ocorrer em versões anteriores.
O Google enfatiza que o objetivo é permitir que fotos de amigos, familiares e até mesmo de animais de estimação continuem sendo reconhecíveis em cada etapa da edição. Seja experimentando um penteado dos anos 60 ou colocando uma fantasia em um cachorro, a ferramenta garante que a essência do sujeito seja mantida. Essa consistência é um diferencial importante, pois aborda uma das principais preocupações dos usuários com a edição de imagens por IA: a perda de detalhes sutis que conferem autenticidade às fotos.
Novas Possibilidades Criativas e Edição Multietapas
Além da preservação da identidade, o novo editor do Gemini expande significativamente as possibilidades criativas. Agora, é possível combinar múltiplas fotos em uma única cena, como unir a imagem de uma pessoa com a de um pet para criar um retrato conjunto em um ambiente totalmente novo. Outra funcionalidade inovadora permite aplicar o estilo visual de uma imagem em objetos de outra, possibilitando a criação de efeitos de design únicos, como transformar um vestido com a textura de flores ou redesenhar botas inspiradas nas asas de uma borboleta.
Usuários também podem alterar roupas, profissões ou épocas em retratos, além de criar cenários mistos, como simular uma pessoa abraçando um cachorro em uma quadra de basquete. O recurso de edição em várias etapas foi aprimorado, permitindo um processo colaborativo com a IA. Por exemplo, é possível pegar a foto de uma sala vazia, pintar as paredes, incluir móveis e adicionar decoração em sequência, sem perder os ajustes anteriores. Essa abordagem progressiva facilita ajustes finos em partes específicas da imagem, tornando o processo mais intuitivo e eficiente.
Por que o Google desativou a geração de imagens de pessoas em 2024?
É importante lembrar que, em 2024, o Google havia desativado temporariamente a geração de imagens de pessoas após críticas relacionadas a resultados distorcidos e representações historicamente imprecisas. A função foi reativada com o modelo Imagen 3, e agora, com esta nova atualização no Gemini, ganha ainda mais estabilidade e consistência. Este retorno demonstra o compromisso do Google em aprimorar suas ferramentas de IA, garantindo que elas sejam não apenas poderosas, mas também responsáveis e precisas em suas criações.
A atualização do editor de imagens do Gemini representa um marco no desenvolvimento da inteligência artificial aplicada à criatividade visual. Com a capacidade de preservar a identidade, oferecer novas ferramentas de combinação e estilo, e aprimorar a edição multietapas, o Google está democratizando o acesso a recursos de edição de nível profissional. Isso permite que mais usuários explorem sua criatividade e produzam imagens de alta qualidade com facilidade, consolidando o Gemini como uma ferramenta essencial para o futuro da edição de imagens.