Notícias

Edição fotográfica com IA generativa: vantagens, limitações e testes

A DECO PROteste testou o ChatGPT, o Gemini e o Stable Diffusion em tarefas de edição de fotografia. Os resultados mostram uma divisão clara: surpreendentes na manipulação de imagens, bastante limitados nas correções técnicas.

Especialista:

António Alves

e Pedro Costa

Editor:

Inês Lourinho

26 junho 2026

Duas mulheres a fazer edição de imagem em escritório de design

iStock

Neste artigo

A fotografia digital tem evoluído de forma quase contínua nas últimas décadas – das câmaras SLR e híbridas, com sensores cada vez mais avançados, aos smartphones que compensam limitações físicas com múltiplas lentes e sensores, excelente capacidade de processamento, HDR computacional e fusão de imagens. A cada avanço no hardware correspondeu um salto nas ferramentas de edição.

Durante anos, o processo passou obrigatoriamente por software especializado, como o Adobe Photoshop e o Lightroom, ferramentas precisas, mas exigentes do ponto de vista técnico.

Agora, a inteligência artificial generativa promete mudar a lógica da edição fotográfica e simplificar tudo. Em vez de histogramas e curvas, basta descrever o que se pretende em linguagem comum. Remover pessoas ou objetos, otimizar o contraste, melhorar o enquadramento, alterar cores ou transformar uma imagem num desenho são tarefas que se tornam acessíveis a qualquer utilizador.

Mas até que ponto a promessa é cumprida? Pode a inteligência artificial generativa ser uma alternativa à edição fotográfica tradicional, e em que cenários?

A DECO PROteste testou o ChatGPT, o Google Gemini e o Stable Diffusion, este último um sistema mais específico para o tratamento de imagens, e a resposta está longe de ser linear. Veja os resultados.

Voltar ao topo

O que muda na edição de imagem?

A principal mudança está na forma de interação. Em vez de ajustar parâmetros técnicos, o utilizador dá instruções diretas em linguagem comum, como “remove esta pessoa” ou “transforma esta imagem num desenho”. O sistema interpreta o pedido e gera automaticamente a imagem.

Ao contrário do que ocorre no software tradicional, em que cada ajuste é controlado com precisão, estes sistemas baseiam-se em interpretação probabilística.

A complexidade técnica é, assim, dramaticamente reduzida, facilitando tarefas antes difíceis ou demoradas. Mas as novas ferramentas também introduzem variabilidade nos resultados e retiram ao utilizador controlo sobre o processo. A edição torna-se mais acessível, mas menos previsível.

Voltar ao topo

Três ferramentas de edição testadas

Para esta análise, a DECO PROteste selecionou três sistemas com perfis de utilização distintos, que vão do grande público a utilizadores com maior conhecimento técnico.

ChatGPT

Interface simples, baseada em linguagem comum, está orientada para o grande público.

Gemini

Integrado com o ecossistema Google, oferece experiência conversacional, orientada para o grande público.

Stable Diffusion

Modelo aberto que permite maior controlo sobre o processo de edição e geração, é mais adequado para utilizadores com algum conhecimento técnico.

Foi também incluído o Luminar Neo, software de edição com inteligência artificial integrada. Os resultados nas tarefas clássicas não se distinguiram de forma significativa dos entregues pelas restantes ferramentas.

Voltar ao topo

O que a IA generativa consegue fazer na edição de fotos

A IA generativa apresenta melhores resultados em tarefas de manipulação criativa, isto é, na reinterpretação ou transformação de uma imagem.

Remover ou substituir objetos e pessoas

A eliminar pessoas, alterar elementos ou substituir objetos, funciona bem, sobretudo em cenários com fundos simples. O ChatGPT e o Gemini apresentaram resultados consistentes. Na substituição de objetos, o Stable Diffusion foi bastante menos convincente.

Duas versões de fotografia de paragem à beira-rio, com e sem ponte ao fundo

Fotografia original (em cima) e resultado entregue pelo Gemini. Tarefa solicitada: retirar a ponte.

Alterar características visuais

Na alteração de expressões faciais, edição de elementos específicos em pessoas (retirar óculos, trocar uma peça de roupa...) ou substituição de objetos (trocar um cão por um gato, por exemplo), o ChatGPT e o Gemini devolvem resultados convincentes, ainda que o primeiro tenha preservado mais detalhe. O Gemini manteve maior fidelidade ao rosto original. O Stable Diffusion foi a exceção: os resultados ficaram consistentemente abaixo dos entregues pelos outros dois sistemas.

Quatro variações de fotografia de mulher com expressão facial diferente

A partir da primeira fotografia da sequência, foi feito o pedido "põe a pessoa a dar uma gargalhada". As imagens seguintes correspondem, respetivamente, aos resultados do ChatGPT, do Gemini e do Stable Diffusion.

Transformar em imagem criativa

A conversão de fotografias em ilustrações, como desenhos a lápis, levou a resultados, muitas vezes, impressionantes e visualmente coerentes. O ChatGPT cumpriu bem a tarefa, mantendo todos os detalhes, mas o Gemini destacou-se: além de preservar os detalhes, adicionou cor de forma coerente nos elementos onde esta se destacava.

Duas versões de imagem de automóvel numa zona histórica, uma em formato de fotografia e outra em formato de desenho

Imagem original seguida do resultado do Gemini após o pedido "transforma esta fotografia num desenho feito a lápis de carvão, mantendo a composição original, as proporções e os elementos principais. Preserva os detalhes importantes e evita distorções".

Alterar cor e sombras

Nos pedidos de alteração de cor de objetos (como uma camisa) ou mesmo em manipulações que afetam a distribuição da luz e sombra, estes sistemas também se saíram bem, de uma forma geral. O ChatGPT e o Gemini mostraram-se superiores a alterar cores em objetos, com ligeira vantagem para o primeiro, que preservou mais detalhes da camisa. O Stable Diffusion revelou menor capacidade de compreensão do contexto da foto, alterando também o casaco. Em manipulações com impacto na distribuição da luz e sombras, o ChatGPT e o Stable Diffusion obtiveram melhores resultados.

Quatro versões de fotografia de homem com cores diferentes

A um pedido para "alterar a cor da camisa para verde" (primeira imagem), seguiram-se os resultados do ChatGPT, do Gemini e do Stable Diffusion. O último alterou também o casaco.

Recorte para formatos simples

Recortes para rácios como 1:1 são executados de forma satisfatória pelo ChatGPT e pelo Gemini, mantendo o foco no assunto principal.

Duas versões de fotografia de barco com crop (recorte) diferente

Pedido: "Recorta a imagem para formato 1:1." O resultado do ChatGPT foi satisfatório. Preservou o destaque da foto, não manipulou outros parâmetros e manteve um enquadramento equilibrado.

Voltar ao topo

Falhas e limitações

O cenário muda quando entramos em tarefas clássicas de edição. Em questões técnicas, a inteligência artificial generativa não só falha como tende também a aplicar modificações não solicitadas, que podem arruinar a fotografia, como a alteração de feições ou a direção do olhar de pessoas.

Corrigir horizonte e perspetiva

Todos os sistemas falharam, mostrando-se incapazes de alinhar horizontes ou de corrigir rotações de forma fiável. O ChatGPT rodou o horizonte na direção errada, o Gemini ignorou uma rotação de 90 graus e o Stable Diffusion não se mostrou melhor.

Duas versões de foto de pombo com horientação diferente

O pedido foi "corrige a orientação da fotografia". O ChatGPT rodou a imagem na direção contrária.

Ajustar exposição e equilíbrio de brancos

Embora consigam alterar a luminosidade, fazem-no frequentemente de forma inconsistente, com tons irrealistas, sobretudo em pele e paisagens. O Gemini obteve resultados razoáveis em fotografias subexpostas. Nas sobrexpostas, a edição foi exagerada, o que resultou em pixelização e saturação excessiva. Na foto subexposta, o ChatGPT conseguiu um resultado satisfatório – embora com perda de detalhe nas zonas mais claras –, mas desiludiu na sobrexposta, em que aplicou reduções demasiado drásticas, perdendo detalhe em quase toda a imagem.

No equilíbrio de brancos, o Gemini recusou mesmo atuar, alegando falta de capacidade. Já o ChatGPT e o Stable Diffusion realizaram a tarefa, mas sem acertarem na temperatura de cor: o primeiro apresentou um tom amarelado e o segundo, azulado.

Fotografia de mulher em três versões, com correção de balanço de brancos

Em cima, a fotografia inserida no pedido. Em baixo, o resultado entregue pelo Stabble Diffusion, seguido da imagem com o equilíbrio de brancos correto.

Regular nitidez, ruído e resolução

A suavização excessiva elimina detalhes importantes, e o aumento de resolução pode introduzir elementos inexistentes. Num ensaio com uma fotografia plena de ruído, em que se solicitou a sua redução, mas mantendo os detalhes, o ChatGPT suavizou de tal forma, que o resultado ficou pior do que o original.

Já face ao pedido para aumentar a resolução de uma imagem pouco detalhada, os sistemas alteraram caracteres de texto e feições. Em contextos jornalísticos, trata-se de uma falsificação da realidade, que dificilmente alguém considerará útil.

Duas versões da mesma fotografia de estação de metro, com e sem afinação da nitidez com recurso a inteligência artificial

O Gemini entregou uma imagem relativamente nítida. Mas uma observação mais atenta revela o problema: alguns caracteres foram alterados e, em certos casos, a informação que era legível no original deixou de o ser. A placa de direção do metro, por exemplo, ganhou caracteres irreconhecíveis.

Composição e recorte inteligente

Em vez de ajustar a imagem original, os sistemas geram novos pixéis, um fenómeno de alucinação composicional, que pode alterar rostos, objetos ou elementos da cena. O Gemini rodou fisicamente a cabeça de um pombo. O ChatGPT alterou as feições da criança num retrato.

Três versões de fotografia de criança na rua com enquadramento diferente

O ChatGPT e o Gemini conseguiram identificar o assunto dominante, mas alteraram as feições da criança: de forma muito evidente no primeiro caso e menos notória, mas ainda percetível, no segundo. O Gemini foi ainda mais longe, e alterou o fundo por completo.

Voltar ao topo

Perda de controlo na edição

Há um risco que vai para além dos resultados inconsistentes. A facilidade de utilização destes sistemas mascara uma cedência real do controlo técnico sobre o processo.

Ao contrário do software tradicional, em que cada ajuste é controlado pelo utilizador, a inteligência artificial generativa tem tendência a fazer alterações não solicitadas.

O Luminar Neo modificou a saturação das cores sem que tal fosse pedido.
O Gemini rodou a cabeça de um pombo ao tentar melhorar o enquadramento.
O Stable Diffusion aplicou alterações ao casaco de uma pessoa, quando a instrução era de atuar apenas sobre a camisa.

Na prática, a imagem deixa de ser uma edição controlada para passar a ser uma versão reinterpretada pela inteligência artificial.

Para fotografia profissional, editorial ou documental, este comportamento é inaceitável.

Voltar ao topo

Quando usar e evitar

Os testes da DECO PROteste mostram que a inteligência artificial pode ser muito útil em certos contextos, mas que deve ser evitada noutros.

Quando faz sentido

Remover elementos indesejados.
Alterar a cor de objetos específicos.
Substituir elementos numa imagem.
Criar versões estilizadas ou artísticas.
Ajustar expressões faciais.
Recortes simples.

Quando evitar

Correção de horizonte e perspetiva.
Rotação de fotografias.
Redução de ruído.
Equilíbrio rigoroso de brancos.
Aumento da resolução das imagens (upscaling).
Edição editorial ou documental.

Voltar ao topo

Vantagens e inconvenientes da edição com IA

Além de nem todos os contextos beneficiarem do uso da inteligência artificial, há vantagens e inconvenientes a ponderar.

Prós

Simplicidade: não exige conhecimentos técnicos. Basta descrever o que se quer em linguagem comum.

Acesso a tarefas complexas: manipulações complexas, como a remoção de objetos ou transformações criativas, que exigiam competências avançadas, passam a estar ao alcance de qualquer utilizador.

Rapidez: operações que demorariam horas num software tradicional ficam resolvidas em segundos ou poucos minutos.

Contras

Perda de controlo técnico: o sistema pode fazer alterações que não foram solicitadas, comprometendo a integridade da imagem original.

Resultados imprevisíveis: as respostas resultam de interpretações probabilísticas, não de ajustes matemáticos. O mesmo pedido pode levar a resultados diferentes entre interações.

Falta de rigor em edição técnica: para fotojornalismo, fotografia editorial ou qualquer contexto em que a fidelidade ao original seja essencial, não é uma alternativa viável.

Funcionalidades avançadas pagas: as capacidades mais completas estão frequentemente reservadas a subscrições pagas.

Voltar ao topo

Um complemento às ferramentas clássicas

A edição de fotografia com inteligência artificial generativa já é útil em vários cenários, mas continua longe de substituir as soluções tradicionais.

Para o utilizador casual que quer remover um elemento indesejado de uma fotografia de férias, ou mudar a cor de um objeto, estas ferramentas são uma opção válida e surpreendentemente eficaz.

Mas, quando o objetivo é obter resultados técnicos rigorosos, ferramentas como o Adobe Lightroom ou o Adobe Photoshop mantêm clara vantagem. Apesar de o software integrar inteligência artificial, esta é aplicada de forma controlada e específica, garantindo previsibilidade e precisão.

O que dizem os resultados dos testes da DECO PROteste?

O ChatGPT destacou-se pela consistência nas tarefas de manipulação, como remoção e substituição de objetos, alterações de cor ou transformações criativas.
O Google Gemini apresentou resultados muito próximos, superando pontualmente o ChatGPT em áreas como expressões faciais ou conversão para estilos ilustrados.
Já o Stable Diffusion, apesar da flexibilidade, ficou consistentemente aquém dos dois sistemas conversacionais, falhando na manipulação facial e na substituição de elementos.

Nas tarefas clássicas de edição, o software dedicado continua a apresentar melhores resultados. Mas, se a evolução continuar ao ritmo atual, este cenário poderá mudar. Para já, a melhor abordagem passa por combinar os dois mundos, tirando partido do que cada um faz melhor.

Pedir livro que ajuda a usar a IA no dia-a-dia

Voltar ao topo

O conteúdo deste artigo pode ser reproduzido para fins não-comerciais com o consentimento expresso da DECO PROTeste, com indicação da fonte e ligação para esta página. Ver Termos e Condições.