Edição fotográfica com IA generativa: vantagens, limitações e testes
A DECO PROteste testou o ChatGPT, o Gemini e o Stable Diffusion em tarefas de edição de fotografia. Os resultados mostram uma divisão clara: surpreendentes na manipulação de imagens, bastante limitados nas correções técnicas.
A fotografia digital tem evoluído de forma quase contínua nas últimas décadas – das câmaras SLR e híbridas, com sensores cada vez mais avançados, aos smartphones que compensam limitações físicas com múltiplas lentes e sensores, excelente capacidade de processamento, HDR computacional e fusão de imagens. A cada avanço no hardware correspondeu um salto nas ferramentas de edição.
Durante anos, o processo passou obrigatoriamente por software especializado, como o Adobe Photoshop e o Lightroom, ferramentas precisas, mas exigentes do ponto de vista técnico.
Agora, a inteligência artificial generativa promete mudar a lógica da edição fotográfica e simplificar tudo. Em vez de histogramas e curvas, basta descrever o que se pretende em linguagem comum. Remover pessoas ou objetos, otimizar o contraste, melhorar o enquadramento, alterar cores ou transformar uma imagem num desenho são tarefas que se tornam acessíveis a qualquer utilizador.
Mas até que ponto a promessa é cumprida? Pode a inteligência artificial generativa ser uma alternativa à edição fotográfica tradicional, e em que cenários?
A DECO PROteste testou o ChatGPT, o Google Gemini e o Stable Diffusion, este último um sistema mais específico para o tratamento de imagens, e a resposta está longe de ser linear. Veja os resultados.
Voltar ao topoO que muda na edição de imagem?
A principal mudança está na forma de interação. Em vez de ajustar parâmetros técnicos, o utilizador dá instruções diretas em linguagem comum, como “remove esta pessoa” ou “transforma esta imagem num desenho”. O sistema interpreta o pedido e gera automaticamente a imagem.
Ao contrário do que ocorre no software tradicional, em que cada ajuste é controlado com precisão, estes sistemas baseiam-se em interpretação probabilística.
A complexidade técnica é, assim, dramaticamente reduzida, facilitando tarefas antes difíceis ou demoradas. Mas as novas ferramentas também introduzem variabilidade nos resultados e retiram ao utilizador controlo sobre o processo. A edição torna-se mais acessível, mas menos previsível.
Voltar ao topoTrês ferramentas de edição testadas
Para esta análise, a DECO PROteste selecionou três sistemas com perfis de utilização distintos, que vão do grande público a utilizadores com maior conhecimento técnico.
ChatGPT
Interface simples, baseada em linguagem comum, está orientada para o grande público.
Gemini
Integrado com o ecossistema Google, oferece experiência conversacional, orientada para o grande público.
Stable Diffusion
Modelo aberto que permite maior controlo sobre o processo de edição e geração, é mais adequado para utilizadores com algum conhecimento técnico.
Foi também incluído o Luminar Neo, software de edição com inteligência artificial integrada. Os resultados nas tarefas clássicas não se distinguiram de forma significativa dos entregues pelas restantes ferramentas.
Voltar ao topoO que a IA generativa consegue fazer na edição de fotos
A IA generativa apresenta melhores resultados em tarefas de manipulação criativa, isto é, na reinterpretação ou transformação de uma imagem.
Remover ou substituir objetos e pessoas
A eliminar pessoas, alterar elementos ou substituir objetos, funciona bem, sobretudo em cenários com fundos simples. O ChatGPT e o Gemini apresentaram resultados consistentes. Na substituição de objetos, o Stable Diffusion foi bastante menos convincente.

Alterar características visuais
Na alteração de expressões faciais, edição de elementos específicos em pessoas (retirar óculos, trocar uma peça de roupa...) ou substituição de objetos (trocar um cão por um gato, por exemplo), o ChatGPT e o Gemini devolvem resultados convincentes, ainda que o primeiro tenha preservado mais detalhe. O Gemini manteve maior fidelidade ao rosto original. O Stable Diffusion foi a exceção: os resultados ficaram consistentemente abaixo dos entregues pelos outros dois sistemas.
Transformar em imagem criativa
A conversão de fotografias em ilustrações, como desenhos a lápis, levou a resultados, muitas vezes, impressionantes e visualmente coerentes. O ChatGPT cumpriu bem a tarefa, mantendo todos os detalhes, mas o Gemini destacou-se: além de preservar os detalhes, adicionou cor de forma coerente nos elementos onde esta se destacava.

Alterar cor e sombras
Nos pedidos de alteração de cor de objetos (como uma camisa) ou mesmo em manipulações que afetam a distribuição da luz e sombra, estes sistemas também se saíram bem, de uma forma geral. O ChatGPT e o Gemini mostraram-se superiores a alterar cores em objetos, com ligeira vantagem para o primeiro, que preservou mais detalhes da camisa. O Stable Diffusion revelou menor capacidade de compreensão do contexto da foto, alterando também o casaco. Em manipulações com impacto na distribuição da luz e sombras, o ChatGPT e o Stable Diffusion obtiveram melhores resultados.

Recorte para formatos simples
Recortes para rácios como 1:1 são executados de forma satisfatória pelo ChatGPT e pelo Gemini, mantendo o foco no assunto principal.

Falhas e limitações
O cenário muda quando entramos em tarefas clássicas de edição. Em questões técnicas, a inteligência artificial generativa não só falha como tende também a aplicar modificações não solicitadas, que podem arruinar a fotografia, como a alteração de feições ou a direção do olhar de pessoas.
Corrigir horizonte e perspetiva
Todos os sistemas falharam, mostrando-se incapazes de alinhar horizontes ou de corrigir rotações de forma fiável. O ChatGPT rodou o horizonte na direção errada, o Gemini ignorou uma rotação de 90 graus e o Stable Diffusion não se mostrou melhor.

Ajustar exposição e equilíbrio de brancos
Embora consigam alterar a luminosidade, fazem-no frequentemente de forma inconsistente, com tons irrealistas, sobretudo em pele e paisagens. O Gemini obteve resultados razoáveis em fotografias subexpostas. Nas sobrexpostas, a edição foi exagerada, o que resultou em pixelização e saturação excessiva. Na foto subexposta, o ChatGPT conseguiu um resultado satisfatório – embora com perda de detalhe nas zonas mais claras –, mas desiludiu na sobrexposta, em que aplicou reduções demasiado drásticas, perdendo detalhe em quase toda a imagem.
No equilíbrio de brancos, o Gemini recusou mesmo atuar, alegando falta de capacidade. Já o ChatGPT e o Stable Diffusion realizaram a tarefa, mas sem acertarem na temperatura de cor: o primeiro apresentou um tom amarelado e o segundo, azulado.

Regular nitidez, ruído e resolução
A suavização excessiva elimina detalhes importantes, e o aumento de resolução pode introduzir elementos inexistentes. Num ensaio com uma fotografia plena de ruído, em que se solicitou a sua redução, mas mantendo os detalhes, o ChatGPT suavizou de tal forma, que o resultado ficou pior do que o original.
Já face ao pedido para aumentar a resolução de uma imagem pouco detalhada, os sistemas alteraram caracteres de texto e feições. Em contextos jornalísticos, trata-se de uma falsificação da realidade, que dificilmente alguém considerará útil.

Composição e recorte inteligente
Em vez de ajustar a imagem original, os sistemas geram novos pixéis, um fenómeno de alucinação composicional, que pode alterar rostos, objetos ou elementos da cena. O Gemini rodou fisicamente a cabeça de um pombo. O ChatGPT alterou as feições da criança num retrato.

Perda de controlo na edição
Há um risco que vai para além dos resultados inconsistentes. A facilidade de utilização destes sistemas mascara uma cedência real do controlo técnico sobre o processo.
Ao contrário do software tradicional, em que cada ajuste é controlado pelo utilizador, a inteligência artificial generativa tem tendência a fazer alterações não solicitadas.
- O Luminar Neo modificou a saturação das cores sem que tal fosse pedido.
- O Gemini rodou a cabeça de um pombo ao tentar melhorar o enquadramento.
- O Stable Diffusion aplicou alterações ao casaco de uma pessoa, quando a instrução era de atuar apenas sobre a camisa.
Na prática, a imagem deixa de ser uma edição controlada para passar a ser uma versão reinterpretada pela inteligência artificial.
Para fotografia profissional, editorial ou documental, este comportamento é inaceitável.
Voltar ao topoQuando usar e evitar
Os testes da DECO PROteste mostram que a inteligência artificial pode ser muito útil em certos contextos, mas que deve ser evitada noutros.
Quando faz sentido
- Remover elementos indesejados.
- Alterar a cor de objetos específicos.
- Substituir elementos numa imagem.
- Criar versões estilizadas ou artísticas.
- Ajustar expressões faciais.
- Recortes simples.
Quando evitar
- Correção de horizonte e perspetiva.
- Rotação de fotografias.
- Redução de ruído.
- Equilíbrio rigoroso de brancos.
- Aumento da resolução das imagens (upscaling).
- Edição editorial ou documental.
Vantagens e inconvenientes da edição com IA
Prós
- Simplicidade: não exige conhecimentos técnicos. Basta descrever o que se quer em linguagem comum.
- Acesso a tarefas complexas: manipulações complexas, como a remoção de objetos ou transformações criativas, que exigiam competências avançadas, passam a estar ao alcance de qualquer utilizador.
- Rapidez: operações que demorariam horas num software tradicional ficam resolvidas em segundos ou poucos minutos.
Contras
- Perda de controlo técnico: o sistema pode fazer alterações que não foram solicitadas, comprometendo a integridade da imagem original.
- Resultados imprevisíveis: as respostas resultam de interpretações probabilísticas, não de ajustes matemáticos. O mesmo pedido pode levar a resultados diferentes entre interações.
- Falta de rigor em edição técnica: para fotojornalismo, fotografia editorial ou qualquer contexto em que a fidelidade ao original seja essencial, não é uma alternativa viável.
- Funcionalidades avançadas pagas: as capacidades mais completas estão frequentemente reservadas a subscrições pagas.
Um complemento às ferramentas clássicas
A edição de fotografia com inteligência artificial generativa já é útil em vários cenários, mas continua longe de substituir as soluções tradicionais.
Para o utilizador casual que quer remover um elemento indesejado de uma fotografia de férias, ou mudar a cor de um objeto, estas ferramentas são uma opção válida e surpreendentemente eficaz.
Mas, quando o objetivo é obter resultados técnicos rigorosos, ferramentas como o Adobe Lightroom ou o Adobe Photoshop mantêm clara vantagem. Apesar de o software integrar inteligência artificial, esta é aplicada de forma controlada e específica, garantindo previsibilidade e precisão.
O que dizem os resultados dos testes da DECO PROteste?
- O ChatGPT destacou-se pela consistência nas tarefas de manipulação, como remoção e substituição de objetos, alterações de cor ou transformações criativas.
- O Google Gemini apresentou resultados muito próximos, superando pontualmente o ChatGPT em áreas como expressões faciais ou conversão para estilos ilustrados.
- Já o Stable Diffusion, apesar da flexibilidade, ficou consistentemente aquém dos dois sistemas conversacionais, falhando na manipulação facial e na substituição de elementos.
Nas tarefas clássicas de edição, o software dedicado continua a apresentar melhores resultados. Mas, se a evolução continuar ao ritmo atual, este cenário poderá mudar. Para já, a melhor abordagem passa por combinar os dois mundos, tirando partido do que cada um faz melhor.
Pedir livro que ajuda a usar a IA no dia-a-dia
Voltar ao topo
|
O conteúdo deste artigo pode ser reproduzido para fins não-comerciais com o consentimento expresso da DECO PROTeste, com indicação da fonte e ligação para esta página. Ver Termos e Condições. |
