Notícias

ChatGPT, Bing Chat ou Bard: qual o melhor chat de inteligência artificial?

Já recorreu a um chat de inteligência artificial generativa para pesquisar informações, criar textos ou resolver problemas? A DECO PROteste testou os três serviços mais populares, e revela qual é o melhor em cada funcionalidade.

Especialista:
Editor:
09 janeiro 2024
Telemóvel com ícone de chat de inteligência artificial por cima a amarelo; fundo tecnológico

iStock

A inteligência artificial tem vindo a ganhar destaque no quotidiano das indústrias e dos consumidores. O sucesso e o mediatismo conquistados por este tipo de tecnologia está, em boa parte, ligado aos lançamentos de chats de inteligência artificial generativa

Estes sistemas são capazes de simular uma conversa com um humano e gerar texto com base na ordem introduzida pelo utilizador e na base de dados da ferramenta. Atualmente, os sistemas que lideram esta frente de inovação são o ChatGPT (da Open AI), o Bing Chat (da Microsoft) e o Bard (da Google).

A grande diferença face a outros chats de resposta automática é que estes modelos são especialmente programados para simular uma resposta humana. Isto é possível graças ao conceito de processamento de linguagem natural. Ou seja, o modelo de inteligência artificial recorre a uma série de conversas, artigos, livros, páginas na internet e publicações presentes nas suas bases de dados, ou a uma pesquisa na internet em tempo real (no caso do Bing Chat e do Bard). Posteriormente, o sistema responde à questão submetida ou sugere que o utilizador detalhe a sua questão, de modo a retribuir com uma resposta mais completa.

Utilização dos chats exige cautela

Não tardou muito para que utilizadores domésticos, estudantis e profissionais olhassem para esta tecnologia como uma oportunidade para consulta de informações e produção de conteúdos, com farta celeridade e parco esforço. 

Apesar de todas as vantagens, a DECO PROteste já tinha alertado para as inúmeras inconsistências e limitações presentes nos modelos de inteligência artificial, ainda em fase embrionária. As falhas podem comprometer a total factualidade dos resultados gerados e induzir o utilizador em erro.

Isto torna a utilização das atuais versões dos modelos desaconselhada para situações de maior responsabilidade, e sem que haja cruzamento de informação obtida através de outras fontes. Os próprios termos e condições de alguns serviços referem que não existem garantias sobre a precisão na geração de respostas e que, assim, devem ser utilizados sobretudo para fins de entretenimento.

Frente‑a‑frente do ChatGPT, do Bing Chat e do Bard

A DECO PROteste pôs à prova os três serviços de inteligência artificial mais populares – o ChatGPT (da Open AI), o Bing Chat (da Microsoft) e o Bard (da Google) –, com o objetivo de apurar a capacidade de resposta, a veracidade das informações, a criatividade dos textos e a coerência do conteúdo

Neste comparativo, a DECO PROteste averiguou qual o serviço que tem a melhor qualidade de respostas e o que tem o melhor desempenho global. Foram elaboradas 31 questões, cada uma submetida três vezes por cada membro de um painel de utilizadores, composto por três elementos. Cada questão obteve nove respostas

As perguntas expostas visaram cinco funcionalidades dos sistemas, que representam os principais cenários de uso dos cibernautas domésticos. As funcionalidades são as seguintes:

  • a pesquisa de informação (dez questões);
  • a interpretação de informação (cinco questões);
  • a criação de textos (quatro questões);
  • a resolução de problemas lógicos e matemáticos (seis questões);
  • e a tradução de textos (seis questões).

1. Pesquisa de informação

Entre o lote de questões para avaliar a precisão da pesquisa de informação, os temas variam: finanças pessoais, saúde, arrendamento, alimentação, tecnologia, entre outros. Não ocorreu uma repetição exata nas nove respostas obtidas para cada questão, em cada um dos serviços. Contudo, o ChatGPT garantiu uma tendência de maior precisão

As respostas dos modelos destacam-se também por apresentarem uma qualidade gramatical muito boa, embora recorram regularmente à variante de português do Brasil como padrão, mesmo com os utilizadores localizados em Portugal. Ao analisar a precisão factual das respostas, foram identificadas diversas informações que invalidavam o texto. Em casos mais preocupantes, algumas informações geradas podem representar um risco para a saúde do utilizador

Embora o ChatGPT tenha a pontuação mais elevada nesta funcionalidade, ao fornecer respostas com uma quantidade significativa de factos corretos, o desempenho está longe do nível da excelência. O Bing Chat e o Bard superam o ChatGPT em algumas respostas, mas alcançaram uma pontuação média no geral, o que representa a necessidade de maior cautela do utilizador, quando recorre as estas ferramentas para pesquisa de informação. Os resultados podem parecer contraditórios, uma vez que os motores de pesquisa da Google e da Microsoft são popularmente utilizados para esse fim.

2. Interpretação de informação

Avaliou-se também a capacidade dos serviços na interpretação de informação, bem como na síntese e produção de novos conteúdos com base no texto inserido pelo utilizador. Foram submetidos cinco artigos da DECO PROteste, sobre temas desde segurança cibernética a tarifários de telecomunicações. Apesar de identificarem assertivamente o tema principal em todos os artigos, a qualidade global dos textos revelou-se mais defeituosa, com alguns resumos que ignoram factos e conclusões relevantes.

Para este tipo de utilização, o ChatGPT destaca-se nitidamente dos restantes. Apresenta o melhor desempenho nos resumos gerados na maioria das perguntas, sendo o seu principal ponto de melhoria a omissão de algumas informações pertinentes nos artigos de referência. Já o Bing Chat não passou da mediania, sobretudo por ter dados inexistentes no artigo e, por vezes, não retribuir com um bom resumo. O Bard apresentou uma fraca capacidade de interpretação da informação, respondeu com alguns dados errados e fez interpretações incorretas dos artigos. 

A capacidade de aceder à internet para gerar resumos pode ser uma grande vantagem do Bing Chat e do Bard. Mas, em muitos casos, a resposta destes serviços parece ter sido afetada pelos conteúdos de sites consultados. Sem a capacidade de aceder à internet e com o melhor resultado nos casos testados, o ChatGPT tirou partido da sua limitação.

3. Criação de textos

Acesso a conteúdos exclusivos!

Crie uma conta grátis e explore uma seleção de conteúdos para Simpatizantes.

Entrar

Não tem conta? Criar conta gratuita

 

O conteúdo deste artigo pode ser reproduzido para fins não-comerciais com o consentimento expresso da DECO PROTeste, com indicação da fonte e ligação para esta página. Ver Termos e Condições.

Temas que lhe podem interessar