Escrito por pesquisadores da USP, artigo do Jornal da USP explica como funciona a ferramenta que virou notícia no mundo todo
O robô inteligente (chatbot) ChatGPT, lançado no final de 2022 por um laboratório de pesquisa e desenvolvimento, virou notícia no mundo todo. Sua impressionante habilidade de dialogar com humanos gerou enorme repercussão: em apenas cinco dias o site que hospeda o robô atingiu um milhão de usuários.
“O ChatGPT é um modelo de linguagem treinado pelo OpenAI que foi projetado para ser capaz de realizar uma ampla variedade de tarefas de processamento de linguagem natural. Ele pode ser usado para responder a perguntas, realizar pesquisas, gerar texto, traduzir idiomas e muito mais. O ChatGPT foi treinado usando uma grande quantidade de dados da web e foi projetado para ser capaz de imitar o comportamento humano de maneira natural e convincente. Ele é capaz de continuar conversas de maneira fluente e pode ser usado em uma ampla variedade de contextos.”
A capacidade de geração de texto do ChatGPT pode ser evidenciada pelo parágrafo acima, integralmente produzido pelo próprio, ao ser questionado sobre o que é capaz de fazer. Perguntado sobre a qualidade de seu desempenho, o robô dá a seguinte resposta:
“Ele [o ChatGPT] ainda é uma máquina e, como tal, não possui consciência ou as habilidades cognitivas humanas. Portanto, embora o ChatGPT possa se sair muito bem em muitas tarefas de processamento de linguagem natural, ele ainda não é tão capaz quanto um ser humano em algumas áreas.”
Em termos técnicos, o ChatGPT é fruto de duas grandes revoluções da Inteligência Artificial (IA) e do Processamento de Línguas Naturais (PLN). Por um lado, ele utiliza a modelagem dos transformers, que, em linhas gerais, são conjuntos de redes neurais artificiais modeladas para serem mais “atentas” ao que devem aprender. Esses modelos usam representações numéricas para as palavras da língua, as chamadas word embeddings, as quais, por sua vez, são baseadas em hipóteses linguísticas clássicas. De acordo com essas hipóteses, os significados das palavras podem ser inferidos a partir dos contextos em que ocorrem. Com os transformers e as word embeddings, sistemas como o ChatGPT conseguem aprender, com significativo sucesso, estruturas da língua, padrões de escrita e associações entre padrões. Isso é feito a partir de um treinamento altamente custoso sobre uma grande quantidade de textos “crus” (isto é, não processados), sem necessidade de intervenção humana para analisar linguisticamente os dados. O ChatGPT, em especial, diferencia-se de outras soluções de IA por fazer uso adicional de uma pequena quantidade de dados “curados” fornecidos por humanos. Essa estratégia serve para “reforçar” o aprendizado e fazer moderação de conteúdo para detectar discurso de ódio, sexista ou violento, permitindo que o sistema lide de maneira diferenciada com conteúdos indesejados.
A pergunta que paira no ar é qual é o nível de revolução que o ChatGPT representa e se ele vai, de fato, substituir buscadores e tradutores automáticos tradicionais. Nossa primeira impressão, baseada em décadas de atuação em PLN no Núcleo Interinstitucional de Linguística Computacional (Nilc) da USP, é que o robô ChatGPT é a mais nova evidência de inovações com potencial disruptivo que a inteligência artificial pode trazer no futuro, com potencial de alterar drasticamente a maneira pela qual interagimos com as máquinas.
Para entender o impacto do ChatGPT, é importante relembrar um pouco a história do PLN e dos principais avanços que culminaram na produção do sistema. Desde a criação das primeiras máquinas de computar, vislumbraram-se ferramentas inteligentes – ou robôs – capazes de interagir com humanos e realizar tarefas a partir de instruções em língua natural (que são as línguas que nós humanos usamos na nossa comunicação: português, inglês, francês, japonês, etc.). O termo língua natural foi cunhado em contraponto às linguagens artificiais, criadas para propósitos específicos, como as linguagens de programação utilizadas para desenvolver software.
De forma geral, como é bem discutido em Inteligência Artificial e os rumos do processamento do português brasileiro, de Marcelo Finger, ao longo de décadas de desenvolvimento do PLN, foram criados léxicos, gramáticas, córpus e sistemas de análise textual de diferentes níveis. O aprendizado de máquina se popularizou, permitindo que a máquina aprenda a desempenhar uma tarefa a partir de exemplos fornecidos, uma grande quantidade de dados ficou acessível. Aqui é impossível não citar o movimento de “web como córpus” e o surgimento e sistematização das tecnologias de big data. O aprendizado profundo (ou seja, as redes neurais artificiais profundas) também evoluiu, causando uma revolução nos resultados, tudo isso aliado aos avanços de poder de processamento das máquinas. Esse cenário viabilizou os atuais sistemas avançados de PLN, em especial, os “assistentes virtuais inteligentes”, dos quais o ChatGPT é o mais recente representante.
O sistema, de fato, impressiona ao responder a perguntas de todo tipo, desde questões gerais e de cunho existencial até aquelas altamente técnicas e de áreas específicas. Em testes que fizemos, o ChatGPT se saiu incrivelmente bem respondendo questões sobre dificuldades acadêmicas, questões específicas de como analisar linguisticamente sentenças escritas em português utilizando um determinado modelo gramatical, e questões do dia a dia, mesmo quando as perguntas eram formuladas de maneira vaga. Também há relatos de usuários que buscaram auxílio para produzir versões iniciais de cartas e ofícios, procurar receitas culinárias, escrever programas em linguagens de programação específicas e escrever redações e trabalhos escolares.
Ainda assim, não é difícil identificar problemas no fluxo do diálogo. Basta insistir um pouco nas questões para perceber que o robô comete erros e apresenta inconsistências. Também não é incomum encontrar usuários que apontam que códigos de programação produzidos por ele raramente estão prontos para uso, necessitando de trabalho adicional. Outros apontam que, mesmo em respostas corretas, o padrão de escrita é cansativo e repetitivo, faltando a criatividade e originalidade da escrita humana.
Essas limitações atuais podem não ser tão relevantes, pois é bem possível que venham a ser eliminadas em novas versões do ChatGPT, ou de novos robôs semelhantes. A limitação crucial está relacionada à falta de compreensão (ou interpretação) real do texto. Não há evidências, até o momento, de que robôs possam interpretar texto como humanos o fazem, e nem é possível fazer previsões seguras de que isso um dia irá ocorrer. Por outro lado, do ponto de vista da realização de tarefas intelectuais, é provável que teremos, cada vez mais, robôs capazes de executar vários tipos de tarefas como se estivessem interpretando texto. De fato, as habilidades do ChatGPT indicam que estamos dando largos passos rumo a um novo paradigma para geração de conhecimento, já preconizado há algum tempo, segundo o qual as próprias máquinas vão gerar conhecimento de maneira autônoma, sem intervenção humana.
As consequências desse novo paradigma de geração de conhecimento podem fazer da revolução da IA a mais drástica da história. Certamente ela poderá trazer grande ganho de produtividade em muitos setores da economia, com as vantagens decorrentes. Entretanto, infelizmente, muitas dessas consequências serão maléficas para diversos setores da sociedade. Além da possibilidade de mau uso das tecnologias, e de questões éticas, é certo o potencial de agravar a desigualdade econômico-social, tanto entre nações como entre indivíduos da mesma nação, o que é comum para economias baseadas em alta tecnologia. Em particular, é possível prever um aumento nas taxas de desemprego, principalmente nas camadas menos privilegiadas da sociedade, com menos acesso à educação de qualidade. A sociedade precisa se preparar para lidar com essas consequências, uma vez que a revolução da IA é inevitável.
Artigo de opinião escrito pelos pesquisadores da USP:
Maria das Graças V. Nunes, professora do Instituto de Ciências Matemáticas e de Computação (ICMC)
Osvaldo N. Oliveira Jr., professor do Instituto de Física de São Carlos (IFSC)
Thiago A. S. Pardo, professor do ICMC