GPT-4: Análise técnica da LLM mais avançada da OpenAI

Na última terça-feira, a OpenAI fez um grande anúncio que deixou o mundo da inteligência artificial agitado: o lançamento do GPT-4, a LLM (large language model) mais avançada da empresa até o momento.

O lançamento foi acompanhado por uma avalanche de publicações destacando os casos de uso mais chamativos ou vendendo pacotes atualizados de prompts para potencializar a vida dos usuários. Mas, para além do buzz, o que realmente mudou? O que existe debaixo do capô que fará as empresas e usuários resolverem problemas novos ou de forma mais fácil?

Neste post, nosso objetivo é aprofundar a discussão sobre o lançamento do GPT-4, trazendo mais detalhes e informações a partir de fontes confiáveis, como o relatório técnico (https://cdn.openai.com/papers/gpt-4.pdf), o blog de pesquisa (https://openai.com/research/gpt-4) e o blog de produto (https://openai.com/product/gpt-4). Queremos fornecer uma visão mais clara do que realmente mudou com a chegada do GPT-4 e como isso pode impactar o mundo da inteligência artificial e seus usuários.

Destaque está no multimodal

O que mais chama a atenção nesse lançamento é que o GPT-4 é um modelo multimodal, ou seja, ele é capaz de processar informações em diferentes formatos, como texto e imagem. Isso significa que ele pode entender e interagir com o mundo de forma mais parecida com a nossa. Por exemplo, agora é possível pedir que ele explique o contexto de uma pintura ou sugira uma receita com base em uma foto da sua geladeira conforme ilustrado abaixo.

Exemplo de conversa no ChatGPT utilizando uma imagem.

Ao permitir que o modelo processe informações em diferentes formatos, como texto e imagem, ele se aproxima mais do nosso modo de perceber e interagir com o mundo, permitindo entender melhor as nuances e ambiguidades presentes em diferentes contextos e a realização de tarefas mais complexas.

Isso abre um novo mundo de possibilidades para a interação humano-máquina e promete trazer benefícios significativos para as empresas e usuários que desejam resolver problemas de forma mais fácil e eficiente.

Embora a entrada de imagens ainda não esteja disponível na versão pública do ChatGPT ou pelas APIs do GPT-4, a OpenAI já está trabalhando em parceria com a Be My Eyes em um “Assistente visual” que poderá tornar essa função disponível em breve.

Mas como ele se comporta em relação a produção de texto?

Mesmo sem o input de imagens, o desempenho do GPT-4 em tarefas de produção de texto é superior ao de seu antecessor, o GPT-3.5. Isso se deve ao fato de que o GPT-4 tem 100 vezes mais parâmetros do que o GPT-3.5, o que trouxe ganhos significativos de qualidade.

Além disso, a API do GPT-4 agora pode aceitar até 32k tokens, em comparação aos 4k tokens da versão anterior. Dessa forma, algumas aplicações que eram inviáveis com o GPT-3.5 agora são triviais com o GPT-4. É importante notar, no entanto, que o GPT-4 ainda produz falsos fatos e pode alucinar em algumas situações, o que é uma limitação para aplicações que exigem respostas totalmente corretas. Nesse sentido, o fine-tuning para cenários e problemas específicos pode ser uma estratégia importante para reduzir as respostas erradas e melhorar a precisão do modelo.

Embora seja difícil perceber diferenças significativas na produção de texto em tarefas corriqueiras e abertas, como escrever um post de blog, o GPT-4 mostra seu verdadeiro potencial em cenários complexos. Segundo a própria OpenAI, “a diferença fica clara quando a complexidade da tarefa atinge um limiar suficiente – o GPT-4 é mais confiável, criativo e capaz de lidar com instruções muito mais nuances do que o GPT-3.5”. Em outras palavras, o GPT-4 se destaca em tarefas que exigem um conhecimento mais profundo e específico, como exames e provas que demandam uma grande bagagem de conteúdos.

O desempenho do GPT-4 foi avaliado através de testes realizados em exames conhecidos por exigirem dos humanos uma grande bagagem em conteúdos específicos, como o SAT (o vestibular americano) e o equivalente americano do exame da OAB. Os resultados mostraram que o GPT-4 teve um desempenho superior ao seu antecessor, o GPT-3.5, provando que o volume de parâmetros 100x maior trouxe ganhos significativos de qualidade. Além disso, a API do GPT-4 agora pode aceitar até 32k tokens, em comparação aos 4k tokens da versão anterior, o que torna possível a realização de aplicações antes inviáveis com o GPT-3.5, como processar um livro inteiro em uma ou algumas passagens.

É importante lembrar que, embora o GPT-4 seja mais avançado do que seus antecessores, ele ainda não é perfeito e há espaço para melhorias em sua confiabilidade e capacidade de produzir respostas corretas. Para contornar esse problema, o fine-tuning pode ser uma opção importante para cenários e problemas específicos.

Disponibilidade para uso

Os usuários do ChatGPT Plus agora têm acesso ao GPT-4 na plataforma chat.openai.com, com um limite de uso definido. A OpenAI ajustará o limite exato de uso dependendo da demanda e do desempenho do sistema na prática, mas espera-se que haja restrições de capacidade severas (embora a empresa deva aumentar e otimizar a capacidade ao longo dos próximos meses). É importante notar que, no momento em que este post foi escrito, o limite de uso do GPT-4 oficialmente era 100 mensagens a cada 4 horas, mas ao acessar o ChatGPT ele alertava que o limite era 50, conforme a imagem a seguir.

ChatGPT com acesso ao modelo GPT-4

Para experimentar o GPT-4 na plataforma, é necessário ser um usuário Plus e pagar uma assinatura mensal de US$20. Selecionando a opção GPT-4 na aba de modelos, os usuários podem começar a usá-lo. A OpenAI também planeja disponibilizar uma quantidade limitada de consultas gratuitas do GPT-4 em breve para que usuários que não possuem uma assinatura possam experimentá-lo.

AUTOR
Gustavo Reis
COO, Hop AI

CHATGPT NO SEU NEGÓCIO? NÓS TE AJUDAMOS.

Soluções com a API do ChatGPt ou outros modelos da OpenAI é com a Hop AI. Tem uma idéia e quer uma solução com o ChatGPT? Acesse essa página e entre em contato.

Fale com a Hop AI

Deixe seu contato e conte com nossa expertise para tornar IA uma realidade no seu negócio.

    Postagens recentes