Claude: Tudo o que você precisa saber sobre a IA da Anthropic

A Anthropic, uma das maiores fornecedoras de IA do mundo, tem uma família poderosa de modelos de IA generativos chamada Claude. Esses modelos podem executar uma série de tarefas, desde legendar imagens e escrever e-mails até resolver desafios de matemática e codificação.
Com o ecossistema de modelos da Anthropic crescendo tão rapidamente, pode ser difícil acompanhar quais modelos Claude fazem o quê. Para ajudar, criamos um guia para Claude, que manteremos atualizado conforme novos modelos e atualizações chegarem.
Os modelos Claude são nomeados em homenagem a obras de arte literárias: Haiku, Sonnet e Opus. Os mais recentes são:
- Claude 3.5 Haiku , um modelo leve.
- Claude 3.7 Sonnet , um modelo de raciocínio híbrido de médio alcance. Este é atualmente o modelo de IA carro-chefe da Anthropic.
- Claude 3 Opus , um modelo grande.
Contraintuitivamente, o Claude 3 Opus — o maior e mais caro modelo oferecido pela Anthropic — é o modelo Claude menos capaz no momento. No entanto, isso certamente mudará quando a Anthropic lançar uma versão atualizada do Opus.
Mais recentemente, a Anthropic lançou o Claude 3.7 Sonnet , seu modelo mais avançado até o momento. Este modelo de IA é diferente do Claude 3.5 Haiku e do Claude 3 Opus porque é um modelo de raciocínio de IA híbrido, que pode dar respostas em tempo real e respostas mais ponderadas e "pensadas" para perguntas.
Ao usar o Claude 3.7 Sonnet, os usuários podem escolher se desejam ativar as habilidades de raciocínio do modelo de IA, que levam o modelo a "pensar" por um curto ou longo período de tempo.
Quando o raciocínio é ativado, o Claude 3.7 Sonnet passará de alguns segundos a alguns minutos em uma fase de “pensamento” antes de responder. Durante essa fase, o modelo de IA está quebrando o prompt do usuário em partes menores e verificando suas respostas.
Claude 3.7 Sonnet é o primeiro modelo de IA da Anthropic que pode "raciocinar", uma técnica à qual muitos laboratórios de IA recorreram à medida que os métodos tradicionais de melhoria do desempenho da IA diminuíram .
Mesmo com seu raciocínio desativado, o Claude 3.7 Sonnet continua sendo um dos modelos de IA de melhor desempenho do setor de tecnologia.
Em novembro, a Anthropic lançou uma versão melhorada – e mais cara – de seu modelo leve de IA, Claude 3.5 Haiku . Este modelo supera o Claude 3 Opus da Anthropic em vários benchmarks, mas não consegue analisar imagens como o Claude 3 Opus ou o Claude 3.7 Sonnet conseguem.
Todos os modelos Claude — que têm uma janela de contexto padrão de 200.000 tokens — também podem seguir instruções de várias etapas, usar ferramentas (por exemplo, rastreadores de cotações de ações) e produzir saída estruturada em formatos como JSON .
Uma janela de contexto é a quantidade de dados que um modelo como Claude pode analisar antes de gerar novos dados, enquanto tokens são bits subdivididos de dados brutos (como as sílabas “fan,” “tas,” e “tic” na palavra “fantastic”). Duzentos mil tokens equivalem a cerca de 150.000 palavras, ou um romance de 600 páginas.
Ao contrário de muitos dos principais modelos de IA generativa, os da Anthropic não conseguem acessar a internet, o que significa que não são particularmente bons em responder perguntas sobre eventos atuais. Eles também não conseguem gerar imagens — apenas diagramas de linhas simples.
Quanto às principais diferenças entre os modelos Claude, o Claude 3.7 Sonnet é mais rápido que o Claude 3 Opus e entende melhor instruções complexas e cheias de nuances. O Haiku tem dificuldades com prompts sofisticados, mas é o mais rápido dos três modelos.
Os modelos Claude estão disponíveis por meio da API da Anthropic e de plataformas gerenciadas como Amazon Bedrock e Vertex AI do Google Cloud.
Aqui está o preço da API Anthropic:
- Claude 3.5 Haiku custa 80 centavos por milhão de tokens de entrada (~750.000 palavras), ou US$ 4 por milhão de tokens de saída
- Claude 3.7 Sonnet custa US$ 3 por milhão de tokens de entrada ou US$ 15 por milhão de tokens de saída
- Claude 3 Opus custa US$ 15 por milhão de tokens de entrada ou US$ 75 por milhão de tokens de saída
O Anthropic oferece armazenamento em cache e em lote rápidos para gerar economia adicional no tempo de execução.
O cache de prompt permite que os desenvolvedores armazenem “contextos de prompt” específicos que podem ser reutilizados em chamadas de API para um modelo, enquanto o processamento em lote processa grupos assíncronos de solicitações de inferência de modelo de baixa prioridade (e, consequentemente, mais baratas).
Para usuários individuais e empresas que desejam simplesmente interagir com os modelos Claude por meio de aplicativos para web, Android e iOS, a Anthropic oferece um plano Claude gratuito com limites de taxa e outras restrições de uso.
Atualizar para uma das assinaturas da empresa remove esses limites e desbloqueia novas funcionalidades. Os planos atuais são:
O Claude Pro, que custa US$ 20 por mês, vem com limites de taxa 5x maiores, acesso prioritário e prévias de recursos futuros.
Sendo focado em negócios, o Team — que custa US$ 30 por usuário por mês — adiciona um painel para controlar o faturamento e o gerenciamento de usuários e integrações com repositórios de dados, como bases de código e plataformas de gerenciamento de relacionamento com o cliente (por exemplo, Salesforce). Um botão de alternância habilita ou desabilita citações para verificar reivindicações geradas por IA. (Como todos os modelos, Claude tem alucinações de vez em quando.)
Os assinantes Pro e Team recebem Projetos, um recurso que fundamenta as saídas de Claude em bases de conhecimento, que podem ser guias de estilo, transcrições de entrevistas e assim por diante. Esses clientes, junto com usuários do nível gratuito, também podem acessar o Artifacts, um espaço de trabalho onde os usuários podem editar e adicionar conteúdo como código, aplicativos, designs de sites e outros documentos gerados por Claude.
Para clientes que precisam de ainda mais, há o Claude Enterprise, que permite que empresas carreguem dados proprietários no Claude para que ele possa analisar as informações e responder perguntas sobre elas. O Claude Enterprise também vem com uma janela de contexto maior (500.000 tokens), integração com o GitHub para equipes de engenharia sincronizarem seus repositórios do GitHub com o Claude, e Projetos e Artefatos.
Como acontece com todos os modelos de IA generativa, há riscos associados ao uso do Claude.
Os modelos ocasionalmente cometem erros ao resumir ou responder perguntas por causa de sua tendência a alucinar . Eles também são treinados em dados públicos da web, alguns dos quais podem ser protegidos por direitos autorais ou sob uma licença restritiva. A Anthropic e muitos outros fornecedores de IA argumentam que a doutrina do uso justo os protege de reivindicações de direitos autorais. Mas isso não impediu que os proprietários de dados entrassem com ações judiciais .
A Anthropic oferece políticas para proteger certos clientes de batalhas judiciais decorrentes de desafios de uso justo. No entanto, elas não resolvem o dilema ético de usar modelos treinados em dados sem permissão.
Este artigo foi publicado originalmente em 19 de outubro de 2024. Foi atualizado em 25 de fevereiro de 2025 para incluir novos detalhes sobre Claude 3.7 Sonnet e Claude 3.5 Haiku.
techcrunch