🚀 Você quer entender de verdade como o ChatGPT, Gemini e Claude funcionam por dentro?
Acabei de lançar o Volume II de "Construindo Modelos de IA como Gemini e Claude" e esse livro é diferente de tudo que você vai achar por aí em português.
São 320 páginas densas, com matemática real, código em PyTorch e JAX, e explicações que vão do token ao modelo completo rodando. Nada de superficialidade. Aqui você aprende como fazer, não só o que é.
📚 O que você vai dominar:
No Volume II partimos do ponto em que a maioria dos cursos abandona você. Construímos um LLM do zero, o MiniLM-PT, com arquitetura idêntica à dos modelos de produção, e avançamos por:
Construção completa de um LLM: tokenização com BPE e SentencePiece, atenção multi-cabeça com RoPE, RMSNorm, SwiGLU, FlashAttention e o pipeline completo de treinamento com AdamW e scheduler cosseno.
Arquiteturas avançadas: Mixture of Experts (o segredo por trás do Gemini e do GPT-4), Sliding Window Attention para contextos longos, State Space Models com Mamba, Ring Attention distribuída e multimodalidade com ViT, CLIP e SigLIP.
Alinhamento: RLHF, PPO, DPO, KTO e o Constitutional AI da Anthropic. O método que transforma um modelo bruto em assistente seguro e útil.
Fine-tuning eficiente: LoRA, QLoRA e DoRA. Como adaptar um modelo gigante com uma GPU comum.
Treinamento distribuído: Data Parallelism, Tensor Parallelism, Pipeline Parallelism e o framework Megatron-LM com ZeRO
| Número de páginas | 320 |
| Edición | 2 (2026) |
| Idioma | Portugués |
¿Tienes alguna queja sobre ese libro? Envía un correo electrónico a [email protected]
Haz el inicio de sesión deja tu comentario sobre el libro.