
Este livro introduz o conceito de aprendizado por reforço, com foco no algoritmo SARSA (State-Action-Reward-State-Action). O objetivo é ensinar como aplicar este algoritmo em problemas de tomada de decisão sequencial, com um exemplo prático utilizando Python.
A obra explora a implementação do SARSA em um ambiente de grade (gridworld), demonstrando o processo de treinamento de um agente para maximizar suas recompensas. O livro abrange conceitos fundamentais do aprendizado por reforço, como exploração vs. exploração, funções de valor e políticas de decisão. Além disso, oferece uma compreensão prática das técnicas de aprendizado em ambientes dinâmicos.
Ideal para estudantes, pesquisadores e profissionais, este livro fornece uma introdução acessível ao aprendizado por reforço, equipando o leitor com as ferramentas necessárias para implementar e avaliar o algoritmo SARSA de forma eficiente.
Número de páginas | 113 |
Edición | 1 (2025) |
Formato | A5 (148x210) |
Acabado | Tapa blanda (con solapas) |
Tipo de papel | Estucado Mate 90g |
Idioma | Portugués |
¿Tienes alguna queja sobre ese libro? Envía un correo electrónico a [email protected]
Haz el inicio de sesión deja tu comentario sobre el libro.