Sinopsis

A inteligência artificial está avançando para além da compreensão textual: hoje, modelos capazes de interpretar imagens, sons e texto simultaneamente estão transformando a maneira como interagimos com máquinas. Neste livro, exploramos o poder dos Modelos de Linguagem Multimodal (MLLMs) com foco em aplicações práticas utilizando a linguagem Python e ferramentas modernas como o Hugging Face Transformers.

Por meio de exemplos claros e funcionais, como o uso do modelo BLIP (Bootstrapped Language-Image Pretraining) para geração automática de legendas a partir de imagens, o leitor aprenderá a desenvolver sistemas inteligentes que integram múltiplas formas de dados. O livro é ideal para estudantes, professores e profissionais que desejam compreender e aplicar conceitos de IA multimodal em seus projetos.

Com uma abordagem direta, prática e acessível, esta obra convida-o a mergulhar no futuro da computação — onde visão e linguagem caminham juntas para criar experiências verdadeiramente interativas e inteligentes.

Características

Número de páginas	108
Edición	1 (2025)
Formato	A5 (148x210)
Acabado	Tapa blanda (con solapas)
Tipo de papel	Estucado Mate 90g
Idioma	Portugués

¿Tienes alguna queja sobre ese libro? Envía un correo electrónico a [email protected]

Vitor Amadeu Souza

Doutorando em Engenharia de Defesa, Mestre em Física (CBPF), especialista em Eng.Robótica, Eng.Elétrica, Eng. Eletrônica e Eletromecânica, Eng.Telecomunicações, Eng.Controle e Automação, Eng.Biomédica, Eng.Instrumentação, Eng. Automotiva, Eng.Industrial 4.0, Eng.Dados, Eng.Computação, Eng.Software, Eng.Redes e Segurança de Dados, Eng.DevOps, Eng.Mecatrônica, Eng. Sistemas Embarcados, Eng.Manufatura Mecânica, Eng.Confiabilidade, Eng.Manutenção, Eng.Qualidade, Eng.Materiais, Eng.Produção, Eng. Produto, Eng.Embalagem, Eng. Transportes, Eng.Rodoviária, Eng.Suprimentos, Eng.Conhecimento, Eng.Negócios, Eng.Projetos, Eng.Energias Renováveis, Eng.Processos, Eng. Metalúrgica, Eng.Química, Eng.Ambiental, Arquitetura de Software, Cloud Computing, Machine Learning e IA, Internet das Coisas, Ciência de Dados, Full Stack, Estatística Aplicada, Bioestatística e Gerenciamento de Projetos.

MBA em Eng. Econômica, Análise de Dados e Web 3.0. Bacharel em Engenharia de Computação, Licenciado em Matemática, Física, Química e Filosofia, Analista de Sistemas e Técnico em Eletrônica, Eletrotécnica, Telecomunicações, Informática, Logística, Comércio, Administração e Meio Ambiente atuando na área de projetos elétricos, eletrônicos, automação, sistemas embarcados, firmware e software há vários anos.

Desenvolvo projetos de hardware e software voltados para a área industrial, automotiva, médica, científica, comercial, automação dentre outras sob demanda. Professor universitário e administrador da Cerne Tecnologia, empresa voltada para desenvolvimento de projetos embarcados, comercialização de kits didáticos e educação tecnológica na área de MCU, FPGA, linguagens de programação, desenvolvimento de projetos e layout de circuito impresso.

Ao longo dos anos escrevi vasto acervo literário técnico e científico, além de ser associado ao SBC e SBIC. Alguns temas abordados: DFT, FFT, PDS, CAN, MODBUS, LIN, TCP/IP, Filtros digitais, Sistemas digitais, Sistemas de Potência, Big Data, Grafos, PID, Fuzzy, FPGA, VHDL, Verilog, CLP, DSC, DSP, ARM, inversor de frequência, soft-starter, energia solar, IoT, LoRa, Java, php, JS, REST, Spring Boot, Spark, CSS, SQL, VB, VC#, Perceptron, Robô NAO, UML, React, dentre outros.

O catálogo completo está publicado no Clube de Autores (http://bit.ly/4gwnt78).

Linkedin: www.linkedin.com/in/engvitoramadeu

Cerne Tec: www.cerne-tec.com.br

Perfil completo Habla con el autor

Introdução ao MLLM Programado em Python

Por Vitor Amadeu Souza

Categorías

Computación, Tecnología e ingeniería

Sinopsis

Características

Vitor Amadeu Souza