Postagens

Mostrando postagens com o rótulo Teoria dos Jogos

Otimização de Preferências em Veículos Autônomos: A Abordagem Lexicográfica IBR

A crescente complexidade dos sistemas de veículos autônomos exige que eles sejam capazes de equilibrar múltiplos objetivos hierárquicos, como minimizar o tempo de viagem, garantir a segurança e coordenar-se eficientemente com o tráfego. Esse cenário pode ser modelado de forma eficaz por meio de "jogos de preferência ordenada". No entanto, a resolução desses jogos torna-se computacionalmente inviável à medida que o horizonte de tempo, o número de jogadores ou os níveis de preferência aumentam. As abordagens de horizonte móvel (receding horizon frameworks) têm sido utilizadas para mitigar a intratabilidade em horizontes longos, resolvendo sequencialmente jogos de menor duração, frequentemente com inicialização a quente. Contudo, essas abordagens não abordam a complexidade inerente aos métodos existentes para solucionar jogos de preferência ordenada. A necessidade de uma estratégia mais eficiente para lidar com essa complexidade é fundamental para o avanço dos sistemas autôno...

Verificação Eficiente de Estratégias Suaves em Bandits e Teoria dos Jogos

O artigo "Protocols for Verifying Smooth Strategies in Bandits and Games" introduz uma nova abordagem para a verificação da otimalidade aproximada de estratégias no contexto de problemas de bandits multi-armados e jogos de forma normal. Os autores, Miranda Christ, Daniel Reichman e Jonathan Shafer, abordam o desafio de validar a eficiência de estratégias quando o número de ações disponíveis para cada jogador é significativamente grande. A pesquisa foca no desenvolvimento de protocolos que exigem um número sublinear de consultas a um oráculo de utilidade. Essa característica é crucial para cenários onde a obtenção de informações sobre cada ação é custosa. O trabalho demonstra que tal verificação é viável para estratégias "suaves" – aquelas que não concentram uma massa de probabilidade excessiva em qualquer ação específica. No domínio dos bandits multi-armados, o artigo apresenta protocolos para verificar se uma política suave é ε-ótima. Uma descoberta notável é...