Postagens

Mostrando postagens com o rótulo Multimídia

Melhorando a Compreensão de Cidades 3D com Integração Multimídia

Representações digitais tridimensionais de áreas urbanas tornaram-se ferramentas valiosas para a compreensão de territórios, dada a sua crescente disponibilidade. No entanto, apesar de permitirem a navegação virtual, esses modelos 3D frequentemente carecem de informações contextuais ricas, como o histórico ou a funcionalidade dos edifícios. Paralelamente, documentos multimídia, incluindo imagens, vídeos e textos, são fontes ricas em tais informações contextuais. A combinação estratégica desses dois tipos de dados — modelos 3D e documentos multimídia — surge como uma abordagem promissora para aprimorar a análise e a compreensão da organização das cidades. O artigo "Integrating multimedia documents in 3D city models for a better understanding of territories" propõe quatro abordagens distintas para integrar documentos multimídia em cenas urbanas 3D. O objetivo é permitir a contextualização da cena com qualquer tipo de mídia, superando a limitação dos modelos tridimensionais b...

Animação Facial 3D Expressiva Controlável com Difusão Multimodal

Um artigo recente disponível no arquivo arXiv, sob o identificador 2506.10007, apresenta um novo framework baseado em difusão para a criação de animações faciais 3D expressivas controláveis. Intitulado "Controllable Expressive 3D Facial Animation via Diffusion in a Unified Multimodal Space", o trabalho aborda desafios significativos na área de animação facial emocional controlada por áudio. Os autores destacam duas dificuldades principais nos métodos existentes: a dependência de sinais de controle unimodais (como vídeos, texto ou rótulos de emoção), que não exploram a força complementar de múltiplas modalidades para manipulação abrangente de emoções, e o mapeamento determinístico baseado em regressão, que limita a natureza estocástica das expressões emocionais e comportamentos não verbais, restringindo a expressividade das animações sintetizadas. Para superar esses obstáculos, a pesquisa propõe uma abordagem inovadora com duas contribuições chave. A primeira é uma estra...

Arquitetura SC-CEE-Meta: Comunicação Semântica Otimiza Serviços de Metaverso

Com o avanço da tecnologia e a crescente busca por novas experiências audiovisuais, o metaverso tem ganhado um entusiasmo considerável. No entanto, sua implementação prática enfrenta desafios significativos, principalmente na transmissão de grandes volumes de dados, como cenas virtuais de alta resolução, entre plataformas em nuvem e dispositivos de Realidade Virtual (VR). A transmissão sem fio por dispositivos VR, limitada pela largura de banda insuficiente, resulta em problemas de velocidade e atraso (latência). Além disso, a má qualidade do canal de comunicação pode levar a erros de dados, deteriorando a experiência do usuário. Para mitigar esses problemas, pesquisadores propuseram a Arquitetura de Serviço de Metaverso Imersivo Colaborativo Nuvem-Borda-Terminal Habilitado por Comunicação Semântica (SC-CEE-Meta). Esta arquitetura inovadora integra três módulos principais: transmissão semântica de vídeo VR, síntese de vídeo e reconstrução de cena virtual 3D. A chave da abordagem ...