Postagens

Mostrando postagens com o rótulo Aprendizado de Máquina

MATER: Reconhecimento de Emoção na Fala com Representação Multimodal e Interpretável

Um artigo recente disponível no arquivo arXiv (arXiv:2506.19887) introduz o framework Multi-level Acoustic-Textual Emotion Representation (MATER), proposto como contribuição para o desafio Speech Emotion Recognition in Naturalistic Conditions (SERNC). O trabalho aborda o reconhecimento categórico de emoções e a predição de atributos emocionais na fala em condições do mundo real, que apresentam complexidades como variabilidade entre e dentro dos indivíduos. Para lidar com essas complexidades, o MATER emprega uma abordagem hierárquica inovadora que integra características acústicas e textuais em múltiplos níveis de representação: no nível da palavra, no nível da elocução e no nível de embedding. Essa fusão busca combinar pistas lexicais e acústicas de baixo nível com representações contextualizadas de alto nível. O objetivo é capturar efetivamente tanto as variações prosódicas finas quanto as nuances semânticas presentes na fala natural. Além da integração de características em múl...

Transações Seguras de Energia: Blockchain e IA Contra Fraude em Mercados Descentralizados

A evolução dos mercados de energia nos Estados Unidos, impulsionada pela negociação ponto a ponto (P2P) e a transição para redes descentralizadas, trouxe consigo novos e significativos desafios, particularmente no que diz respeito à segurança e autenticidade das transações energéticas. Diante desse cenário, uma pesquisa recente teve como objetivo desenvolver um sistema de transação de energia que fosse seguro, inteligente e eficiente para o mercado descentralizado dos EUA. O estudo propõe uma abordagem inovadora que interliga a tecnologia blockchain e a inteligência artificial (IA) para enfrentar desafios persistentes no mercado de energia distribuída. Especificamente, a pesquisa foca na segurança, na detecção de comportamento fraudulento e na confiabilidade do mercado. A base para esta pesquisa é um conjunto de dados composto por mais de 1,2 milhão de registros anonimizados de transações de energia. Esses registros foram gerados a partir de uma rede simulada de intercâmbio de en...

Detectando Anomalias em Imagens Cerebrais com Modelos de Difusão Condicional

Pesquisadores propõem um novo arcabouço baseado em modelos de difusão condicional para a detecção guiada de anomalias em imagens de ressonância magnética (MRI) cerebrais. A abordagem visa superar a limitação de métodos de aprendizado supervisionado, que demandam grandes volumes de dados de indivíduos com doenças, algo nem sempre disponível, especialmente para condições raras. Métodos de detecção de anomalias não supervisionados baseados em reconstrução, particularmente aqueles que utilizam modelos de difusão, tornaram-se populares por permitirem o treinamento apenas com imagens saudáveis. No entanto, esses métodos partem do princípio de que um modelo treinado com dados normais não consegue representar ou reconstruir anomalias de forma precisa, uma suposição que frequentemente falha na prática, resultando em modelos que não reconstroem tecidos saudáveis corretamente ou não removem anomalias de forma eficaz. O trabalho apresenta um modelo de difusão condicional que integra imagens ...

Avaliando o Raciocínio Financeiro em IA: Um Novo Benchmark Multimodal e Abordagem de Aprendizagem por Erro

Um artigo recente disponível no arquivo de pré-publicações arXiv apresenta um novo benchmark e uma abordagem inovadora para compreender e aprimorar as capacidades de raciocínio financeiro em modelos de Inteligência Artificial (IA), com foco particular em modelos de linguagem grande (LLMs) e modelos multimodais grandes (MLLMs). O trabalho, intitulado "Understanding Financial Reasoning in AI: A Multimodal Benchmark and Error Learning Approach", foi escrito por Shuangyan Deng, Haizhou Peng, Jiachen Xu, Chunhou Liu, Ciprian Doru Giurcuaneanu e Jiamou Liu. A pesquisa introduz o benchmark FinMR (Financial Multimodal Reasoning), projetado para avaliar quão bem os modelos de IA raciocinam em contextos financeiros específicos. Reconhecendo que o raciocínio financeiro eficaz exige a compreensão de informações textuais e a interpretação de dados visuais complexos, como gráficos, tabelas e tendências, o FinMR integra ambas as modalidades para refletir desafios analíticos autênticos do...