Postagens

Mostrando postagens com o rótulo Aprendizado de Máquina

DESA: Desvendando Propriedades Estelares com IA Multimodal

A astrofísica estelar, campo dedicado ao estudo das estrelas, depende fundamentalmente de diversas modalidades de observação, principalmente curvas de luz fotométricas e dados espectroscópicos, para inferir propriedades estelares cruciais. Embora o aprendizado de máquina (ML) tenha promovido avanços significativos na análise de modalidades individuais, a informação complementar codificada entre essas diferentes fontes de dados permaneceu amplamente inexplorada até então. Nesse contexto, um novo modelo de fundação multimodal, denominado DESA (Dual Embedding model for Stellar Astrophysics), surge para revolucionar a forma como as propriedades estelares são inferidas. Desenvolvido por Ilay Kamai, Alex M. Bronstein e Hagai B. Perets, o DESA integra curvas de luz e espectros para aprender um espaço latente unificado e fisicamente significativo para as estrelas. O modelo DESA opera treinando encoders separados e específicos para cada modalidade, utilizando um esquema híbrido supervisio...

Ataques de Envenenamento em Modelos de Difusão: Análise e Defesa com Safe-Zone Training

Ataques de envenenamento de dados representam um desafio significativo para a robustez de modelos de difusão (DMs), especialmente em técnicas de personalização amplamente utilizadas como a Textual Inversion (TI). Uma pesquisa recente, intitulada "When and Where do Data Poisons Attack Textual Inversion?", realizada por Jeremy Styborski, Mingzhi Lyu, Jiayou Lu, Nupur Kapur e Adams Kong, aborda sistematicamente quando e onde esses ataques de envenenamento impactam a Textual Inversion, propondo uma nova defesa. O trabalho foi aceito para apresentação na ICCV. Os autores introduzem os "Semantic Sensitivity Maps", um método inovador para visualizar a influência do envenenamento em embeddings de texto. Através desta técnica, eles conseguem identificar e verificar experimentalmente que os modelos de difusão exibem um comportamento de aprendizado não uniforme ao longo dos passos de tempo, com foco em amostras de ruído mais baixo. Os ataques de envenenamento herdam esse vi...

Modelagem de Transferência Radiativa para Supernovas de Envelope Despojado: Uma Grade para Inferência de Parâmetros

Um novo estudo intitulado "Radiative Transfer Modeling of Stripped-Envelope Supernovae. I: A Grid for Ejecta Parameter Inference" (Modelagem de Transferência Radiativa de Supernovas de Envelope Despojado. I: Uma Grade para Inferência de Parâmetros de Ejeção) apresenta um avanço significativo na compreensão das supernovas de envelope despojado, especificamente os tipos Ib/c. O trabalho, publicado na *Astrophysical Journal Supplement Series*, volume 279, 2025, foca na criação de uma vasta grade de modelos de curvas de luz para estas explosões estelares, que são cruciais para inferir suas propriedades físicas. Os pesquisadores S. Karthik Yadavalli, V. Ashley Villar, Abigail Polin, S. E. Woosley, Maria R. Drout e Miranda Pikus desenvolveram um conjunto de 1.800 modelos de curvas de luz de supernovas tipo Ib/c em múltiplos comprimentos de onda. Estes modelos foram gerados usando o código de transporte de radiação Sedona, variando sistematicamente a distribuição de massa, o perf...

Hypertokens e HDRAM: Nova Memória Associativa para LLMs

Um artigo recente propõe uma nova abordagem para lidar com a aparente perda de precisão em Large Language Models (LLMs), reformulando o problema como uma questão de distribuição de informação no espaço latente. Intitulado "Hypertokens: Holographic Associative Memory in Tokenized LLMs", o estudo introduz a HDRAM (Holographically Defined Random Access Memory) como uma estrutura de memória simbólica inovadora. A pesquisa aborda especificamente o desafio da memória K:V e V:K em LLMs, tratando o espaço latente dos transformadores como um canal de espectro expandido. A HDRAM é construída sobre o conceito de hypertokens, que são códigos simbólicos estruturados que integram códigos corretores de erros (ECC) clássicos, computação holográfica e busca inspirada em computação quântica. Segundo o autor, esta estrutura permite que a HDRAM recupere informações distribuídas através de um processo de "desexpansão" (despreading) baseado em princípios bem definidos. Os hypertoke...

Aprendizado de Máquina para Gestão Proativa de Água Subterrânea

Um artigo recente publicado no arXiv explora a aplicação de aprendizado de máquina para a gestão proativa de recursos hídricos subterrâneos, focando em sistemas de alerta precoce e alocação de recursos. Intitulado "Machine Learning for Proactive Groundwater Management: Early Warning and Resource Allocation", o estudo aborda os desafios do monitoramento tradicional da água subterrânea, que frequentemente enfrenta limitações devido à escassez de dados, restrições computacionais e saídas atrasadas. Para superar essas barreiras, os pesquisadores desenvolveram um pipeline de aprendizado de máquina projetado para prever categorias de níveis de água subterrânea. Este pipeline utiliza uma combinação de dados climáticos, registros hidrometeorológicos e atributos fisiográficos. O processamento desses dados é realizado através da estrutura de ensemble automatizado AutoGluon, que integra pré-processamento geoespacial, engenharia de atributos orientada pelo domínio e seleção automatiza...

MATER: Reconhecimento de Emoção na Fala com Representação Multimodal e Interpretável

Um artigo recente disponível no arquivo arXiv (arXiv:2506.19887) introduz o framework Multi-level Acoustic-Textual Emotion Representation (MATER), proposto como contribuição para o desafio Speech Emotion Recognition in Naturalistic Conditions (SERNC). O trabalho aborda o reconhecimento categórico de emoções e a predição de atributos emocionais na fala em condições do mundo real, que apresentam complexidades como variabilidade entre e dentro dos indivíduos. Para lidar com essas complexidades, o MATER emprega uma abordagem hierárquica inovadora que integra características acústicas e textuais em múltiplos níveis de representação: no nível da palavra, no nível da elocução e no nível de embedding. Essa fusão busca combinar pistas lexicais e acústicas de baixo nível com representações contextualizadas de alto nível. O objetivo é capturar efetivamente tanto as variações prosódicas finas quanto as nuances semânticas presentes na fala natural. Além da integração de características em múl...

Transações Seguras de Energia: Blockchain e IA Contra Fraude em Mercados Descentralizados

A evolução dos mercados de energia nos Estados Unidos, impulsionada pela negociação ponto a ponto (P2P) e a transição para redes descentralizadas, trouxe consigo novos e significativos desafios, particularmente no que diz respeito à segurança e autenticidade das transações energéticas. Diante desse cenário, uma pesquisa recente teve como objetivo desenvolver um sistema de transação de energia que fosse seguro, inteligente e eficiente para o mercado descentralizado dos EUA. O estudo propõe uma abordagem inovadora que interliga a tecnologia blockchain e a inteligência artificial (IA) para enfrentar desafios persistentes no mercado de energia distribuída. Especificamente, a pesquisa foca na segurança, na detecção de comportamento fraudulento e na confiabilidade do mercado. A base para esta pesquisa é um conjunto de dados composto por mais de 1,2 milhão de registros anonimizados de transações de energia. Esses registros foram gerados a partir de uma rede simulada de intercâmbio de en...

Detectando Anomalias em Imagens Cerebrais com Modelos de Difusão Condicional

Pesquisadores propõem um novo arcabouço baseado em modelos de difusão condicional para a detecção guiada de anomalias em imagens de ressonância magnética (MRI) cerebrais. A abordagem visa superar a limitação de métodos de aprendizado supervisionado, que demandam grandes volumes de dados de indivíduos com doenças, algo nem sempre disponível, especialmente para condições raras. Métodos de detecção de anomalias não supervisionados baseados em reconstrução, particularmente aqueles que utilizam modelos de difusão, tornaram-se populares por permitirem o treinamento apenas com imagens saudáveis. No entanto, esses métodos partem do princípio de que um modelo treinado com dados normais não consegue representar ou reconstruir anomalias de forma precisa, uma suposição que frequentemente falha na prática, resultando em modelos que não reconstroem tecidos saudáveis corretamente ou não removem anomalias de forma eficaz. O trabalho apresenta um modelo de difusão condicional que integra imagens ...

Avaliando o Raciocínio Financeiro em IA: Um Novo Benchmark Multimodal e Abordagem de Aprendizagem por Erro

Um artigo recente disponível no arquivo de pré-publicações arXiv apresenta um novo benchmark e uma abordagem inovadora para compreender e aprimorar as capacidades de raciocínio financeiro em modelos de Inteligência Artificial (IA), com foco particular em modelos de linguagem grande (LLMs) e modelos multimodais grandes (MLLMs). O trabalho, intitulado "Understanding Financial Reasoning in AI: A Multimodal Benchmark and Error Learning Approach", foi escrito por Shuangyan Deng, Haizhou Peng, Jiachen Xu, Chunhou Liu, Ciprian Doru Giurcuaneanu e Jiamou Liu. A pesquisa introduz o benchmark FinMR (Financial Multimodal Reasoning), projetado para avaliar quão bem os modelos de IA raciocinam em contextos financeiros específicos. Reconhecendo que o raciocínio financeiro eficaz exige a compreensão de informações textuais e a interpretação de dados visuais complexos, como gráficos, tabelas e tendências, o FinMR integra ambas as modalidades para refletir desafios analíticos autênticos do...