Postagens

Mostrando postagens de julho, 2025

Uma Teoria da Escalabilidade Computacional da Inferência em LLMs

Modelos de Linguagem Grandes (LLMs) demandam recursos computacionais, energéticos e financeiros substanciais tanto no treinamento quanto na implementação. Enquanto as leis de escalabilidade para treinamento guiaram grande parte do progresso recente na área, os custos de inferência representam agora um componente significativo e crescente do ônus geral de recursos, especialmente para modelos focados em raciocínio. Caracterizações existentes de otimalidade computacional que consideram tamanho do modelo, tamanho do conjunto de dados e tokens de inferência isoladamente ou em combinações fixas podem negligenciar pontos de operação mais eficientes. Neste contexto, foi introduzido o Directed Stochastic Skill Search (DS3), uma estrutura geral que representa a inferência como uma travessia estocástica sobre um grafo de habilidades aprendido. A partir de uma instanciação simplificada, mas expressiva, o DS3 permite derivar expressões de forma fechada para o sucesso da tarefa e o custo computac...

Modelos de Separação de Áudio Preservam Informação Espacial em Áudio Binaural?

Uma pesquisa recente publicada no arXiv investiga a capacidade de modelos existentes de separação de fontes musicais (MSS) em preservar a informação espacial presente no áudio binaural. O áudio binaural, embora crucial para experiências imersivas como em realidade virtual e aumentada, bem como para aplicações de acessibilidade, permanece relativamente pouco explorado na comunidade de recuperação de informação musical (MIR). O estudo avaliou o desempenho de diversos modelos populares de MSS. Para isso, foram utilizados tanto conjuntos de dados estéreo padrão quanto novos conjuntos de dados binaurais sintetizados. A criação dos dados binaurais envolveu o uso de *stems* do conjunto MUSDB18-HQ e funções de transferência relacionadas à cabeça (HRTFs) de código aberto, posicionando as fontes instrumentais aleatoriamente no plano horizontal. A avaliação da qualidade espacial dos *stems* separados foi realizada utilizando métricas baseadas em processamento de sinal e em pistas interaurai...

Rastreamento em Tempo Real de Fio-Guia com Redes Siamesas para Procedimentos Endovasculares

Um estudo recente disponível no arquivo arXiv, identificado como arXiv:2507.00051, apresenta um método inovador para o rastreamento em tempo real da ponta de fios-guia durante procedimentos endovasculares guiados por imagem. O artigo, intitulado "Real-Time Guidewire Tip Tracking Using a Siamese Network for Image-Guided Endovascular Procedures", foi desenvolvido por Tianliang Yao, Zhiqiang Pei, Yong Li, Yixuan Yuan e Peng Qi. Os autores propõem a utilização de uma rede siamesa, um tipo de arquitetura de rede neural, para realizar essa tarefa crítica. O rastreamento preciso e em tempo real da ponta do fio-guia é fundamental para a segurança e eficácia dos procedimentos endovasculares, que envolvem a navegação através dos vasos sanguíneos com o auxílio de imagens médicas. A capacidade de determinar a posição exata da ponta do fio-guia em cada momento permite aos médicos tomar decisões mais informadas e precisas, minimizando riscos e melhorando os resultados para os pacientes....

Novas Fronteiras na Cosmologia: Energia Quântica em Limites Tipo Tempo e o Modelo Além do ΛCDM

Um artigo recente publicado no arquivo de pré-publicações arXiv investiga as implicações cosmológicas de uma população de "limites tipo tempo", uma forma de topologia de espaço-tempo não trivial, que contêm uma camada limite de energia de tensão-energia quântica. Este fenômeno, que envolve o acúmulo de flutuações de vácuo de campos quânticos, pode ser consistentemente negativo e sensível ao ultravioleta, apresentando uma nova fonte de densidade de energia cósmica com potencial para competir com a matéria e a energia escura. Os autores, Oliver H. E. Philcox, Eva Silverstein e Gonzalo Torroba, analisam como este efeito contribui com um termo qualitativamente novo para a equação de Friedmann, que dita a história da expansão do universo. Para condições de contorno que permitem um tamanho de limite comóvel fixo, este termo escala com −1/a, onde 'a' é o fator de escala. Notavelmente, esse efeito tende a dominar em tempos relativamente tardios da evolução do universo (em ...

PyMGal: Gerando Observações Ópticas Sintéticas de Simulações Astrofísicas

Um novo pacote Python chamado PyMGal foi desenvolvido para auxiliar pesquisadores em astrofísica na geração de observações ópticas sintéticas a partir de simulações hidrodinâmicas de galáxias. Apresentado no artigo arXiv:2507.00123, de Patrick Janulewicz e Weiguang Cui, o PyMGal visa facilitar a comparação direta entre os resultados de simulações teóricas e os dados obtidos por telescópios reais. O PyMGal funciona lendo as propriedades de partículas estelares de simulações hidrodinâmicas. A partir dessas propriedades, o pacote gera distribuições de energia espectral (SEDs) utilizando uma variedade de modelos de populações estelares que podem ser customizados pelo usuário. Com as SEDs geradas, o programa é capaz de calcular o brilho das partículas em diferentes unidades de saída para centenas de filtros únicos. Uma das principais funcionalidades do PyMGal é a projeção dessas quantidades em um plano 2D, mimetizando uma observação telescópica. O software é compatível com diversos fo...

NeutroSENSE: Detecção de Intrusões em IoT com Lógica Neutrosófica e Abstenção Inteligente

Um novo trabalho de pesquisa intitulado "Deciding When Not to Decide: Indeterminacy-Aware Intrusion Detection with NeutroSENSE" propõe uma abordagem inovadora para a detecção de intrusões em ambientes de Internet das Coisas (IoT). O artigo, assinado por Eyhab Al-Masri, apresenta o NeutroSENSE, uma estrutura de ensemble aprimorada por lógica neutrosófica projetada para ser interpretável e eficaz na identificação de atividades maliciosas. O cerne do NeutroSENSE reside na integração de algoritmos de aprendizado de máquina populares, como Random Forest, XGBoost e Regressão Logística, com a lógica neutrosófica. Essa combinação permite que o sistema não apenas faça previsões sobre a natureza do tráfego de rede (malicioso ou benigno), mas também decomponha a confiança dessa previsão em três componentes: verdade (T), falsidade (F) e indeterminância (I). Essa quantificação da incerteza é um diferencial, pois fornece uma métrica clara (o componente I) para entender o quão incerta é ...

Hypertokens e HDRAM: Nova Memória Associativa para LLMs

Um artigo recente propõe uma nova abordagem para lidar com a aparente perda de precisão em Large Language Models (LLMs), reformulando o problema como uma questão de distribuição de informação no espaço latente. Intitulado "Hypertokens: Holographic Associative Memory in Tokenized LLMs", o estudo introduz a HDRAM (Holographically Defined Random Access Memory) como uma estrutura de memória simbólica inovadora. A pesquisa aborda especificamente o desafio da memória K:V e V:K em LLMs, tratando o espaço latente dos transformadores como um canal de espectro expandido. A HDRAM é construída sobre o conceito de hypertokens, que são códigos simbólicos estruturados que integram códigos corretores de erros (ECC) clássicos, computação holográfica e busca inspirada em computação quântica. Segundo o autor, esta estrutura permite que a HDRAM recupere informações distribuídas através de um processo de "desexpansão" (despreading) baseado em princípios bem definidos. Os hypertoke...

Otimizando o Rastreamento de Objetos em LEO com Geometria Estocástica

A manutenção de catálogos de objetos espaciais, especialmente aqueles em órbita baixa da Terra (LEO), representa um desafio significativo para a comunidade espacial devido ao número limitado de sensores terrestres disponíveis. Um artigo recente disponível no arXiv (arXiv:2507.00076) aborda essa questão apresentando uma metodologia inovadora para o direcionamento ideal de sensores terrestres, visando o rastreamento e a vigilância de objetos em LEO de forma invariante no tempo. A metodologia proposta pelos autores Partha Chowdhury e colaboradores utiliza conceitos da geometria estocástica, em particular o processo de Poisson pontual. O objetivo central é maximizar o número esperado de objetos espaciais observados por um conjunto limitado de estações terrestres. Ao empregar essa abordagem matemática, o estudo fornece uma estrutura sistemática para compreender os padrões de visibilidade e aumentar a eficiência no rastreamento simultâneo de múltiplos objetos. O trabalho detalha um pro...

Métodos Estocásticos Aprimoram Modelagem de Prosódia em Síntese de Fala

Gerar prosódia expressiva para uma fala sintética continua sendo um desafio significativo na síntese de texto para fala (TTS), especialmente em sistemas que modelam explicitamente parâmetros como tom, energia e duração para maior interpretabilidade e controlabilidade. Embora métodos generativos tenham avançado rapidamente, capturar a variabilidade inerente à fala humana de forma controlável permanece uma tarefa complexa. Um estudo recente, detalhado no artigo "Investigating Stochastic Methods for Prosody Modeling in Speech Synthesis" disponível no arXiv (arXiv:2507.00227), investiga a eficácia de métodos estocásticos para esta tarefa. A pesquisa compara abordagens estocásticas, incluindo Normalizing Flows, Conditional Flow Matching e Rectified Flows, com uma linha de base determinística tradicional e realizações de fala humana real. As avaliações extensivas, tanto subjetivas quanto objetivas, demonstram que os métodos estocásticos são capazes de produzir prosódia natura...

Simetria Protege Perturbações Inflacionárias Super-Horizonte

Um estudo recente publicado no arXiv investiga a conservação de perturbações em escalas super-horizonte durante o período inflacionário do universo. O artigo, intitulado "Symmetry-protected conservation of superhorizon inflationary perturbations to all loops", de autoria de Cheng-Jun Fang, Zhen-Hong Lyu, Chao Chen e Zong-Kuan Guo, apresenta uma demonstração de que o sistema de campo único de inflação possui uma simetria fundamental que restringe sua evolução. Essa simetria se mantém mesmo em modelos de inflação não atratores, que são cenários onde as dinâmicas inflacionárias podem divergir dos caminhos usualmente considerados mais estáveis. A pesquisa utiliza a análise de estruturas de diagramas de loop, uma técnica comum em teoria quântica de campos, para derivar uma quantidade conservada em escalas super-horizonte. Essa quantidade conservada está diretamente relacionada à função de correlação de dois pontos das perturbações de curvatura. O trabalho se destaca por general...

Constelações de Satélites Ultrapassam Limites de Brilho Aceitáveis pela IAU

Um estudo recente publicado no arquivo científico arXiv.org, sob o identificador arXiv:2507.00107, apresenta uma análise detalhada sobre o brilho de diversas constelações de satélites e compara esses dados com os limites de brilho aceitáveis estabelecidos pela União Astronômica Internacional (IAU). A pesquisa analisou estatísticas de brilho de constelações proeminentes, incluindo Starlink (operada pela SpaceX), BlueBird, Qianfan, Guowang e OneWeb. O objetivo principal do estudo foi determinar se a luminosidade desses satélites em órbita baixa está em conformidade com as diretrizes internacionais destinadas a mitigar o impacto na observação astronômica e no céu noturno. O Centro da IAU para a Proteção do Céu Escuro e Silencioso contra a Interferência de Constelações de Satélites tem trabalhado para definir limites e recomendar práticas que minimizem a poluição luminosa causada por esses crescentes agrupamentos de satélites. Os resultados da pesquisa indicam que a vasta maioria dos...

Modelos de Linguagem Grandes Transformando a Descoberta Científica

Modelos de Linguagem Grandes (LLMs) estão emergindo como ferramentas poderosas com o potencial de remodelar fundamentalmente o cenário da descoberta científica. Longe de serem meras ferramentas de automação de tarefas específicas, os LLMs estão evoluindo para agentes cada vez mais autônomos, redefinindo processos de pesquisa e a colaboração entre humanos e IA. Uma análise sobre a aplicação de LLMs na ciência revela uma progressão em seus papéis, categorizada em três níveis distintos de autonomia: Ferramenta, Analista e Cientista. No nível mais básico, o LLM atua como Ferramenta, auxiliando pesquisadores humanos em tarefas bem definidas dentro de uma única etapa do método científico, com o objetivo principal de aumentar a eficiência. Isso inclui o suporte na revisão de literatura, coleta de informações, geração de ideias, formulação de hipóteses, planejamento de experimentos, execução, análise de dados e organização. Avançando, o LLM como Analista demonstra maior autonomia no proc...

Aprendizado de Máquina para Gestão Proativa de Água Subterrânea

Um artigo recente publicado no arXiv explora a aplicação de aprendizado de máquina para a gestão proativa de recursos hídricos subterrâneos, focando em sistemas de alerta precoce e alocação de recursos. Intitulado "Machine Learning for Proactive Groundwater Management: Early Warning and Resource Allocation", o estudo aborda os desafios do monitoramento tradicional da água subterrânea, que frequentemente enfrenta limitações devido à escassez de dados, restrições computacionais e saídas atrasadas. Para superar essas barreiras, os pesquisadores desenvolveram um pipeline de aprendizado de máquina projetado para prever categorias de níveis de água subterrânea. Este pipeline utiliza uma combinação de dados climáticos, registros hidrometeorológicos e atributos fisiográficos. O processamento desses dados é realizado através da estrutura de ensemble automatizado AutoGluon, que integra pré-processamento geoespacial, engenharia de atributos orientada pelo domínio e seleção automatiza...

Estratégias de Normalização de Dados para Deep Learning em EEG

A normalização de dados é um passo fundamental e frequentemente subestimado no pipeline de pré-processamento para aplicações de deep learning em Eletroencefalografia (EEG). Com a crescente adoção de paradigmas de pré-treinamento em larga escala, como a aprendizagem autossupervisionada (Self-Supervised Learning - SSL), a natureza das tarefas em deep learning de EEG está mudando, levantando novas questões sobre as estratégias de normalização mais eficazes para diferentes propósitos. Um estudo recente disponível no arquivo arXiv investigou sistematicamente o impacto da granularidade da normalização (nível de gravação vs. nível de janela) e do escopo (entre canais vs. dentro do canal) em tarefas de deep learning supervisionadas e autossupervisionadas. Para a avaliação, foram utilizadas tarefas supervisionadas de previsão de idade e gênero, bem como aprendizagem autossupervisionada via Contrastive Predictive Coding. A pesquisa utilizou dados de EEG de alta densidade em estado de repouso ...

Explorando Sistemas Triplos Hierárquicos de Buracos Negros

Um estudo recente publicado no arquivo de pré-publicações arXiv, sob o identificador arXiv:2506.22519, intitulado "Exploring the parameter space of hierarchical triple black hole systems", investiga a complexa dinâmica de sistemas compostos por três buracos negros organizados hierarquicamente. O artigo, de autoria de M. Attia e Y. Sibony, foi aceito para publicação na renomada revista Astronomy & Astrophysics (A&A). Sistemas triplos hierárquicos são configurações onde um par binário compacto orbita um terceiro objeto mais distante. No caso específico abordado, os objetos envolvidos são buracos negros. A dinâmica desses sistemas é intrincada e regida pelas leis da gravitação, incluindo efeitos da Relatividade Geral, especialmente quando os buracos negros se aproximam. A pesquisa foca na exploração do espaço de parâmetros desses sistemas. Isso envolve analisar como diferentes propriedades iniciais, como massas dos buracos negros, separações orbitais e excentricida...

Monitoramento de Pragas em Armadilhas de Água com Contagem Confiável

A agricultura de precisão depende fundamentalmente do monitoramento preciso da população de pragas para a tomada de decisões eficazes. Uma limitação significativa nas atuais pesquisas de contagem automática de pragas baseadas em visão é a falta de avaliação da confiabilidade dos resultados em cenários do mundo real, onde a "verdade terrestre" (ground truth) muitas vezes não está disponível. Para superar essa barreira, um estudo recente propõe um método abrangente para avaliar a confiança na contagem de pragas em imagens, considerando informações relacionadas aos resultados da contagem e às condições ambientais externas. O processo envolve inicialmente o uso de uma rede de detecção de pragas para identificar e contar os indivíduos, extraindo informações relevantes do resultado da contagem. Em seguida, as imagens das pragas passam por avaliações de qualidade, complexidade e uniformidade de distribuição das pragas. As alterações na clareza da imagem causadas pela agitação ...

Busca Sistemática por Galáxias Dormentes no Universo Primitivo com JWST

Um estudo recente, disponível no arquivo arXiv sob o identificador 2506.22540, detalha uma busca sistemática por galáxias "dormentes" em redshifts de aproximadamente 5 a 7, utilizando dados do arquivo NIRSpec do Telescópio Espacial James Webb (JWST). O trabalho, liderado por Alba Covelo-Paz e colaboradores, explora as capacidades sem precedentes do JWST para investigar a população dessas galáxias no universo primitivo. Galáxias dormentes, ou quiescentes, são aquelas que pararam ou reduziram drasticamente sua formação estelar. A existência e as propriedades dessas galáxias em épocas tão remotas do universo fornecem informações cruciais sobre os mecanismos de supressão da formação estelar e a evolução das galáxias. A alta sensibilidade e capacidade espectroscópica do NIRSpec no JWST permitem a detecção e caracterização detalhada dessas fontes fracas em grandes distâncias cosmológicas. Os autores realizaram uma análise focada nas razões de linhas de emissão fortes nestas g...

Localização Otimizada em Redes de Sensores sem Fio: A Abordagem da Razão Áurea

Um artigo recente disponível no arquivo arXiv, sob a identificação arXiv:2506.22464, apresenta uma proposta inovadora para a localização de nós em Redes de Sensores sem Fio (WSNs). Intitulado "Golden Ratio Assisted Localization for Wireless Sensor Network" (Localização Assistida pela Razão Áurea para Redes de Sensores sem Fio), o estudo introduz um novo algoritmo de localização chamado GRL (Golden Ratio Localization). Redes de Sensores sem Fio são componentes fundamentais em diversas aplicações, desde agricultura de precisão até cidades inteligentes, mas a localização precisa dos nós sensores é um desafio central. Métodos baseados em GPS frequentemente não são viáveis devido ao alto consumo de energia ou limitações em ambientes internos. O algoritmo GRL proposto neste trabalho busca otimizar tanto a disposição dos nós quanto o alcance da comunicação, aproveitando as propriedades matemáticas da Razão Áurea (ϕ ≈ 1.618). A abordagem GRL incorpora o uso da Razão Áurea no po...

Emissão Multimessageira de Jatos de Buracos Negros de Alta Energia na Via Láctea

Um estudo recente disponível no arXiv explora a emissão multimessageira de sistemas de jatos de buracos negros de muito alta energia localizados na Via Láctea. Intitulado "Multimessenger Emission from Very-High-Energy Black Hole-Jet Systems in the Milky Way", o artigo foca em microquasares, sistemas binários compactos que contêm um buraco negro estelar ou estrela de nêutrons em acreção. Estes sistemas são considerados fortes candidatos para a aceleração de partículas de alta energia. A motivação para o estudo surge da recente detecção pela colaboração LHAASO de emissão de raios gama com energias superiores a 100 TeV proveniente de cinco microquasares. Essa detecção sugere que esses sistemas são aceleradores de partículas eficientes. No contexto dos microquasares, os raios gama de alta energia podem ser produzidos tanto em jatos de grande escala quanto em ventos. Os pesquisadores investigam especificamente a emissão de raios-X, raios gama e neutrinos de três microquasare...

Inferência de População dos Binários Galácticos de LISA: Contornando o Ajuste Global

A missão Laser Interferometer Space Antenna (LISA) deverá detectar milhares de fontes de ondas gravitacionais resolvidas individualmente, que se sobrepõem no tempo e na frequência. Essas fontes, juntamente com fundos astrofísicos e/ou primordiais não resolvidos, representam um desafio significativo para a análise de dados. Tradicionalmente, a separação dessas fontes e a extração de seus parâmetros exigem um processo computacionalmente intensivo conhecido como "ajuste global". Este método é frequentemente considerado um passo necessário para reconstruir as propriedades das populações astrofísicas subjacentes. No entanto, um novo estudo explora uma abordagem alternativa para inferir as propriedades da população mais numerosa de fontes de LISA: as anãs brancas duplas galácticas. O artigo demonstra que é possível inferir as propriedades dessa população diretamente a partir da série temporal (ou de frequência) do sinal, utilizando uma abordagem baseada em simulação que contorna...

Nova Abordagem Robusta para Rastreamento de Rachaduras em Estruturas

Um estudo recente disponível no arquivo arXiv (arXiv:2506.22437) apresenta um framework inovador para o rastreamento da evolução de rachaduras em cenários de monitoramento da saúde estrutural (SHM) baseados em imagens. O artigo, intitulado "Robust Perspective Correction for Real-World Crack Evolution Tracking in Image-Based Structural Health Monitoring", aborda o desafio crítico do alinhamento preciso de imagens em condições reais, que frequentemente envolvem distorção de perspectiva, oclusões e baixo contraste. Os métodos tradicionais de detecção de características, como SIFT e SURF, que dependem de espaços de escala baseados em Gaussianas, tendem a suprimir bordas de alta frequência, tornando-os inadequados para a localização de rachaduras finas. Alternativas binárias mais leves, como ORB e BRISK, embora computacionalmente eficientes, frequentemente apresentam baixa repetibilidade de pontos-chave em superfícies texturizadas ou sombreadas. Para superar essas limitações...

Produção de Raios Cósmicos de Energia Ultra-Alta em Fusões de Estrelas de Nêutrons Binárias

Um estudo recente explora a origem dos raios cósmicos de energia ultra-alta (UCRs), propondo que as fusões de estrelas de nêutrons binárias são locais significativos para a produção dessas partículas extremas. O artigo, intitulado "Ultrahigh Energy Cosmic Ray Production in Binary Neutron Star Mergers" por Glennys R. Farrar, detalha previsões sobre o espectro e a composição dos UCRs gerados nesses eventos cataclísmicos. A pesquisa aponta que as condições iniciais altamente restritas das fusões de estrelas de nêutrons permitem fazer previsões quantitativas sobre a energia de corte para vários núcleos. O mecanismo chave identificado para a produção de UCRs mais pesados que o hélio é a aceleração no fluxo turbulento magnetizado que se encontra fora dos jatos principais. O estudo também aborda a distribuição da composição dos raios cósmicos produzidos, indicando que ela varia com o ângulo polar. Partículas mais leves, como prótons e partículas alfa, podem ser aceleradas no p...