Dissertação de Mestrado


Geração de consultas SPARQL a partir de linguagem natural

Apresentador : Heber Gustavo Xavier de Castro


Data: 18/11/2025
Horário: 14:00
Local: Laboratório 600 DCM

Descrição: Resumo: CASTRO, H.G.X. Geração de consultas SPARQL a partir de linguagem natural. 2025. 175p. Dissertação (Mestrado em Ciências) - Faculdade de Filosofia, Ciências e Letras de Ribeirão Preto, Universidade de São Paulo, 2025. A Web Semântica tem como objetivo fornecer informações na web com significado bem definido, tornando-as compreensíveis não apenas para seres humanos, mas também para máquinas e sistemas computacionais. Como parte dos esforços de desenvolvimento da Web Semântica, foram criados os chamados Dados Abertos Ligados (DAL), que consistem em conjuntos de dados semanticamente anotados e interligados. Esses dados, quando armazenados em repositórios apropriados, permitem a realização de consultas complexas, inclusive de forma remota. No entanto, a recuperação de informações nesses repositórios exige o domínio da linguagem SPARQL, o que representa uma barreira para usuários não especialistas. Diversas abordagens têm sido propostas para permitir a geração automática de consultas SPARQL a partir de linguagem natural. Contudo, muitas delas apresentam limitações quanto à adaptação para o idioma português e à aplicabilidade em diferentes domínios de conhecimento. Este trabalho propõe uma arquitetura de software genérica para a geração de consultas SPARQL a partir de perguntas formuladas em linguagem natural na língua portuguesa, cuja implementação é adaptável a diferentes domínios de conhecimento. Neste contexto, foi desenvolvida a ferramenta de código aberto Natural2SPARQL, uma aplicação web que torna o processo de consulta a dados semânticos mais acessível e intuitivo. A solução foi validada por meio de um estudo de caso no domínio financeiro, utilizando dados da bolsa de valores brasileira (B3). A avaliação, conduzida em duas fases, testou a robustez técnica do sistema contra a variabilidade linguística de múltiplos agentes de IA — alcançando uma acurácia média de 93,3% — e sua aplicabilidade prática com usuários humanos. Os resultados demonstraram a eficácia da arquitetura, contribuindo de forma significativa para a democratização do acesso à Web Semântica.
Observação: Link para transmissão da defesa (Live Stream - view only event): https://stream.meet.google.com/stream/53a5b52d-92f4-4b87-9b1a-63dccc1521e6

Voltar