Uma inteligência artificial (IA) desenvolvida na Universidade Federal de Juiz de Fora (UFJF) está sendo utilizada pela Secretaria de Saúde do Recife para identificar casos de violência contra mulheres. A ferramenta, denominada ClarIA, analisa relatos escritos em prontuários de saúde.
A ClarIA transforma informações não estruturadas em dados interpretáveis por sistemas computacionais. Este processo visa aumentar as chances de proteção das vítimas, conforme informações divulgadas pela UFJF.
O modelo foi criado pelo FrameNet Brasil, laboratório de Linguística Computacional da UFJF. A pesquisa em linguística computacional é a base para o desenvolvimento desta tecnologia.
Tiago Torrent, professor do Programa de Pós-Graduação em Linguística da UFJF, coordena o laboratório. Ele também está à frente do projeto ReINVenTA, que desenvolve pesquisas de IA aplicada à saúde, educação e acessibilidade.
A IA aplicada à saúde utiliza a Semântica de Frames e a Gramática de Construções para interpretar o significado de frases. Essas teorias consideram a experiência, o contexto e as estruturas de conhecimento prévio na interpretação.
O FrameNet Brasil, ao unir essas teorias, desenvolve implementações práticas. No caso da ClarIA, o laboratório etiquetou textos de prontuários médicos para o treinamento da inteligência artificial.
O professor Tiago Torrent explica o processo: “‘Esse é o paciente’, ‘esse é o sintoma’, ‘essa é a condição em saúde’, ‘esse foi o dia em que ocorreu’”. Ele acrescenta que milhares de sentenças anônimas são etiquetadas para treinar a IA.
Após o treinamento, a IA consegue etiquetar sentenças desconhecidas com base no aprendizado. Com a ClarIA, foram anotadas cerca de 2.500 sentenças de amostra, e o modelo processou 25.000.000 de sentenças.

A FrameNet Brasil é um laboratório de Linguística Computacional que desenvolve soluções inovadoras para a compreensão de linguagem natural, unindo tecnologia, Semântica de Frames e Gramática das Construções (Foto: UFJF)
Arthur Lorenzi, doutor em Linguística e pesquisador do FrameNet Brasil desde 2019, trabalha na conexão da Semântica de Frames com a inteligência artificial. Ele foi integrante do laboratório desde a graduação em Sistemas de Informação na UFJF.
Arthur Lorenzi trabalha com sistemas de recomendação e estruturas gramaticais, e fez parte da construção da ClarIA, a implementação mais recente do FrameNet Brasil. (Foto: Arquivo pessoal)
Lorenzi explica que a IA identifica estruturas semânticas de violência no texto. “Primeiro, os linguistas modelam essas estruturas no laboratório e o que eu faço depois é montar a inteligência artificial que vai achar isso no texto automaticamente”, detalha.
Ele esteve envolvido na ClarIA desde a criação e adaptação da ferramenta. O trabalho inclui a identificação das estruturas e o sinal de alerta emitido pelo prontuário.
Lorenzi destaca a importância ética do trabalho: “A principal importância desse trabalho é que a gente tenta pegar essas tecnologias novas de inteligência artificial e fazer um uso que seja ético, responsável e que beneficie a comunidade.”
Ele também menciona o potencial inclusivo da ferramenta. “Como são ferramentas que conseguem trabalhar numa escala de dados muito grande, a gente vê até um potencial para ela ser inclusiva, porque todas as mulheres têm direito a esse acolhimento”, afirma.
Educação e Acessibilidade
Claudia Ferraz, orientanda de doutorado do professor Torrent, integra o FrameNet Brasil desde 2023. Atualmente, ela realiza doutorado sanduíche em Groningen, nos Países Baixos, e não está diretamente envolvida no projeto ClarIA.
Para Claudia Ferraz, metodologia e dataset resultantes da sua pesquisa podem ser estendidos a cenários de interação social para além da sala de aula, contribuindo para o entendimento da comunicação humana, e servirem como recurso de “padrão ouro” para o aprendizado de máquina. (Foto: Arquivo pessoal)
A pesquisa de Claudia Ferraz foca na área da educação. Ela propõe uma metodologia para anotação semântica multimodal de interações em sala de aula, registrando correlações entre professores e alunos, modos comunicativos e materiais.
Em colaboração com Torrent, Janina Wildfeuer e outros membros do FrameNet Brasil, Claudia desenvolveu uma ferramenta de anotação. Esta ferramenta integra múltiplas camadas de dados, como fala, gestos, olhares e materiais didáticos.
A doutoranda aponta que a pesquisa contribui para melhorias no processo de ensino-aprendizagem. A metodologia permite uma compreensão aprofundada de como o sentido é construído em sala de aula.
Isso pode levar ao desenvolvimento de estratégias pedagógicas mais eficazes. Além disso, pode gerar treinamentos para professores baseados em evidências sobre engajamento e compreensão.
Mariane de Carvalho Pinto, integrante do FrameNet Brasil desde 2022, dedica-se à área de acessibilidade. Ela iniciou sua jornada como orientanda de iniciação científica da professora Natália Sathler Sigiliano, também atuante no laboratório.
Mariane de Carvalho Pinto pesquisa caminhos tecnológicos que procuram tornar mais ágil e acessível o processo de criação de roteiros audiodescritivos. (Foto: Arquivo pessoal)
Mariane de Carvalho Pinto, atualmente doutoranda sob orientação do professor Tiago, envolveu-se em diversas frentes no laboratório. Suas atividades incluíram anotação de textos e vídeos, além da geração de legendas para imagens.
A pesquisadora foca na audiodescrição, um recurso que “funciona como uma espécie de “tradução” em palavras das informações visuais, fundamental para pessoas cegas ou com baixa visão”, conforme sua definição.
A produção de roteiros de audiodescrição é um processo detalhado e demorado, o que o torna caro. Isso resulta na ausência desse recurso em muitas produções, segundo Mariane.
A doutoranda investiga como as anotações multimodais do laboratório podem auxiliar a IA na geração de roteiros de audiodescrição. A meta é desenvolver “caminhos tecnológicos que ajudem a tornar esse processo mais ágil e acessível”, ampliando o acesso a conteúdos audiovisuais.
O conteúdo também está disponível em podcast no Spotify.
Vídeo