Conversão Fala-Texto

Reconhecimento de voz para melhoria dos dados inseridos nos Sistemas de Informação em Saúde e fortalecimento da Rede Nacional de Dados em Saúde.

Conheça o Fala-Texto

O projeto Conversão Fala-Texto apresenta uma tecnologia promissora para o reconhecimento de voz, oferecendo uma solução eficaz para a documentação clínica. Esta tecnologia permite que a validação dos dados possa ocorrer simultaneamente ao preenchimento das informações, permitindo que os profissionais de saúde registrem informações de forma mais rápida e precisa.

Este protótipo visa melhorar a captura de dados médicos, reduzir a carga de trabalho dos profissionais de saúde e aprimorar a precisão das informações coletadas nos procedimentos de saúde.

Nossa Trilha de Desenvolvimento

Coleta e Treinamento de Dados

Treinamento da inteligência artificial com áudios coletados por meio de uma plataforma específica. Esse processo é essencial para aprimorar a capacidade da IA de interpretar e transcrever informações médicas com precisão.

Transcrição de Áudio em Texto

Fase dedicada à criação de um sistema para transcrever áudios em texto com alta precisão, permitindo a conversão eficiente de gravações médicas para dados escritos, prontos para serem utilizados.

Validação e Implementação

Fase de validação do sistema de transcrição, focada na garantia de precisão e eficiência do modelo.

Arquitetura

Entrada de Áudio
Processamento IA
Conversão em Texto
Serviço app

Vídeos Demonstrativos

Instituições Responsáveis

Universidade Federal de Campina Grande

Conselho Nacional de Desenvolvimento Científico e Tecnológico

Hospital Universitário Alcides Carneiro

Pesquisadores Envolvidos

Edmar Candeia Gurjão

Coordenador

José Edson Carneiro Agra Júnior

Pesquisador

Lucas Justino Costa Assis

Pesquisador

Pedro Vinicius Marques Pessoa

Pesquisador - Graduação

Gabriela de Sousa Andrade

Pesquisadora - Graduação

Raynoan Emilly Silva Batista

Pesquisadora - Graduação

Próximos Passos

O projeto avança em sua evolução com foco no aprimoramento dos mecanismos de detecção e transcrição de dados clínicos. Nesta fase, foram desenvolvidas duas versões da aplicação: uma baseada no SpeechRecognizer, utilizando recursos nativos da plataforma, sob a licença Apache License 2.0, e outra fundamentada no Whisper, modelo de código aberto distribuído sob a licença MIT, que oferece flexibilidade de uso e integração.

EComo próximos passos, prevê-se a análise comparativa de desempenho entre as abordagens, otimizações para diferentes cenários de execução, ampliação das capacidades de processamento e avanços em usabilidade, privacidade e confiabilidade, visando fortalecer a aplicação em contextos reais da área da saúde.

Colabore Conosco!

Ficou interessado no funcionamento do projeto? Você pode nos ajudar gravando áudios de expressões médicas, contribuindo para o treinamento da nossa IA e aprimorando o reconhecimento de voz na área da saúde.

Colabore conosco gravando um áudio! Realize o seu Cadastro!

Entre em Contato!

lapsi@dee.ufcg.edu.br

Edmar Candeia Gurjão: ecg@dee.ufcg.edu.br

José Edson Carneiro Agra Júnior: jose.agra@ee.ufcg.edu.br

Lucas Justino Costa Assis: lucas.assis@ee.ufcg.edu.br

Mais contatos

Pedro Vinicius Marques Pessoa: pedro.pessoa@ee.ufcg.edu.br

Raynoan Emilly: raynoan.batista@ee.ufcg.edu.br

Gabriela de Sousa Andrade: gabriela.andrade@ee.ufcg.edu.br