Uma Abordagem para Indexação de Dados no
Padrão FHIR em Banco de Dados NoSQL
Colunares
Apache Cassandra, Apache Lucene, indexação de dados clínicos, indexação
personalizada, arquitetura de banco de dados distribuído, Recursos de Interoperabilidade
Rápida para Saúde, FHIR, busca de texto completo, HAPI-FHIR.
O avanço na tecnologia de saúde aumentou a necessidade de segurança, velocidade e confiabilidade
de grande volume de dados médicos. Bancos de dados relacionais tradicionais
apresentam limitações em cenários de big data e análise em tempo real, principalmente
devido aos seus requisitos de esquema rígidos e escalabilidade limitada. Os bancos NoSQL
podem servir como alternativa ao relacional em cenários de saúde quando a velocidade
de armazenamento e recuperação da informação é crucial. Entretanto, existem desafios
consideráveis em adaptar alguns dos bancos de dados NoSQL para padrões de interoperabilidade
de dados médicos como o FHIR. Este estudo explora a compatibilidade do padrão
FHIR com o banco de dados NoSQL Apache Cassandra para o gerenciamento de dados
de saúde em aplicações que exigem alta eficiência, como em ambientes da Internet das
Coisas Médicas (IoMT), análise estatística de dados e previsão em tempo real. Embora o
Cassandra seja altamente escalável, tolerante a falhas e eficiente em operações de leitura
e gravação, ele não oferece suporte adequado para buscas com todos os filtros definidos
pelo FHIR, devido a sua estrutura nativa apresentar dependência da chave primária de
uma tabela para realização de buscas eficientes. Para superar essa limitação, é proposto o
uso do indexador Apache Lucene em conjunto com uma biblioteca de implementação do
padrão FHIR chamada HAPI-FHIR para para criar um índice customizado automático
que faça buscas por texto completo. A solução foi validada em um protótipo usando
microbenchmarks, demonstrando que, com um índice customizado, o Cassandra pode
realizar consultas exigidas pelo FHIR com um impacto estatisticamente significativo no
desempenho, com um intervalo de 0,5 a 4 milissegundos de acréscimo em relação à ausência
do índice. Apesar desse aumento, a solução preservou total compatibilidade com o padrão
FHIR e permitiu consultas com as condições exigidas pelo padrão. Isso demonstra que
a busca em texto completo como índice para o FHIR é uma alternativa viável para o
gerenciamento de dados de saúde em sistemas NoSQL colunares sob condições específicas
que permitem latências dentro do intervalo definido.