Pesquisadores e profissionais
de saúde ganharam uma nova ferramenta para analisar grandes volumes de dados e
conjuntos de informações sobre a área. A Plataforma de Ciência de Dados
aplicada à Saúde é uma iniciativa do Instituto de Comuncação e Informação Científica
e Tecnológica em Saúde (Icict/Fiocruz) que disponibiliza para a comunidade
científica e gestores um serviço online de armazenamento, gestão e análise de
dados em saúde, possibilitando o uso de estratégicas como análise visual,
mineração de dados, big data, aprendizagem de máquina, dentre outras.
“É um serviço de computação
científica voltado para o setor de saúde”, explica o coordenador da plataforma,
Marcel Pedroso, do Laboratório de Informação em Saúde (Lis/Icict). A partir de
parcerias com o Laboratório Nacional de Computação Científica (LNCC) e a Dell
EMC, o projeto utiliza conceitos de processamento distribuído, tornando a
plataforma uma área de trabalho de alta capacidade para análise de dados.
A interface é dividida em três
eixos: Análise visual, voltada para indexação, extração e análise visual de
dados, por meio de ferramentas livres como Elasticsearch e Kibana; Mineração de
Dados e Análise Preditiva, que permitirá ao pesquisador a conexão aos dados via
R Studio Server; e Data Science Lab, que será uma área colaborativa para troca
de experiências para inovação e aprendizagem na área de ciência de dados.
“Na prática, a plataforma
permitirá aos pesquisadores uma capacidade avançada para processamento de
algoritmos para análise desses grandes volumes de dados, não só da área de
saúde, mas também de outras fontes como o IBGE, INPE, dentre outras, que sejam
públicas e estejam disponíveis”, explica Pedroso. Além disso, os dados que já
se encontram disponíveis passaram por tratamento de modelagem e indexação. No
nível individual, os dados disponibilizados são anonimizados.
“A plataforma permitirá mais
agilidade para a pesquisa, pois conta com um hardware bastante robusto e
suporte constante”, aponta Jefferson Lima, tecnologista do Centro de Tecnologia
da Informação e Comunicação (Ctic/Icict) e responsável pela governança de dados
na plataforma. Sua instalação foi viabilizada por meio de parcerias e fomento
do Programa de Indução à Pesquisa e Desenvolvimento Tecnológico (PIPDT/Icict) e
Faperj.
Além da infraestrutura, a
plataforma também tem o objetivo de ser um espaço para capacitação e
especialização para a área de ciência de dados aplicada à saúde. Haverá uma
equipe de referência composta por profissionais de diversas áreas, conforme a
própria característica desse campo. “A Ciência de Dados é um campo de
interseção entre a Estatística, a Computação e a área de interesse, no nosso
caso, a saúde”, descreve o coordenador. Os membros receberão curso de
capacitação com reconhecimento internacional e há previsão de abertura de um
curso de especialização dessa área a ser oferecido pela Gestão Acadêmica do
Icict.
A interface para a plataforma
está disponível no site do projeto em bigdata.icict.fiocruz.br. Para acessar a
plataforma, os interessados deverão realizar um cadastro no sistema, informando
e-mail e criando uma senha de acesso. Saiba como foi o Seminário do
Centro de Estudos sobre Ciência de Dados Aplicada à Saúde.
André Bezerra (Icict/Fiocruz)
0 comentários:
Postar um comentário