Metagenoma: UFRN desenvolve ferramenta que automatiza análise genômica

Estudos metagenômicos têm o intuito de detalhar a composição e funções desempenhadas pelos micróbios. Esse tipo de pesquisa exige diferentes ferramentas para diferentes propósitos, mas a seleção e configuração desses instrumentos é um desafio. Além disso, o conjunto deles afetará a precisão dos resultados, impactando na interpretação da resposta obtida.

Com o objetivo de sanar os problemas das ferramentas utilizadas atualmente e acelerar o processo das análises metagenômicas, o pesquisador Diego Morais, doutorando em bioinformática (BioME/UFRN), desenvolveu, com o apoio computacional do Núcleo de Processamento de Alto Desempenho (NPAD/UFRN), um pipeline que automatiza tais análises, batizado de Medusa. O artigo explorando os resultados dessa pesquisa foi publicado no periódico de alto fator de impacto Frontiers in Genetics.

Um pipeline é um conjunto de ferramentas de software que rodam ao mesmo tempo para chegar a um resultado específico rapidamente. No Medusa, são utilizados programas de análise de metagenomas que trabalham em conjunto e buscam o melhor resultado para o objetivo do pesquisador.

Um pipeline como o Medusa pode trazer impacto social em diversos campos, como na medicina de precisão, que pesquisa os aspectos genéticos únicos de cada indivíduo para indicar o tratamento mais eficaz. Também pode ser usado no desenvolvimento de novas bebidas e no aprimoramento do petróleo. Na ciência, o principal impacto é a flexibilidade para que outros pesquisadores realizem análises precisas de acordo com suas necessidades.

Fluxograma detalhando o processo de análise do Medusa. Os retângulos destacam as etapas do protocolo. As cápsulas em ciano são as ferramentas

Normalmente, o cientista precisa organizar um conjunto de ferramentas que ele julga ser necessário para atender sua demanda, o que lhe exige tempo e esforço. Muitas vezes, mesmo após essa organização, elas não são capazes de atender a demanda ou é necessário passar pelo processo novamente, aumentando o tempo da análise.

O Medusa realiza pré-processamento, montagem, alinhamento, classificação e anotação funcional. O pipeline é composto por várias ferramentas, como o fastp, Bowtie2, Diamond, Kaiju, Megahit, entre outras. Quando comparado com programas parecidos, ele identifica corretamente mais espécies e é mais adequado para alguns tipos de análise funcional.

Diego tem esse trabalho como o principal do seu doutorado, que está em processo de conclusão. Segundo ele, parte da motivação para desenvolvê-lo veio da oportunidade de facilitar as análises de seu grupo de pesquisa, o Dalmolin’s Systems Biology Group, e também a de outros grupos. “Outra motivação foi a de contornar as limitações de pipelines e ferramentas já conhecidas, atendendo necessidades que não eram supridas pelas mesmas”, completa.

O supercomputador do NPAD foi utilizado para estruturar o pipeline e rodar benchmarks para medir sua eficiência. “O uso exclusivo dos nós computacionais permitiu a coleta de informações, como a medição do tempo e da memória usada por cada ferramenta, sem que isso fosse afetado pela demanda de outros usuários”, explicou Diego.

Desempenho do Medusa em comparação com outro pipeline consagrado no ramo, o Megan. O Medusa se mostra mais eficiente na quantidade de espécies e genes identificados

Para o desenvolvimento do pipeline, foi feito um levantamento de ferramentas existentes, então foram criados dados simulados e testes de desempenho para avaliar os resultados em conjunto. Com os resultados, foram escolhidas as ferramentas para compor um pipeline que realize uma análise abrangente de forma eficiente.

“Algumas ferramentas demandam muita memória RAM e levam dias ou semanas para processar uma amostra dependendo do tamanho dos arquivos. Os recursos do NPAD tornaram possível a execução dessas ferramentas” conclui o pesquisador.

Fonte: ASCOM/UFRN

Sair da versão mobile