“Indexação sob Demanda para a Compressão Referencial de Ficheiros de ADN”

From Navigators

(Difference between revisions)
Jump to: navigation, search
(Created page with "{{Publication |type=inproceedings |document=Document for Publication-ISD-INFORUM2014.pdf |title=Indexação sob Demanda para a Compressão Referencial de Ficheiros de ADN |author...")
Line 4: Line 4:
|title=Indexação sob Demanda para a Compressão Referencial de Ficheiros de ADN
|title=Indexação sob Demanda para a Compressão Referencial de Ficheiros de ADN
|author=Fernando Alves, Vinicius Vielmo Cogo,  Alysson Bessani,
|author=Fernando Alves, Vinicius Vielmo Cogo,  Alysson Bessani,
-
|Project=Project:BioBankCloud,  
+
|Project=Project:BioBankCloud,
|ResearchLine=Fault and Intrusion Tolerance in Open Distributed Systems (FIT)
|ResearchLine=Fault and Intrusion Tolerance in Open Distributed Systems (FIT)
|month=jul
|month=jul
Line 16: Line 16:
Sucintamente, iniciamos a indexação de pequenas porções da referência apenas quando não conseguimos comprimir os dados através do uso de outras heurísticas mais simples.
Sucintamente, iniciamos a indexação de pequenas porções da referência apenas quando não conseguimos comprimir os dados através do uso de outras heurísticas mais simples.
Tal optimização, que visa estritamente reduzir o tempo de compressão, é capaz de trazer ganhos de até uma ordem de magnitude em comparação a outros algoritmos comummente utilizados para compressão referencial de ficheiros de ADN.
Tal optimização, que visa estritamente reduzir o tempo de compressão, é capaz de trazer ganhos de até uma ordem de magnitude em comparação a outros algoritmos comummente utilizados para compressão referencial de ficheiros de ADN.
 +
|booktitle=6th Simpósio de Informática (INFORUM)
|pages=12
|pages=12
}}
}}

Revision as of 17:13, 23 July 2014

Fernando Alves, Vinicius Vielmo Cogo, Alysson Bessani

in 6th Simpósio de Informática (INFORUM), Jul. 2014, pp. 12.

Abstract: A compressão de ficheiros de ADN é uma prática comum em diversos fluxos de trabalhos em bioinformática. Por sua vez, a compressão referencial é uma das suas abordagens mais recentes e eficientes, que se baseia na alta probabilidade de quaisquer dois organismos da mesma espécie possuírem um alto grau de semelhança genética. Esta permite armazenar somente as diferenças entre cada organismo e um genoma de referência (que representa essa espécie) ao invés de guardarmos todos os nucleótidos de todos os organismos de um estudo ou colecção. Uma das suas principais vantagens é o alto rácio de compressão sem a perda de informações em genomas já alinhados. Porém, algumas ferramentas que a implementam gastam um tempo substancial na indexação de todo o genoma de referência logo no início da sua execução. Neste trabalho, propomos uma optimização aos algoritmos de compressão referencial de ficheiros de ADN, que consiste na redução do volume de dados utilizados na indexação da referência. Sucintamente, iniciamos a indexação de pequenas porções da referência apenas quando não conseguimos comprimir os dados através do uso de outras heurísticas mais simples. Tal optimização, que visa estritamente reduzir o tempo de compressão, é capaz de trazer ganhos de até uma ordem de magnitude em comparação a outros algoritmos comummente utilizados para compressão referencial de ficheiros de ADN.

Download paper

Download Indexação sob Demanda para a Compressão Referencial de Ficheiros de ADN

Export citation

BibTeX

Project(s): Project:BioBankCloud

Research line(s): Fault and Intrusion Tolerance in Open Distributed Systems (FIT)

Personal tools
Navigators toolbox