28 março 2009


O que é Bioinformática?




“Da descoberta da molécula de DNA até os dias atuais muitas ferramentas de análises foram desenvolvidas para o estudo investigativo desta molécula. Dentre as técnicas principais destaca-se o processo de seqüenciamento do DNA, que determina a sequência de nucleotídeos em uma amostra (Alberts et al., 1997).


A descoberta da estrutura de dupla hélice da molécula de DNA, por James D. Watson e Francis Crick (1953), bem como o melhor entendimento dos processos de síntese de proteína, onde se destacam os fenômenos de transcrição e traduções, fizeram com que os polímeros de ácidos nucléicos e de aminoácidos passassem a figurar como objetos de estudo dos pesquisadores. O surgimento dos métodos de seqüenciamento desses polímeros, principalmente do DNA, permitiram a investigação de suas seqüências monoméricas constituintes, produzindo mais de 18 bilhões de seqüências, que estão disponíveis em bancos de dados públicos. (Prosdocimi et al., 2003).O advento da tecnologia dos seqüenciadores automáticos (1990) exigiu recursos computacionais mais eficientes para o armazenamento da grande quantidade de seqüências geradas. Mas além do armazenamento, era necessária uma plataforma computacional que possibilitasse a análise e interpretação dos dados obtidos. Surgia, então, um grande laço que atrelava, não somente a Biologia e a Computação, mas também outras áreas do conhecimento, como a Engenharia, Matemática, Estatística, Química e Física; o que ocasionou o aparecimento de novas áreas de caráter multidisciplinar, como a Biologia Computacional e a Bioinformática (Prosdocimi et al., 2003; Santos & Dias, 2005).

‘No presente momento, o termo Bioinformática vem sendo empregado a cada vez que se ouve falar das mais recentes conquistas feitas nas áreas relacionadas ao genoma e à expressão de proteínas. Assim, no seu sentido mais amplo, Bioinformática parece cada vez mais convergir para uma agregação de tecnologias. De fato, a expressão hoje designa tanto o que tradicionalmente se conhece por Bioinformática quanto o que historicamente era conhecido como Biologia Computacional. Este último em geral designaria a parte científica, enquanto que Bioinformática se relacionaria mais com as questões de tecnologia e infra-estrutura computacional. Tradicionalmente, embora nunca tenha existido uma definição única e precisa para o termo, pode-se dizer que esta área se preocupa com a análise de dados provenientes do genoma, a fim de elucidar processos biológicos complexos que por sua vez objetivam, em última análise, realizar diagnósticos de doenças e ajudar no desenvolvimento de novos fármacos. Ainda na acepção tradicional, Biologia Computacional, igualmente nunca propriamente definido, se ocupa com o estudo de sistemas moleculares naturais e artificiais, bem como com novos paradigmas de computação baseado em DNA. Entretanto, nos dias de hoje os dois termos vieram a se fundir, sendo que, o que se popularizou foi Bioinformática, que hoje é empregado indistintamente para ambas às designações (Laboratório de Bioinformática da UFRGS - http://www.inf.ufrgs.br/~crym/LabBioInf/intro.html)



A Bioinformática possui três focos. O primeiro é a criação de bancos de dados biológicos, também conhecidos com bancos de dados primários, pois seu desenvolvimento visa apenas a deposição, sem qualquer tipo de processamento ou análise, de seqüências de nucleotídeos ou de proteínas. Utilizados para permitir o armazenamento, gerenciamento e acesso das informações existentes, bem como à submissão de novas informações (Santos & Dias, 2005). Dentre os principais bancos de dados primários, que permitem acesso on-line, estão: GenBank (Banco de Dados Americano de Seqüências de DNA e Proteinas), EBI (European Bioinformatics Institute), DDBJ (DNA Data Bank of Japan) e o PDB (Protein Data Bank) (Prosdocimi et al., 2003; Mateus, 2005).

Existem atualmente, diferentes tipos de bancos de dados, que armazenam dados relativos à estrutura de proteína, como a função, domínios funcionais, proteínas homólogas. Estes são denominados de bancos de dados secundários ou também banco de dados estruturais ou funcionais. O PIR (Proteína Information Resource), o SWISS-PROT e o KEGG (Kyoto Encyclopedia of Genes and Genomes) são os mais utilizados (Prosdocimi et al., 2003).

O segundo foco é o desenvolvimento de ferramentas e recursos, que possibilitem a análise das informações contidas nos banco de dados. Esta análise consiste em atribuir valores de qualidade a construção de seqüências nucleotídicas, por meio da comparação de diferentes seqüências já existentes nesses bancos de dados. São exemplos de ferramentas que exercem tais tarefas: CAP3, TIGRAssembler, PHRAP, PHRED, CONSED, CROSS-MATCH. (Prosdocimi et al., 2003). Para a realização deste processo a Bioinfomática se utiliza principalmente de softwares gratuitos, onde sua distribuição apresenta um caráter livre e o código fonte é aberto. Entre os principais benefícios, na utilização desse tipo de softwares temos: o baixo custo, estabilidade e confiabilidade nas plataformas.

O terceiro foco da Bioinformática visa a utilização de ferramentas disponíveis para as análises e interpretações estritamente biológicas. Existem vários programas computacionais que realizam este tipo de tarefa e a grande maioria deles estão disponíveis on-line. Dentre estas ferramentas destacam-se o BLAST (Basic Local Alignment Search Tool), utilizado para encontrar similaridades entre seqüências de nucleotídeos e proteínas contra bancos de dados, com grande número de seqüências dos mais diversos organismos. É um dos principais programas utilizados na identificação dos genes (Prosdocimi et al., 2003). O ClustalW realiza o alinhamento múltiplo de seqüências de proteínas e DNA, este facilita a identificação de pontos divergentes (Santos, 2004). Pode ser executado através de uma interface Web ou localmente em um computador, em comando de texto. Também podemos encontrar uma versão local denominada de ClustalX.

Todas essas ferramentas surgem em função da grande quantidade e necessidade de análise de seqüências e informações, que passaram a alimentar os bancos de dados ‘caseiros’ de diferentes laboratórios e que precisam ser analisadas. Consequentemente, este aumento de nucleotídeos seqüenciados, de diferentes organismos, favorecem o surgimento de uma variedade de linhas de pesquisas relacionadas à Bioinformática. Entre essas se destacam os estudos voltados à modelagem de macromoléculas, expressão gênica, obtenção de novos fármacos, simulação de processos biológicos, identificação de genes e polimorfismos, entre outras.”




Referencia bibliográfica:



ALBERTS, B., BRAY, D., LEWIS, J., RAFF, M., ROBERTS, K., WATSON., J. D. Biologia Molecular da Célula [Trad. Amauri Braga Simonetti et al.]. – 3.ed. – Porto Alegre, Artes Médicas, 1997, G-21p.

PROSDOCIMI, F., CERQUEIRA, G.C., BINNECK, E; SILVA AF; REIS AN; JUNQUEIRA ACM; SANTOS ACF; NHANI-JÚNIOR A; WUST CI; CAMARGO-FILHO F; KESSEDJIAN JL; PETRETSKI JH; CAMARGO LP; FERREIRA RGM; LIMA RP; PEREIRA RM; JARDIM S; SAMPAIO VS AND FOLGUERAS-FLATSCHART AV. Bioinformática: Manual do Usuário. Biotecnologia. Ciência & Desenvolvimento, 29: 18-31 , 2003.

SANTOS, D. F., Dias U. M. Linguagem Proteômica: Uma Introdução às Gramáticas Livres de Contexto para Descrição de Dados Biológicos. 2005. Trabalho de Conclusão de Curso. Belém. Universidade federal do Pará, 56p. , Pará.

SANTOS, E.C. Uma introdução à Bioinformática Através da Análise de Algumas Ferramentas de Software Livre ou de Código Aberto Utilizadas para o Estudo de Alinhamento de Seqüências. 2004. Monografia. Lavras. Universidade Federal de Lavras, 88p. , Minas Gerais.

MATEUS, P. G. Bancos de Dados Biológicos. 2005. Monografia de Conclusão de Curso. Barra do Bugres. Universidade do Estado de Mato Grosso, 54p. , Mato Grosso.

Nenhum comentário: