casa |  | Informação em Saúde >  | setor de Saúde | Geral Setor de Saúde

Como converter a seqüência Fasta

Um objetivo comum na pesquisa médica envolve a identificação de erros , ou mutações , na seqüência de DNA que poderiam causar doenças relacionadas genética. Tecnologia e ciência da computação têm avançado pesquisa genética para um nível em que milhares de dados de seqüência podem ser analisados ​​simultaneamente. Uma estipulação de software mais recente é a conversão antes de dados de sequências em formato FASTA . FASTA é semelhante ao formato de texto simples. Ele permite que várias partes de dados a ser compilados em um único arquivo e acelera análise. No entanto, a maioria dos instrumentos gerar arquivos de seqüência em formato de texto. Conversão de texto em formato FASTA é um processo simples usando o software editor de texto. Coisas que você precisa
Computer Fotografia de programa editor de texto
Show Mais instruções
1

Abra o arquivo de texto seqüência de DNA designado usando o programa de edição de texto . Isso seria Editor de texto para Macintosh e Anotações para sistemas Windows compatíveis . Arquivos de texto seqüência original poderia ter uma extensão alternativa, como seq para dados gerados em um analisador genético automatizado Applied Biosystems.
2

Comece a primeira linha digitando> seguida por um identificador de sequência . O símbolo maior que designa formato FASTA para programas que analisam os dados FASTA . Não existem regras específicas relativas à identificação , desde que não haja espaços . Um exemplo de uma entrada aceitável para a primeira linha é> Cat_Isomerase_Exon3 .
3

Pressione a tecla "Return" para criar uma quebra de linha e começar a segunda linha .

4

Comece dados da seqüência na linha dois. Diretrizes formato FASTA requerem dados de texto DNA seguintes União Internacional de Química Pura e Aplicada, IUPAC , códigos . Cada linha é limitado a 80 caracteres que representam 80 bases de DNA e podem ser maiúsculas ou minúsculas . Uma entrada aceitável incluindo bases mistas é AGCTTCGTGG ... CVTGCGTTGT .
5

Pressione a tecla "Return" para começar a próxima linha de dados em seqüência. Cada linha deve ser composto de 80 bases representadas pelo código IUPAC .
6

Salve o arquivo usando a extensão de arquivo txt ou extensão de arquivo FASTA apropriado. Programas que processam dados FASTA formatados muitas vezes exigem uma extensão específica FASTA como FSA , fna , ffn ou FRN .