Jak převést sekvence na Fasta
Jeden společný cíl v lékařském výzkumu zahrnuje identifikaci chyb , nebo mutace v sekvenci DNA , které by mohly způsobit genetické onemocnění. Technologie a počítačové vědy pokročily genetický výzkum na úrovni, kde tisíce sekvenčních dat lze analyzovat současně . Jedna podmínka z novější software je před konverze sekvenčních dat do formátu FASTA . FASTA je podobný jednoduchém textovém formátu . To umožňuje více kusů dat, které je třeba sestavit do jednoho souboru a zrychluje analýzu . Nicméně, většina nástrojů generovat sekvence soubory v textovém formátu . Převod textu do formátu FASTA jejednoduchý proces, pomocí textového editoru . Věci, které budete potřebovatpočítačem
programu v textovém editoru
Zobrazit další instrukce dovolená 1
Otevřete určený DNA sekvence textový soubor pomocí textového editačního programu . To by bylo Textový editor pro Macintosh a Poznámkový blok pro kompatibilních systémů Windows . Původní sekvence textové soubory mohou mít alternativní příponu jako SEQ pro data generovaná na Applied Biosystems automatického genetického analyzátoru .
2
zahájení první řádek zadáním> následuje identifikátor sekvence . Větší než symbol označuje formát FASTA pro programy , které analyzují FASTA dat . Nejsou žádná zvláštní pravidla týkající se identifikátor , pokud nejsou žádné mezery . Příklad přijatelného vstupu na první lince> Cat_Isomerase_Exon3 .
3
Stiskněte tlačítko " Return" pro vytvoření zalomení řádku a začít druhý řádek .
4
Začněte sekvenční data na lince dvě . Pokyny formátu FASTA vyžadují textových DNA údajů následující Mezinárodní unie pro čistou a užitou chemii IUPAC , kódy . Každý řádek je omezen na 80 znaků , které představují 80 bází DNA a může být malá nebo velká písmena . Přijatelný vstup včetně smíšených základen je AGCTTCGTGG ... CVTGCGTTGT .
5
Stiskněte tlačítko " Return" začít další řadu sekvenčních dat . Každý řádek by se měl skládat z 80 základen zastoupených IUPAC kódu .
6
Uložte soubor s příponou txt souboru nebo příslušnou příponu FASTA souboru. Programy, které zpracovávají FASTA formátovaných dat často vyžadují specifické rozšíření FASTA jako FSA Fna FFN nebo FRN .