مراحل آنالیز دیتای NGS
زمان مطالعه:1 دقیقه
آنالیز دیتاهای NGS به سه مرحله مجزا تقسیم میشود:
1. توالییابی
خروجی اولیه دستگاه توالییابی فایل متنی با فرمت FASTQ است که شامل میلیون خوانش کوتاه به همراه امتیاز کیفیت هر باز است. نتایج توالییابی آزمایشات WGS یا WES معمولاً منجر به ایجاد یک یا چند فایل متنی ( فرمت FASTQ) میشود.
2. الایمنت
خوانشهای کوتاهی که از دستگاه NGS به دست آمده است (فرمت FASTQ) نسبت به ژنوم رفرنس الاین میشوند. الاینمنت به معنای اختصاص دادن هر خوانش به یک موقعیت از ژنوم است که به دو روش de novo assembly و alignment قابل انجام است.
3. فراخوانی واریانت و فیلترینگ
یک مرحله اساسی در آنالیز بیوانفورماتیکی دادههای NGS، مرحله فراخوانی واریانتها است. فراخوانی واریانت (Variant Calling) بعد از الایمنت، موقعیتهایی از ژنوم فرد که با ژنوم رفرنس متفاوت است را به عنوان واریانت (فرمت VCF) شناسایی میکند. بعد از شناسایی واریانتها، مرحله فیلترینگ و حاشیه نویسی (با استفاده از دیتابیس ها و ابزارهای مختلف) به منظور حذف واریانتهای با کیفیت پایین و پلی مورفیسمها انجام میشود. چندین ابزار نرم افزاری برای فراخوانی SNV ها و حذف و اضاف شدگیهای کوچک وجود دارد. اغلب ابزارها مراحل آنالیز مشترکی دارند و خروجیهای استانداردی را ایجاد میکنند.