توضیحات
دوره لینوکس برای آنالیز NGS
دوستان عزیز، با تماشای ویدئو زیر میتوانید به طور کامل با اطلاعات و اهمیت یادگیری لینوکس در آنالیز NGS آشنا شوید.
کاربران NGS برای آنالیز دیتا، بهینهسازی پایپلاینها و اتومات کردن روند آنالیز خود باید از ابزارهای مختلفی مانند BWA ،Bowtie ،SAMTOOLS و غیره استفاده کنند. این ابزارهای در سیستم لینوکس قابلیت اجرا داشته و به همین دلیل کاربران باید دانش نسبتا خوبی از این سیستم و دستورات آن داشته باشند. اما اکثر دانشآموختگان رشتههای پزشکی، علوم آزمایشگاهی، ژنتیک، زیستشناسی و غیره با سیستم عامل لینوکس نا آشنا بوده و روند آموزش در دوره “لینوکس برای آنالیز NGS” به گونهای است که دوستان با سیستم لینوکس و دستورات آن به طور ساده و جامع آشنا میشوند.
دوره “لینوکس برای آنالیز NGS” یک دوره آموزشی جذاب و عملی است که به شما مفاهیم لینوکس را به همراه کاربردهای آن در تحلیل دیتای توالییابی NGS آموزش میدهد. این دوره توسط مهندس مهدی شاهحسینی، نویسنده کتابهای “لینوکس (LPIC-1)” و “آموزش تحلیل دادههای NGS: از معرفی تکنولوژیهای توالییابی تا شناسایی واریانت عامل بیماری” تهیه شده است، که دارای مدرک کارشناسی ارشد مهندسی پزشکی از دانشگاه علومپزشکی اصفهان است.
مهم) دوره “لینوکس برای آنالیز NGS” دارای گارانتی بازگشت وجه میباشد. ما به شما این گارانتی را ارائه میدهیم زیرا مطمئنیم محتوا و آموزشهای این دوره شما را به سمت متخصص شدن در آنالیز توالییابی NGS هدایت میکند. این بدین معناست که شما میتوانید تا تکمیل قسمتهای جلسه دوم دوره، در صورتی که هر گونه نارضایتی داشته باشید، وجه خود را بازگردانی کنید.
سوالات متداول
- چرا دورهی "لینوکس برای کاربران آنالیز دیتای NGS" مهم است؟
پنج مورد زیر میتواند از دلایل مهم استفاده کاربران آنالیز دیتای NGS از سیستم لینوکس باشد. کاربران با استفاده از سیستم لینوکس میتوانند به راحتی ابزارهای آنالیز دیتای NGS را نصب و استفاده کنند و در عین حال از امکانات گستردهای مانند پایداری، امنیت، وجود انجمنهای متعدد و قابلیت کنترل بیشتر بر روی پردازش آنالیزهای خود هم نیز استفاده کنند.
- قابلیت پشتیبانی از ابزارهای آنالیز دیتای NGS: سیستم لینوکس به عنوان یک سیستم عامل قدرتمند، قابلیت اجرای ابزارهای متداول آنالیز دیتای NGS را داراست. ابزارهای آنالیز دیتای NGS معمولاً برای سیستم عامل لینوکس توسعه داده میشوند و بر روی این سیستم عامل به خوبی عمل میکنند؛ این به کاربران اجازه میدهد تا به راحتی ابزارهای معروفی مانند BWA، SAMtools، GATK، Picard، BEDTools و سایر ابزارهای مشابه را نصب و استفاده کنند (این تعداد تنها چند نمونه از ابزارهای آنالیز دیتای NGS در سیستم عامل لینوکس بوده و ابزارهای زیاد دیگری نیز وجود دارند). هر کدام از این ابزارها دارای قابلیتها و ویژگیهای خاص خود هستند و برای مراحل مختلف آنالیز دادههای NGS مورد استفاده قرار میگیرند. بنابراین کاربران NGS با استفاده از سیستم لینوکس میتوانند به راحتی ابزارهای آنالیز دیتای NGS را نصب و استفاده کنند. به عنوان خلاصه میتوان گفت که قابلیت پشتیبانی از ابزارهای مختلف مورد استفاده در آنالیز دیتای NGS، یکی از مزایای اصلی استفاده از این سیستم عامل برای کاربران NGS میباشد.
- امکانات گسترده سیستم عامل لینوکس: یکی از دلایل کاربران NGS برای استفاده از سیستم لینوکس، وجود امکانات گسترده در این سیستم عامل است. سیستم عامل لینوکس به دلیل منبع باز بودن (open source)، قابلیت انعطافپذیری و شخصیسازی بالایی را به کاربران ارائه میدهد تا پایپلاینهای مختلفی را برای تحلیل دادههای NGS خود ایجاد کنند و به واریانت عامل بیماری برسند. کاربران با استفاده از پکیجها و ابزارهای مختلف میتوانند سیستم خود را به دلخواه تنظیم و نیازهای خاص خود را برآورده کنند.
- پایداری و امنیت سیستم عامل لینوکس: سیستم لینوکس به دلیل معماری امن و مکانیزمهای امنیتی قدرتمند، گزینهی مناسبی برای کاربران NGS (Next Generation Sequencing) میباشد. کاربران با استفاده از سیستم لینوکس میتوانند از بستری پایدار و امن برای تحلیل دادههای خود استفاده کنند و از مشکلات احتمالی مانند خرابی سیستم یا دسترسی غیرمجاز به دادههای حساس جلوگیری کنند. کاربران با استفاده از لینوکس میتوانند تحلیل دادههای خود را به طور امن و مطمئن انجام داده و از امنیت دادههایشان اطمینان حاصل کنند.
- وجود انجمنهای متعدد و پشتیبانی مناسب در سیستم لینوکس: سیستم لینوکس به دلیل جامعیت و پشتیبانی گسترده از جامعه کاربران و توسعهدهندگان، انتخاب مناسبی برای کاربران NGS است. وجود انجمنهای فعال لینوکس که توسط کاربران و توسعهدهندگان قدرتمند تشکیل شده است به کاربران NGS این امکان را میدهد که در صورت بروز مشکلات یا نیاز به راهنمایی، از تجربیات و دانش آنان استفاده کنند. این عوامل باعث میشود سیستم عامل لینوکس به عنوان یک انتخاب مناسب در حوزه تحلیل دادههای NGS مورد توجه قرار گیرد.
- استفاده از خط دستور (command line) در سیستم لینوکس: استفاده از خط دستور در سیستم لینوکس برای انجام آنالیزهای NGS، به کاربران این امکان را میدهد که به صورت مستقیم و دقیق به پردازش آنالیز دادههای خود کنترل داشته باشند و با استفاده از ابزارها و دستورات، تنظیمات و پارامترهای مورد نیاز را به دلخواه تنظیم کنند. این امر به کاربران امکان میدهد تا براساس نیازهای خود، آنالیزهای دقیق و گستردهتری را انجام دهند و کنترل کاملی در پردازش آنالیزها داشته باشند. به عنوان مثال کاربران برای پیشپردازش دادههای NGS میتوانند از ابزارهای مانند FastQC برای بررسی کیفیت خوانشها استفاده کنند. کاربران با استفاده از دستورات موجود در خط دستور میتوانند فایلهای خوانشهای خود را وارد و نتایج را در یک فایل ذخیره کنند؛ سپس بعد از انجام مرحله پیشپردازش خوانشهای NGS میتوانند از ابزارهایی مانند BWA یا Bowtie برای انجام مرحله الاینمنت با ژنوم مرجع استفاده کنند. بنابراین کاربران با استفاده از دستورات میتوانند فایلهای fastq (که با ابزار fastQC ویرایش شده) و ژنوم مرجع را مشخص و عملیات الاینمنت را انجام دهند. همچنین کاربران میتوانند برای تحلیل بهتر دادههای NGS از ابزارهای مانند SAMtools یا BEDTools برای محاسبه کاوریج، شمارش خواندشها و غیره استفاده کنند. به عنوان خلاصه میتوان گفت که یکی از مزایای استفاده از خط دستور در سیستم لینوکس در اتومات کردن فرآیند آنالیز دیتای NGS میباشد.
- "دورهی "لینوکس برای آنالیز دیتای NGS" چگونه به کاربران در آنالیز NGS کمک میکند؟
- افزایش مهارت در تحلیل دادههای NGS:
کاربران NGS با شرکت در این دوره قادر خواهند بود که دادههای بیمار خود را به طور اصولی و با پارامترهای مختلف پردازش کنند. آشنایی با سیستم لینوکس و ابزارهای مربوط به آن، امکان استفاده بهینه از نرمافزارهای بیوانفورماتیک و پردازش دادههای NGS را فراهم میکند. کاربران با استفاده از دانش لینوکسی که در این دوره بدست میآورند میتوانند دادههای بیمار خود را به طور اصولی (از فایل FASTQ) و متناسب با نوع بیمار خود پردازش کنند (چون اکثر آنالیزورهایی که مسلط به سیستم لینوکس نیستند از فایل VCF که توسط آزمایشگاه و شرکتهای مختلف ایجاد شده، استفاده میکنند و دخالتی در نحوه و نوع فراخوانی واریانتها ندارند) و به نتایج دقیقتر و قابل اعتمادتری در تحلیل دادههای NGS دست یابند.
- نصب و استفاده از نرمافزارهای مختلف در تحلیل دادههای NGS :
لینوکس یک سیستم عامل قدرتمند برای نصب و استفاده از نرمافزارهای بیوانفورماتیک است. در این دوره، کاربران NGS یاد میگیرند که چگونه نرمافزارهای مختلف آنالیز دیتای NGS (مانند ابزارهای PhenIX، Exomiser و Genomiser برای فیلترینگ و اولویتبندی واریانتها) را بر روی سیستم لینوکس خود نصب و به طور بهینه از آنها استفاده کنند. این امر میتواند به بهبود کارایی و دقت آنالیز دیتای NGS کمک کند.
- نحوه استفاده از یک سیستم عامل امن و پایدار برای تحلیل دادهی NGS :
سیستم لینوکس به عنوان یک سیستم عامل مبتنی بر یونیکس (UNIX)، امنیت و پایداری بالایی دارد. کاربران NGS با آشنایی به سیستم لینوکس میتوانند دادههای حساس خود را در محیطی امن و پایدار نگهداری و آنالیز کنند. این امر بسیار با اهمیت بوده زیرا دادههای NGS اغلب اطلاعات حساسی را درباره بیماریها و ارثیات دارند.
- قابلیت گسترش و توسعه به منظور افزایش دقت آنالیز دادههای NGS :
سیستم لینوکس به دلیل متنباز بودن، قابلیت گسترش و توسعه بالایی دارد. با یادگیری سیستم لینوکس، کاربران NGS قادر خواهند بود که به راحتی ابزارها و اسکریپتهایی را برای نیازهای خاص خود توسعه دهند و بهبودهای لازم را اعمال کنند. وجود چنین امکانی به کاربران این اجازه را میدهد تا بهترین ابزارها را برای هر مرحله از آنالیز دادههای NGS خود انتخاب و اجرا کنند که این امر باعث میشود تا عملکرد و دقت آنالیز دادههای NGS بهبود یافته و نتایج بهتری ایجاد شود.
به طور خلاصه، دوره “لینوکس برای آنالیز NGS” به کاربران این امکان را میدهد که با استفاده از سیستم لینوکس، نتایج آنالیز دادههای NGS خود را بهبود دهند، امنیت آنها را تضمین کنند و بهترین نتایج آنالیز را بدست آورند.
- چه ابزارهای برای آنالیز دیتای NGS وجود دارد که تنها در سیستم لینوکس قابل اجرا هستند؟
کاربران با استفاده از سیستم لینوکس میتوانند از ابزارهای مختلفی برای آنالیز دادههای NGS (Next Generation Sequencing) استفاده کنند. تعداد محدودی از این ابزارها به خوبی در سیستمهای دیگر نیز قابل اجرا هستند اما تعداد زیادی از آنها به طور خاص برای سیستم عامل لینوکس توسعه داده شدهاند. تعدادی از ابزارهای معروف آنالیز دادههای NGS که به طور معمول در سیستم عامل لینوکس استفاده میشوند در ذیل آورده شده است. همانطور که مشاهده میکنید آموزش دستورات مختلف لینوکس در غالب کاربرد آن در NGS بیان شده است.
ابزار grep: کاربران با استفاده از دستورgrep میتوانند وجود یک الگوی را در خطوط یک فایل بررسی کنند. این دستور هر خط از فایل که دارای الگوی مورد نظر بوده را به طور کامل در خروجی نمایش میدهد. به عنوان مثال دستور زیر خطوطی از یک فایل را نمایش میدهد که توالی نوکلئوتیدی CCCCTTAAAAA در آن وجود داشته باشد.
ابزار cat و paste: کاربران با استفاده از دستورهای cat و paste میتوانند اطلاعات مختلف هر یک از خوانشهای موجود در فایل fastq را در یک خط قرار دهند تا بتوانند فیلترینگهای مختلفی را اعمال کنند.
ابزار gawk: کاربران با استفاده از ابزار gawk میتوانند یک الگوی را خطبهخط از فایل جستوجوی کنند و سپس خطوط دارای الگوی مورد نظر را در خروجی نمایش دهند.
ابزار sort: احتمال وجود توالیهای تکراری حتی با وجود شناسههای متفاوت در فایل FASTQ وجود دارد. حال کاربران میتوانند برای خارج کردن مجموعهای از خوانشهای دارای توالی یکسانی از دستور sort و سوئیچهای آن استفاده کنند.
ابزار :wget کاربران از ابزار wget میتوانند فایلهای SRA را دانلود کنند و سپس برای تبدیل آن به فرمت FASTQ از ابزار fastq-dump استفاده کنند.
ابزار FASTQC : کاربران با استفاده از ابزار FASTQC و ابزارهای دیگری هم مانند NGS QC Toolkit، FASTX Toolkit، HTQC و QC3 میتوانند برای کنترل کیفیت خوانشهای NGS استفاده کنند. این ابزار برای سیستمهای مک، ویندوز و لینوکس در دسترس میباشد.
ابزار Trimmomatic: کاربران با استفاده از ابزار Trimmomatic میتوانند برای حذف بخشهایی از خوانشهای NGS که دارای کیفیت پایین بوده (اصطلاحا اصلاح و ترمیم) استفاده کنند که این یک استراتژی رایج برای کاهش خطای در آنالیز دادههای NGS میباشد.
ابزارهای مختلف MAPPING: نتایج توالییابی WGS یا WES معمولاً منجر به ایجاد یک یا چند فایل متنی با فرمت FASTQ میشود. این فایل شامل میلیونها خوانش کوتاه، همراه با مقادیر امتیاز کیفیت برای هر نوکلئوتید است. به منظور درک این خوانشها، باید ژنوم (یا اگزوم) فرد توالییابی شده، بازسازی شود. بازسازی ژنوم یا اختصاص دادن (mapping) هر خوانش به یک موقعیت از ژنوم با دو روش de novo assembly و alignment قابل انجام است. مرحله mapping در روش de novo assembly با استفاده از خوانشهای NGS و بدون اطلاعات اضافی انجام میشود. یعنی این روش توالی فرد را بدون داشتن توالی مرجع بازسازی میکند. اما متأسفانه بهترین ابزارهای de novo assembly مانندVelvet ، ABySS وSOAPdenovo نمیتوانند ژنومهای پیچیده پستانداران را تنها با استفاده از خوانشهای کوتاه NGS بازسازی کنند. ابزارهای الاینمنت مانند Bowtie، GEM وBurrows-Wheeler Alignment (BWA) برای دادههای NGS توسعه یافتهاند. این ابزارها هر خوانش را با کل ژنوم مقایسه کرده و آن را در موقعیتی با بیشترین احتمال تطابق قرار میدهد. از معروفترین ابزارهای الاینمنت میتوان به BWA و Mosaik اشاره کرد.
ابزار liftOver: بسیاری از ابزارهای آنالیز دیتای NGS از ژنوم hg38/GRCh38 به عنوان ژنوم مرجع استفاده میکنند. اما با این حال هنوز هم تعدادی از ابزارها تنها برای ژنوم hg19/GRCh37 در دسترس هستند. بدین منظور کاربران با استفاده از ابزار liftOver میتوانند مختصاتها را با استفاده از ابزار liftOver UCSC از یک ساختار ژنوم به ساختار دیگر تبدیل کنند.
ابزار GATK: خوانشهای خامی که از ابزار الاینمنت BWA-MEM بدست میآیند، مناسب برای استفاده در آنالیزهای بعدی نبوده و به چندین مرحله پردازش نیاز دارند. پکیج GATK (Genome Analysis Toolkit) در اکثر اوقات برای فراخوانی واریانت استفاده میشود (این ابزار در فراخوانی واریانت بسیار قدرتمند و قابل انعطاف میباشد) اما در حقیقت این پکیج دارای مجموعهای از ماژولهای مختلفی است که میتواند در بهبود الاینمنت و امتیازات کیفی فایل BAM استفاده شود.
ابزار Picard: کاربران با استفاده از پکیج Picard میتوانند برای اعتبارسنجی فایلهای BAM، مرتبسازی خوانشها (sorting) بر اساس موقعیت ژنومی، علامتگذاری یا حذف خوانشهای تکراری و ایندکس کردن فایل BAM استفاده کنند. همچنین این پکیج شامل ماژولهای متعددی برای کار با دادهها و فرمتهای مختلف NGS مانند SAM/BAM و VCF بوده و تمرکز آن بیشتر در مراحل بعد از الاینمنت میباشد که به منظور آمادهسازی الاینمنتهای خام برای فراخوانی واریانت با ابزار GATK استفاده میشود. هر دو ابزار Picard و GATK در موسسه Broad توسعه یافتهاند.
ابزار BEDTools: این ابزار این اجازه را به کاربران میدهد که بتوانند فواصل ژنومی چندین فایل در فرمتهای BAM، BED، VCF و غیره را تقسیم، ادغام، شمارش و تکمیل کنند. همچنین این ابزار دارای قابلیتهای متنوع (مانند آنالیز کاوریج) و مستندات جامع آنلاین میباشد.
ابزار BCFtools: این ابزار مناسب برای کار با فایلهای VCF و فرمت باینری آن (BCF) میباشد (مانند استخراج اطلاعات هر یک از فیلدهای فایل VCF یا شمارش تعداد واریانتهای دارای معیارهای موردنظر).
ابزارهای فراخوانی واریانت: تعدادی از ابزارهای فراخوانی واریانت از نوع germline وجود دارد که میتوان به GATK، FreeBayes، SAMtools mpileup، VarScan2 و SNVer اشاره کرد.
ابزارهای حاشیهنویسی (annotation): ابزارهایی وجود دارند که اطلاعات مربوط به واریانتها مانند پیشبینی اثرات واریانت بر روی transcriptها و پروتئینهای مرتبط با آن را با سرعت و دقت بالایی برای محققان و پزشکان فراهم کنند که میتوان به Jannovar، ANNOVAR، SnpEff و VEP اشاره کرد.
ابزار MutationTaster: کاربران با استفاده از ابزار MutationTaster میتوانند به منظور پیشبینی بیماریزایی واریانتها استفاده کنند. این ابزار برخلاف ابزارهایی مانندPolyPhen ، SIFTیا PROVEAN محدود به تجزیه و تحلیل در سطح پروتئین نبوده و بلکه شامل بررسیهایی در سطح DNA مانند آنالیز محل پیرایش یا حفاظتشدگی از توالی ژنومی بین گونهای میباشد.
دوره آموزشی “لینوکس برای کاربران NGS” این دانش را به کاربران میدهد که بتوانند از ابزارهای متعدد لینوکس برای تجزیه و تحلیل دادههای NGS استفاده کنند. بسیاری از این ابزارها خصوصاً برای سیستم عامل لینوکس توسعه یافتهاند که کاربران میتوانند از آنها برای درک بهتر توالیهای ژنومیک، اعتبارسنجی نمونهها، بررسی کیفیت خوانشها، فراخوانی واریانتها، حاشیهنویسی واریانتها و پیشبینی بیماریزایی واریانتها استفاده کنند. برخی از ابزارهای معروفی که کاربران میتوانند پس از دوره لینوکس آنها را نصب و از سوئیچهای مختلف آنها استفاده کنند میتوان به grep، cat و paste، gawk، sort، wget، FASTQC، Trimmomatic، BEDTools، BCFtools، Picard، GATK و MutationTaster اشاره کرد. این دوره آموزش لینوکس برای کاربران NGS ترکیبی از شرح تئوری، نمونههای عملی و تمرینات کاربردی است.
- آیا گارانتی برای دوره "لینوکس برای آنالیز NGS" وجود دارد؟
بله، با اطمینان کامل! خرید دوره “لینوکس برای آنالیز NGS” برای شما نه تنها یک دوره آموزشی نیست، بلکه شروع یک سفر جذاب و مفید به دنیای تحلیل دیتای توالییابی NGS میباشد. برای اطمینان شما، ما یک گارانتی بازگشت وجه فراهم کردهایم. این به این معناست که شما میتوانید تا تکمیل قسمتهای جلسه دوم دوره، در صورتی که هر گونه نارضایتی داشته باشید، وجه خود را بازگردانی کنید. ما به شما این گارانتی را ارائه میدهیم چرا که مطمئنیم که محتوا و آموزشهای این دوره شما را به سمت متخصص شدن در آنالیز توالییابی NGS هدایت میکند. در نهایت، این فرصت را از دست ندهید و به دنیای جدیدی از دانش و مهارتها وارد شوید. بیایید با اطمینان و با انگیزه به یادگیری بپردازیم و به دنبال تحقق اهداف خود در تحلیل توالییابی NGS برویم!
- مخاطب هدف دوره "لینوکس برای آنالیز NGS" چه کسانی هستند؟
مخاطبان هدف دوره “لینوکس برای آنالیز NGS” عبارتند از افرادی که علاقهمند به آنالیز دادههای Next Generation Sequencing (NGS) هستند و میخواهند مهارتهای لازم برای استفاده از لینوکس در این حوزه را به دست آورند. این دوره برای محققان و دانشجویان فعال در حوزه تحقیقات ژنتیک و زیستفناوری، دانشجویان، تحلیلگران داده و هر فردی که به تحلیل دادههای NGS علاقهمند باشد، مناسب است. به علاوه، این دوره میتواند برای کارشناسان حوزههای مرتبط با پزشکی، علوم زیستی، علوم کامپیوتر، بیوانفورماتیک و تکنولوژی اطلاعات مفید واقع شود. همچنین دانشجویان دورههای مختلف علومپزشکی، بیولوژی، علوم داده، و هر کسی که در تحقیقات و پروژههای مرتبط با تحلیل دادههای ژنتیکی و زیستی مشارکت دارد نیز میتوانند از این دوره بهرهمند شوند تا مهارتهای لازم را در این حوزه به دست آورند.
به طور خلاصه مخاطبان با شرکت در این دوره،میتوانند مفاهیم لینوکس را درک کنند و از آن در تحلیل دادههای NGS استفاده کنند. این دوره به همه افرادی که به تحلیل دادههای NGS علاقهمند هستند اعم از مبتدیان و کسانی که قبلاً با لینوکس آشنا هستند، مناسب میباشد.
- سرفصلهای دوره "لینوکس برای آنالیز NGS" چه مطالبی است؟
محتوای این دوره بر اساس سرفصلهای کتاب لینوکس مهندس مهدی شاهحسینی بوده اما با این تفاوت که مثالها و تمرینات در این دوره بر اساس موضوعات مرتبط با تحلیل دادههای NGS میباشد. این دوره به شرکتکنندگان کمک میکند تا مفاهیم سیستم لینوکس را با توجه به مثالهای حوزه NGS آموزش ببینند و مهارتهای لازم برای تحلیل دادههای NGS را در این محیط کسب کنند.
- از چه منابعی برای تهیه دوره "لینوکس برای آنالیز NGS" استفاده شده است؟
منبع اصلی دوره لینوکس ما، کتاب لینوکس تالیف شده توسط مهندس مهدی شاهحسینی است که مثالها و تمرینات آن بر اساس موضوعات مرتبط با تحلیل دادههای NGS طراحی شده است. اما قابل توجه است که کتاب لینوکس مهندس مهدی شاهحسینی حاصل مطالعه و بررسی حداقل شش کتاب رفرنس (حتی برای آمادهسازی بعضی از قسمتهای مختلف دوره لینوکس از ده کتاب مرجع استفاده شده است که اطلاعات صفحات هر کدام از کتابها هم برای مطالعه به شما داده میشود) در طول چندین ماه بوده تا مسیر آموزش شما ساده و هموارتر شود. ضمنا توصیه میشود که این دوره باید همزمان با مطالعه کتاب لینوکس مهندس مهدی شاهحسینی باشد. همچنین در طول دوره، آدرس صفحات هر یک از موضوعات در کتابهای مرجع به شما گفته میشود تا با مراجعه و مطالعه آنها، درک و توانایی شما در مطالعه کتابهای مرجع شما تقویت و بهبود یابد.
- آیا برای شرکت در این دوره، نیاز به دانش قبلی در زمینه لینوکس یا NGS دارم؟
خیر، برای شرکت در این دوره نیاز به دانش قبلی در زمینه لینوکس یا NGS ندارید. این دوره برای تمامی سطوح کاربران طراحی شده و شما در طی دوره با یادگیری مفاهیم اولیه لینوکس و NGS، مهارتهای لازم برای استفاده از ابزارهای آنالیز NGS را در لینوکس خواهید آموخت.
- آیا دوره "لینوکس برای آنالیز NGS" به من این توانایی را میدهد که بتوانم از ابزارهای مختلفی که برای آنالیز دادههای NGS وجود دارند، استفاده کنم؟
بله، در این دوره شما توانایی نصب و استفاده از ابزارهای مختلف که برای آنالیز دادههای NGS کاربرد دارند را پیدا میکنید. به عنوان مثال میتوان به توانایی نحوه نصب و استفاده از سوئیچهای مختلف ابزارهایی مانند Bowtie، BWA، Samtools و GATK اشاره کرد که با یادگیری آنها شما قادر خواهید بود که تحلیل دادههای NGS خود را به صورت دقیق و کارآمد در محیط لینوکس انجام دهید.
همچنین کاربرد دستورات مختلف سیستم لینوکس (مانند cat، paste، gawk، sort، sed و غیره) بر اساس مثالهای مبتنی بر NGS به شما آموزش داده میشود. به عنوان مثال در این دوره آموزش دستورهای cat و paste طوری است که شما با استفاده از آنها میتوانید اطلاعات مختلف هر یک از خوانشهای موجود در فایل fastq را در یک خط قرار دهید تا بتوانید فیلترینگهای مختلفی را بر روی آن اعمال کنید. حال مثالی که میتوانم برای آموزش دستور grep بزنم این است که شما با استفاده از این دستور وجود یک توالی نوکلئوتیدی مانند CCCCTTAAAAA را در خطوط یک فایل بررسی میکنید و خطوط دارای الگوی در خروجی به شما نمایش داده میشوند. مثال دیگری که از آموزش دستور wget میتوانم بزنم این است که به شما آموزش داده میشود که چطور بتوانید با استفاده از این دستور فایلهای SRA را دانلود کنید و سپس بتوانید با ابزار fastq-dump برای تبدیل آن به فرمت FASTQ استفاده کنید.
به طور کلی شما در این دوره با مفاهیم اساسی لینوکس آشنا میشوید و درک عمیقی از سیستم عامل لینوکس و مزایا و قابلیتهای آن در آنالیز NGS بدست میآورید. همچنین با نحوه نصب و تنظیم محیط لینوکس، مدیریت فایل و دایرکتوری، استفاده از دستورات مهم لینوکس، پارتیشنبندی سرور برای آنالیز ngs و غیره آشنا میشوید. در اتمام این دوره شما دارای دانش و مهارتهایی هستید که میتوانید به صورت مستقل و کارآمد از ابزارهای مختلف برای مطالعه و تحلیل دادههای NGS استفاده کنید، پردازش آنالیزهای بیماران را در سیستم کنترل کنید، دسترسیهای سیستم و سرور آزمایشگاه را برای امنیت و جلوگیری از نفوذ تغییر دهید، هارد جدیدی را به سرور آزمایشگاه خود اضافه کنید و در نهایت بتوانید به بهبود فرآیند تحلیل و دستیابی به نتایج دقیقتر برسید
- آیا در پایان دوره، گواهی معتبر ارائه میشود؟
متأسفانه، در حال حاضر تمرکز خود را برای ارائه گواهی معتبر در پایان دوره نگذاشتهایم. اما ما همچنان بهبودهایی را در نظر داریم و ممکن است در آینده این امکان را فراهم کنیم.
- آیا پشتیبانی فنی برای این دوره وجود دارد؟
بله، پس از خرید دوره “لینوکس برای آنالیز NGS”، شما میتوانید هرگونه مشکل یا سوال خود را از طریق ارسال ایمیل یا تماس تلفنی (موجود در سایت) به تیم پشتیبانی انتقال دهید و سپس تیم پشتیبانی درخواست شما را برای مهندس مهدی شاهحسینی ارسال کرده و ایشون ویدئوی کاملی را بر اساس نیازهای شما ایجاد میکند تا دوستان دیگر هم از آن استفاده کنند.
- دوره "لینوکس برای آنالیز NGS" چند جلسه میباشد؟
دوره “لینوکس برای آنالیز NGS” در 8 جلسه برگزار میشود. هر جلسه شامل قسمتهای مختلفی است که به مفهوم و کاربردهای سیستم عامل لینوکس با تأکید بر حوزه NGS (توالییابی نسل جدید) پرداخته میشود. به عنوان مثال جلسه اول دوره که مطابق با محتوای فصل اول کتاب لینوکس مهندس مهدی شاهحسینی است در پنج قسمت مختلف آموزش داده شده و هر جلسه بین 20 تا 60 دقیقه میباشد. همچنین در قسمتهایی از دوره که مبحث چالشی و کمی پیچیده باشد سپس به شما منابع خوبی داده میشود که میتواند به درک بهتر شما کمک کند. با اتمام دوره “لینوکس برای آنالیز NGS”، شما میتوانید مفاهیم و مهارتهای لازم در زمینه لینوکس و کاربردهای آن در توالییابی NGS را درک و به کار ببرید.
اهمیت استفاده از سیستم لینوکس برای آنالیز NGS
یکی از دلایل کاربران NGS برای استفاده از سیستم لینوکس، وجود امکانات گسترده در این سیستم عامل است. سیستم عامل لینوکس به دلیل منبع باز بودن (open source)، قابلیت انعطافپذیری و شخصیسازی بالایی را به کاربران ارائه میدهد تا پایپلاینهای مختلفی را برای تحلیل دادههای NGS خود ایجاد کنند و به واریانت عامل بیماری برسند. علاوه بر این، کاربران با استفاده از سیستم لینوکس، قادر خواهند بود که تحلیل دادههای خود را به طور امن و مطمئن انجام داده و از امنیت دادههایشان اطمینان حاصل کنند.
نکته) کاربران با استفاده از سیستم لینوکس میتوانند به راحتی ابزارهای آنالیز دیتای NGS را نصب و استفاده کنند؛ در عین حال از امکانات گستردهای مانند پایداری، امنیت، وجود انجمنهای متعدد و قابلیت کنترل بیشتر بر روی پردازش آنالیزهای خود هم نیز استفاده کنند.
بسیاری از ابزارهای کاربردی در آنالیز دیتای NGS خصوصاً برای سیستم عامل لینوکس توسعه یافتهاند که کاربران میتوانند از آنها برای درک بهتر توالیهای ژنومیک، اعتبارسنجی نمونهها، بررسی کیفیت خوانشها، فراخوانی واریانتها، حاشیهنویسی واریانتها و پیشبینی بیماریزایی واریانتها استفاده کنند.
بعد از اتمام دورهی آموزش لینوکس برای کاربران NGS، کاربران قادر خواهند بود تا ابزارهای معروفی مانند grep، cat، paste، gawk، sort، wget، FASTQC، Trimmomatic، BEDTools، BCFtools، Picard، GATK، SAMtools، BEDTools و MutationTaster را نصب کرده و از سوئیچهای مختلف این ابزارها استفاده کنند.
اهداف دوره لینوکس برای آنالیز NGS
دوره “لینوکس برای آنالیز NGS” به شرکتکنندگان کمک میکند تا با استفاده از مثالهای مرتبط با حوزه NGS، دستورات سیستم لینوکس را آموزش ببینند و مهارتهای لازم برای تحلیل دادههای NGS را در این محیط کسب کنند. همچنین یکی از تواناییهایی که کاربران با شرکت در این دوره بدست میآورند این است که میتوانند بهترین ابزارها را برای هر مرحله از آنالیز دادههای NGS انتخاب و اجرا کنند؛ که این امر باعث میشود تا عملکرد و دقت آنالیز دادههای NGS بهبود یافته و کاربران بهترین نتایج حاصل شود.
به طور خلاصه میتوان گفت که مثالها و تمرینات این دوره بر اساس موضوعات مرتبط با تحلیل دادههای NGS طراحی شدهاند. به عنوان مثال در این دوره، آموزش دستورهای cat و paste به شما ارائه میشود تا بتوانید با استفاده از آنها، اطلاعات مختلف هر یک از خوانشهای موجود در فایل fastq را در یک خط قرار داده و فیلترینگهای مختلفی را بر روی آن اعمال کنید. همچنین یک مثال دیگر که میتوانم برای آموزش دستور grep بیاورم، استفاده از این دستور برای بررسی وجود یک توالی نوکلئوتیدی مانند CCCCTTAAAAA در خطوط یک فایل است و خطوطی که الگوی مشخص شده را دارا هستند، در خروجی نمایش داده میشوند.
نکته) یکی از مزایای دیگر استفاده از خط دستور در سیستم لینوکس در اتومات کردن فرآیند آنالیز دیتای NGS میباشد.
مثالهایی از ابزارهایی که در آنالیز دیتای NGS مورد استفاده قرار میگیرند و مبتنی بر لینوکس هستند
دوره آموزشی “لینوکس برای کاربران NGS” این دانش را به کاربران میدهد که بتوانند از ابزارهای مختلفی که برای آنالیز دیتای NGS کاربرد دارند، استفاده کنند. تعدادی از این ابزارهای در زیر برای شما آورده شده است.
ابزار Trimmomatic: کاربران با استفاده از ابزار Trimmomatic میتوانند برای حذف بخشهایی از خوانشهای NGS که دارای کیفیت پایین بوده (اصطلاحا اصلاح و ترمیم) استفاده کنند که این یک استراتژی رایج برای کاهش خطای در آنالیز دادههای NGS میباشد.
ابزارهای مختلف MAPPING: نتایج توالییابی WGS یا WES معمولاً منجر به ایجاد یک یا چند فایل متنی با فرمت FASTQ میشود. این فایل شامل میلیونها خوانش کوتاه، همراه با مقادیر امتیاز کیفیت برای هر نوکلئوتید است. به منظور درک این خوانشها، باید ژنوم (یا اگزوم) فرد توالییابی شده، بازسازی شود. بازسازی ژنوم یا اختصاص دادن (mapping) هر خوانش به یک موقعیت از ژنوم با دو روش de novo assembly و alignment قابل انجام است. مرحله mapping در روش de novo assembly با استفاده از خوانشهای NGS و بدون اطلاعات اضافی انجام میشود. یعنی این روش توالی فرد را بدون داشتن توالی مرجع بازسازی میکند. اما متأسفانه بهترین ابزارهای de novo assembly مانندVelvet ، ABySS وSOAPdenovo نمیتوانند ژنومهای پیچیده پستانداران را تنها با استفاده از خوانشهای کوتاه NGS بازسازی کنند. ابزارهای الاینمنت مانند Bowtie، GEM وBurrows-Wheeler Alignment (BWA) برای دادههای NGS توسعه یافتهاند. این ابزارها هر خوانش را با کل ژنوم مقایسه کرده و آن را در موقعیتی با بیشترین احتمال تطابق قرار میدهد. از معروفترین ابزارهای الاینمنت میتوان به BWA و Mosaik اشاره کرد.
ابزار GATK: خوانشهای خامی که از ابزار الاینمنت BWA-MEM بدست میآیند، مناسب برای استفاده در آنالیزهای بعدی نبوده و به چندین مرحله پردازش نیاز دارند. پکیج GATK (Genome Analysis Toolkit) در اکثر اوقات برای فراخوانی واریانت استفاده میشود (این ابزار در فراخوانی واریانت بسیار قدرتمند و قابل انعطاف میباشد) اما در حقیقت این پکیج دارای مجموعهای از ماژولهای مختلفی است که میتواند در بهبود الاینمنت و امتیازات کیفی فایل BAM استفاده شود.
ابزار Picard: کاربران با استفاده از پکیج Picard میتوانند برای اعتبارسنجی فایلهای BAM، مرتبسازی خوانشها (sorting) بر اساس موقعیت ژنومی، علامتگذاری یا حذف خوانشهای تکراری و ایندکس کردن فایل BAM استفاده کنند. همچنین این پکیج شامل ماژولهای متعددی برای کار با دادهها و فرمتهای مختلف NGS مانند SAM/BAM و VCF بوده و تمرکز آن بیشتر در مراحل بعد از الاینمنت میباشد که به منظور آمادهسازی الاینمنتهای خام برای فراخوانی واریانت با ابزار GATK استفاده میشود. هر دو ابزار Picard و GATK در موسسه Broad توسعه یافتهاند.
ابزار BEDTools: این ابزار این اجازه را به کاربران میدهد که بتوانند فواصل ژنومی چندین فایل در فرمتهای BAM، BED، VCF و غیره را تقسیم، ادغام، شمارش و تکمیل کنند. همچنین این ابزار دارای قابلیتهای متنوع (مانند آنالیز کاوریج) و مستندات جامع آنلاین میباشد.
ابزار BCFtools: این ابزار مناسب برای کار با فایلهای VCF و فرمت باینری آن (BCF) میباشد (مانند استخراج اطلاعات هر یک از فیلدهای فایل VCF یا شمارش تعداد واریانتهای دارای معیارهای موردنظر).
ابزارهای فراخوانی واریانت: تعدادی از ابزارهای فراخوانی واریانت از نوع germline وجود دارد که میتوان به GATK، FreeBayes، SAMtools mpileup، VarScan2 و SNVer اشاره کرد.
ابزارهای حاشیهنویسی (annotation): ابزارهایی وجود دارند که اطلاعات مربوط به واریانتها مانند پیشبینی اثرات واریانت بر روی transcriptها و پروتئینهای مرتبط با آن را با سرعت و دقت بالایی برای محققان و پزشکان فراهم کنند که میتوان به Jannovar، ANNOVAR، SnpEff و VEP اشاره کرد.
ابزار :wget کاربران از ابزار wget میتوانند فایلهای SRA را دانلود کنند و سپس برای تبدیل آن به فرمت FASTQ از ابزار fastq-dump استفاده کنند.
ابزار grep: کاربران با استفاده از دستورgrep میتوانند وجود یک الگوی را در خطوط یک فایل بررسی کنند. این دستور هر خط از فایل که دارای الگوی مورد نظر بوده را به طور کامل در خروجی نمایش میدهد. به عنوان مثال دستور زیر خطوطی از یک فایل را نمایش میدهد که توالی نوکلئوتیدی CCCCTTAAAAA در آن وجود داشته باشد.
دوره آموزشی “لینوکس برای کاربران NGS” این دانش را به کاربران میدهد که بتوانند از ابزارهای متعدد لینوکس برای تجزیه و تحلیل دادههای NGS استفاده کنند. بسیاری از این ابزارها خصوصاً برای سیستم عامل لینوکس توسعه یافتهاند که کاربران میتوانند برای آنالیزهای خود استفاده کنند.
مخاطبان دوره لینوکس برای آنالیز NGS
مخاطبان هدف دوره “لینوکس برای آنالیز NGS” عبارتند از افرادی که علاقهمند به آنالیز دادههای Next Generation Sequencing (NGS) هستند و میخواهند مهارتهای لازم برای استفاده از لینوکس در این حوزه را به دست آورند. این دوره برای محققان و دانشجویان فعال در حوزه تحقیقات ژنتیک و زیستفناوری، دانشجویان، تحلیلگران داده و هر فردی که به تحلیل دادههای NGS علاقهمند باشد، مناسب است.
علاوه بر این، دوره “لینوکس برای آنالیز NGS” میتواند برای کارشناسان حوزههای مرتبط با پزشکی، علوم زیستی، علوم کامپیوتر، بیوانفورماتیک و تکنولوژی اطلاعات مفید واقع شود. همچنین دانشجویان دورههای مختلف علومپزشکی، بیولوژی، علوم داده، و هر کسی که در تحقیقات و پروژههای مرتبط با تحلیل دادههای ژنتیکی و زیستی مشارکت دارد نیز میتوانند از این دوره بهرهمند شوند تا مهارتهای لازم را در این حوزه به دست آورند.
منابع دوره لینوکس برای آنالیز NGS
منبع اصلی دوره “لینوکس برای آنالیز NGS” کتاب لینوکس تالیف شده توسط مهندس مهدی شاهحسینی است که مثالها و تمرینات آن بر اساس موضوعات مرتبط با تحلیل دادههای NGS طراحی شده است. اما قابل توجه است که کتاب لینوکس مهندس مهدی شاهحسینی حاصل مطالعه و بررسی حداقل شش کتاب رفرنس (حتی برای آمادهسازی بعضی از قسمتهای مختلف دوره لینوکس از ده کتاب مرجع استفاده شده است که اطلاعات صفحات هر کدام از کتابها هم برای مطالعه به شما داده میشود) در طول چندین ماه بوده تا مسیر آموزش شما ساده و هموارتر شود.
دانلود سرفصلهای کتاب لینوکس (lpic1) مهندس مهدی شاهحسینی
عدم نیاز به دانش قبلی برای شرکت در دوره لینوکس برای آنالیز NGS
برای شرکت در دوره “لینوکس برای آنالیز NGS”، نیاز به دانش قبلی در زمینه لینوکس یا NGS ندارید. این دوره برای تمامی سطوح کاربران طراحی شده و شما در طی دوره با یادگیری مفاهیم اولیه لینوکس و NGS، مهارتهای لازم برای استفاده از ابزارهای آنالیز NGS را در لینوکس خواهید آموخت.
در اتمام این دوره شما دارای دانش و مهارتهایی هستید که میتوانید به صورت مستقل و کارآمد از ابزارهای مختلف برای مطالعه و تحلیل دادههای NGS استفاده کنید، پردازش آنالیزهای بیماران را در سیستم کنترل کنید، دسترسیهای سیستم و سرور آزمایشگاه را برای امنیت و جلوگیری از نفوذ تغییر دهید، هارد جدیدی را به سرور آزمایشگاه خود اضافه کنید و در نهایت بتوانید به بهبود فرآیند تحلیل و دستیابی به نتایج دقیقتر برسید.
تعداد جلسات دوره لینوکس برای آنالیز NGS
دوره “لینوکس برای آنالیز NGS” در 8 جلسه کلی برگزار میشود و هر جلسه شامل قسمتهای مختلفی است که به مفهوم و کاربردهای سیستم عامل لینوکس با تأکید بر حوزه NGS (توالییابی نسل جدید) پرداخته میشود. به عنوان مثال جلسه اول دوره که مطابق با محتوای فصل اول کتاب لینوکس مهندس مهدی شاهحسینی است در پنج قسمت مختلف آموزش داده شده و هر جلسه بین 20 تا 60 دقیقه میباشد.
نقد و بررسیها
هنوز بررسیای ثبت نشده است.