واگرایی از شاخص MCD

ساخت وبلاگ

1. آشنایی با MKT استاندارد و عمومی

مقایسه الگوهای پلی مورفیسم و واگرایی یکی از قدرتمندترین روشها برای بررسی انتخاب در سطح DNA است. آزمون مک دونالد-کریتمن تقریباً یک گام ضروری برای پیروی از این رویکرد است. این میزان تغییر در یک گونه را با واگرایی بین گونه ها در دو نوع سایت مقایسه می کند که یکی از آنها از نظر خنثی است و به عنوان مرجع برای تشخیص انتخاب در نوع دیگر سایت استفاده می شود. همانطور که این آزمایش در ابتدا شرح داده شد (مک دونالد و کریتمن 1991) ، این سایت ها در یک منطقه برنامه نویسی مترادف (بی طرفانه خنثی) و غیر مترادف بودند. با این حال ، آزمایش برای انتخاب به طور بالقوه می تواند به هر دو نوع سایت گسترش یابد ، به شرط آنکه فرض شود یکی از آنها به صورت خنثی تکامل می یابد و هر دو نوع سایت در ژنوم مرتبط هستند. علاوه بر این ، از دلیل منطقی آزمون می توان برای تجزیه و تحلیل چندین مکان در ژنوم به طور همزمان استفاده کرد ، به شرط استفاده از آزمایشات آماری چند تمرکز مناسب.

وب سایت استاندارد و عمومی MKT اولین منبع مبتنی بر وب است که در آن کاربران می توانند با استفاده از رابط های مختلف ، آزمایش های استاندارد یا تعمیم یافته مک دونالد-کریتمن را انجام دهند:

MKT استاندارد به کاربران امکان می دهد تا با مقایسه دو نوع سایت برنامه نویسی ، مانند تغییرات مترادف و غیر مترادف در یک منطقه برنامه نویسی ، جداول احتمالی 2x2 را ایجاد کنند.

MKT پیشرفته یک تست استاندارد است که امکان مقایسه هر دو منطقه مرتبط در ژنوم ، از جمله DNA غیر کد کننده را فراهم می کند. توجه داشته باشید که برای تجزیه و تحلیل ، این دو منطقه باید در ژنوم کاملاً مرتبط باشند. کلاس خنثی انتخاب شده با هر نوع سایت دیگری برای آزمایش برای انتخاب مقایسه می شود.

MCT Multi-Locus رابط کاربری است که کاربران می توانند چندین منطقه برنامه نویسی را در یک MKT چند موضعی واحد تجزیه و تحلیل کنند.

صفحه اصلی پارامترهای حاوی پارامترهای قابل انتخاب است که برای هر یک از سه رابط مجزا برای وب سایت MKT اعمال می شود.

  1. صفحه اصلی ، که از آن می توانید داده های خود را وارد کنید.
  2. صفحه راهنما (این صفحه).
  3. صفحه مثال ، که شامل یک نمونه از پیش محصور برای هر نوع آزمایش است.
  4. صفحه تماس با ما ، جایی که می توانید اطلاعات مربوط به نویسندگان را پیدا کنید.

منوی منابع حاوی پیوندهای سریع به برخی از منابع مرتبط است:

بانکهای اطلاعاتی با برآورد MKT (پایگاه داده های ثانویه با برآورد تنوع ایجاد شده با PDA)

  • پایگاه داده DPDB: پایگاه داده چندشکلی مگس سرکه شامل تمام توالی های چندشکلی در جنس مگس سرکه است (Casillas et al. 2005; Casillas et al. 2007).
  • پایگاه داده MamPol: شامل تمام توالی های چندشکلی در گونه های پستانداران (به استثنای انسان) است (Egea et al. 2007).

ابزارهای تحلیل توالی

  • ( Pipeline Diversity Analysis ): خط لوله ای که تنوع ژنتیکی را در مناطق عملکردی مختلف از توالی های GenBank تخمین می زند (Casillas and Barbadilla 2004; Casillas and Barbadilla 2006).

2. رابط های وب

استاندارد MKT

NAME OF THE ANALYSIS: نامی را برای شناسایی تحلیل فعلی وارد کنید.

( 1 ) انواع سایت برای تجزیه و تحلیل : در اینجا انواع سایت هایی را که می خواهید تجزیه و تحلیل کنید انتخاب کنید. آزمون مک دونالد-کریتمن کلاسیک تغییرات مترادف و غیر مترادف را در منطقه کدگذاری (به طور پیش فرض انتخاب شده) مقایسه می کند، اما می توانید تجزیه و تحلیل را انتخاب کنید:

برای یک تجزیه و تحلیل تنها می توانید آن دسته از سایت هایی را انتخاب کنید که متقابلاً منحصر به فرد هستند، به عنوان مثال:

سایت های مترادف را فقط می توان با سایت های غیر مترادف یا سایت های غیر منحط مقایسه کرد.

سایت های غیر مترادف را فقط می توان با سایت های مترادف یا سایت های منحط چهارگانه مقایسه کرد.

سایت های منحط چهارگانه را فقط می توان با سایت های غیر مترادف یا سایت های دوگانه و/یا غیر منحط مقایسه کرد.

سایت های دژنره دو برابری را فقط می توان با سایت های چهارگانه و/یا غیر دژنره مقایسه کرد.

سایت های غیر منحط را فقط می توان با سایت های مترادف یا سایت های منحط چهار و یا دو برابر مقایسه کرد.

( 2 ) SET AS NEUTRAL: در اینجا انتخاب کنید که کدام کلاس از سایت به عنوان مرجع خنثی در نظر گرفته شود. در آزمون مک‌دونالد کریتمن کلاسیک، تغییرات غیر مترادف با تغییرات مترادف مقایسه می‌شوند، که دومی مرجع خنثی است. با این حال، اگر از رابط پیشرفته MKT برای مقایسه یک ژن با شبه آن استفاده می کنید، می خواهید دنباله شبه ژن را به عنوان مرجع خنثی انتخاب کنید. همچنین می‌توانید سایت‌های منحط چهارگانه یک منطقه کدگذاری را با یک منطقه غیرکدکننده نزدیک مقایسه کنید. در این صورت احتمالاً می خواهید سایت های منحط چهارگانه را به عنوان مرجع خنثی انتخاب کنید.

. اگر توالی ها از قبل تراز شده باشند ، قالب باید در Fasta باشد (یا در صورت تراز کردن-Fasta هم تراز شده). شما باید برای حداقل یک گونه (که از آن پلی مورفیسم محاسبه می شود) و حداقل 1 دنباله در گونه های دیگر (برای برآورد واگرایی) وارد کنید. با این حال ، شما همچنین می توانید داده های پلی مورفیسم را برای هر دو گونه درج کنید ، و در این حالت پلی مورفیسم با هم اضافه می شود. همچنین می توانید توالی ها را در دو پرونده Fasta جداگانه بارگذاری کنید.

( 4 ) ANNOTATIONS: When you enter the sequences in the corresponding species box, the annotation box is automatically filled as follows: 'Sequence X > 1..n' where X is the sequence number (following the order in the species box) and n is the sequence length. You can modify these annotations in order to specify which part of each sequence you want to include in the analysis. If you uploaded a file with the sequences, then you have to enter the annotations manually. For each sequence enter a line as follows: ' Sequence X > n..m ', where X is the number of the sequence and the expression n..m defines the bases range that will be analyzed (if you want to join different parts of the sequence you can enter ' Sequence X >n.. m ، o.. p ، q.. r '، جایی که o.. p و q.. r دامنه های پایه های مختلف را در دنباله مشخص می کنند).

MKT پیشرفته

فرم پیشرفته MKT مشابه MKT استاندارد است (و روش آماری برای محاسبات دقیقاً یکسان است) اما در اینجا می توانید دو منطقه جداگانه را که می توانند کدگذاری یا غیر کدگذاری باشند ، تجزیه و تحلیل کنید. توجه داشته باشید که برای تجزیه و تحلیل ، این دو منطقه باید در ژنوم کاملاً مرتبط باشند.

دو جعبه مشابه جعبه در فرم استاندارد MKT وجود دارد که در آن می توانید دو منطقه مختلف را وارد کنید.

در هر کادر پیدا خواهید کرد:

نام منطقه برای مقایسه: نام منطقه را وارد کنید.

نوع سایت هایی برای تجزیه و تحلیل: انواع سایتهایی را که می خواهید تجزیه و تحلیل کنید انتخاب کنید. در این حالت ، ابتدا باید تعیین کنید که آیا توالی های شما کدگذاری یا غیر کدگذاری هستند یا خیر. اگر آنها در حال کدگذاری هستند ، باید انتخاب کنید که کدام کلاس از سایت هایی را که می خواهید تجزیه و تحلیل کنید (به بالا مراجعه کنید). در این شکل ، یک دسته جدید وجود دارد که تعداد تغییرات مترادف و غیر مترادف را به طور کلی اضافه می کند. به یاد داشته باشید که فقط مقایسه هایی که شامل دو نوع سایت منحصر به فرد است ، مجاز است و این دسته را نمی توان با هر نوع سایت دیگری از همان منطقه مقایسه کرد ، زیرا سایت ها به طور متقابل منحصر به فرد نیستند.

به صورت خنثی تنظیم کنید: کلاس سایت مورد نظر خود را به عنوان مرجع خنثی تعیین کنید (به بالا مراجعه کنید). توجه داشته باشید که فقط یک کلاس خنثی مجاز به انتخاب در منطقه اول یا دوم خواهد بود و این کلاس خنثی انتخاب شده با هر کلاس دیگر از سایت های انتخاب شده از دو منطقه مقایسه می شود.

توالی ها را بچسبانید: توالی های خود را با فرمت Fasta چسبانده یا بارگذاری کنید (به بالا مراجعه کنید).

حاشیه نویسی: در اینجا یادداشت های مربوط به مبانی سکانس های خود را که می خواهید تجزیه و تحلیل کنید بنویسید (به بالا مراجعه کنید).

MKT چند چراغ

در اینجا می توانید چندین مکان را در یک MKT چند فوکوس مورد تجزیه و تحلیل قرار دهید. شما می توانید فقط مناطق کد نویسی را به صورت بسیار شبیه به MKT استاندارد یا کدگذاری و/یا غیر کد کننده به صورت بسیار شبیه به MKT پیشرفته تجزیه و تحلیل کنید ، اما در هر دو مورد توالی باید در یک قالب جدید مبتنی بر Fasta وارد شوند کهاز داده های چند چراغ پشتیبانی کنید.

این فرمت جدید مبتنی بر Fasta شامل دو نوع مختلف از خطوط عنوان است:

Lines starting with '>>'حاوی هر نام مکان است و برای جدا کردن توالی از هر مکان استفاده می شود.

Lines starting with '>'عناوین عادی برای توالی Fasta در یک مکان هستند

بنابراین توالی ها باید به دنبال یک دستور خاص ، به عنوان مثال: به عنوان مثال: معرفی شوند.

>>Name_of_locus_1 >Sequence_1 actactactacta. >Sequence_2 actactactacta. >دنباله_3 actactactacta.

>>Name_of_locus_2 >Sequence_1 ggggcgcgtat. >دنباله_2 GGGGCGCGTAT.

لطفاً توجه داشته باشید که هر نام مکان در گونه 1 بایددقیقاً مطابقت داشته باشدنام مکان در گونه 2 (نام آنها حساس به مورد است!) ، و اینترتیب محل ورودیباید در هر دو گونه یکسان باشد. به شکلی که می توانید مناطق غیر کدگذاری را نیز تجزیه و تحلیل کنید ، نام مکان باید دقیقاً برای این دو گونه بلکه برای دو منطقه مورد تجزیه و تحلیل مطابقت داشته باشد.

پارامترهای دیگر را در بالا مشاهده کنید.

پارامترهای اصلی

سرانجام ، مجموعه ای از پارامترهای اصلی برای هر یک از فرم های توضیح داده شده در بالا اعمال می شود:

(1) انواع فرکانس پایین را حذف کنید: می توانید انواع مختلفی را تحت فرکانس آستانه معین (یعنی پلی مورفیسم های نادر) حذف کنید.

(2) کد ژنتیکی را انتخاب کنید: کدهای ژنتیکی موجود شامل (از NCBI):

کد جهانی

کد میتوکندری مهره دار.

کد میتوکندری مخمر: برای Saccharomyces cerevisiae ، Candida glabrata ، Hansemula satuus و kluyveromyces thermotolerans.

کد ، تک یاخته و کد میتوکندری و کد مایکوپلاسما/اسپیروپلاسما: برای mollicutes (entomoplasmatales and mycoplasmatales) ، قارچ ها (emericella nidulans ، neurospora crassa ، podospora ، anserina ، acremonium ، parapsilosis.، Aspergillus amstelodami ، claviceps purpurea ، cochliobolus heterostrophus) ، سایر یوکاریوت ها (گیگارتینال ها در میان جلبک های قرمز ، و تک یاخته های تریپانوزوما بروس ، سکه و پارامسیوم tarentolae ، تتراوریلیا ، tetahymaMena perirafifiumis and plaistiummena perirafiformena and plaziuma

کد میتوکندری بی مهرگان: برای نماتدا (Ascaris و Caenorhabditis) ، Mollusca (Bivalvia و Polyplacophora) ، Arthropoda/Crustacea (Arthropda) و Arthropoda/Insecta (Drosophila ، Cloonusta Migratoria و Apis mellifera).

کد هسته ای Ciliate ، Dasycladacean و Hexamita: برای مژگانی (Oxytricha و Styleonychia ، Paramecium ، tetrahymena ، oxytrichidae و glaucoma chattoni) ، dasycladaceae (acetabularia and batophora) ، و diplomonadida (hexamita ، diplomonada (hexamonada)

کد میتوکندری Echinoderm و Flatworm: برای Asterozoa (Starfishes) ، Echinozoa (جوجه های دریایی) و Rhabditophora در میان Platyhelmintes.

کد هسته ای euplotid: برای ciliata (euplotidae).

کد پلاستیکی باکتریایی و برنامه: برای باکتری ها ، Archaea ، ویروس های پروکاریوتی و پروتئین های کلروپلاست.

کد هسته ای مخمر جایگزین: برای کاندیدا آلبیکنس ، کاندیدا Cylindracea ، Candida Melibiosica ، Candida Parapsilosis و Candida Rugosa.

کد میتوکندری Ascidian: برای یک نمونه فیلوژنتیک متنوع از تونیک ها (Urochordata).

کد میتوکندری کرم جایگزین جایگزین: برای platyhelminthes (کرم های مسطح).

قانون هسته ای بلغاریسم: برای blepharisma.

کد میتوکندری کلروفیسین: برای کلروفیسیا و Spizellomyces punctatus.

کد میتوکندری Trematode: برای Trematoda.

کد میتوکندری scenedesmus: برای scenedesmus obliquus.

کد میتوکندری Thraustochytrium: برای Thraustochytrium aureum.

(3) توالی های تراز: اگر این کادر انتخاب انتخاب شود ، توالی ها به دنبال پارامترهای انتخاب شده با تجزیه و تحلیل هماهنگ می شوند.

(4) ترتیب تراز: شما همچنین می توانید ترتیب تراز را انتخاب کنید:

گونه ها به طور مستقل ، سپس به آن بپیوندید: توالی از گونه های 1 و 2 به طور مستقل تراز می شوند و سپس این دو تراز به هم می پیوندند. این گزینه هنگامی توصیه می شود که توالی ها واگرا هستند.

تمام توالی ها در همان زمان: تمام توالی های گونه های 1 و 2 در یک مرحله واحد با هم تراز می شوند.

(5) برنامه تراز را انتخاب کنید: می توانید از بین دو برنامه تراز انتخاب کنید: عضله (Edgar 2004) یا Clustalw2. 0 (لارکین و همکاران 2007).

(6) پارامترها را تنظیم کنید: پارامترهای مربوط به هر برنامه تراز را تنظیم کنید:

فرمت خروجی

ترازها را می توان در این قالب ها بدست آورد: clustalw ، fasta ، html یا phylip متوالی. اگر می خواهید بیش از یک قالب را انتخاب کنید از Ctrl یا Ctrl+Alt استفاده کنید.

یک فایل ورود به سیستم ایجاد کنید

اگر می خواهید یک پرونده ورود به سیستم دریافت کنید ، این کادر انتخاب را انتخاب کنید. این پرونده حاوی اطلاعاتی در مورد زمان شروع و پایان برنامه ، هرگونه پیام و هشدارهای خطایی است. این همچنین حاوی خط فرمان است که اجرا شده است ، پارامترهای داخلی و پیام های پیشرفت.

می توانید درخت حاصل از تکرار اول یا دوم را بدست آورید.

Instead of aligning sequences in pairs, the program looks for "diagonals" (short regions of high similarity between two sequences). When this option is activated, the accuracy decreases but the speed increases. This option is recommended for large groups of related sequences. With ' diags ' -> diagonals are always activated. With ' diags1 ' -> diagonals are activated for the first iteration only. The main objective of the first iteration is to rapidly construct a multiple alignment to improve the distance matrix, but it is not very sensitive to the quality of the alignment. With ' diags2 ' ->مورب ها فقط برای تکرار دوم فعال می شوند. هدف از تکرار دوم این است که بهترین تراز چندگانه مترقی را به بهترین شکل ممکن انجام دهید.

حداکثر درختان

This is the maximum number of new trees that are created in the second iteration. If the value is >1 (مقدار پیش فرض) ، این روند تکرار می شود تا زمانی که به نتیجه همگرا یا به شماره مشخص شده برسد.

حداکثر تکرارها

با کاهش این مقدار ، دقت نیز کاهش می یابد اما سرعت افزایش می یابد. این می تواند از 1 تا 16 باشد. هنگامی که 1-3 انتخاب شد ، این برنامه تعداد تکرارهای انتخاب شده را انجام می دهد. برای مقادیر ≥ 4 ، این برنامه تا زمانی که به نتیجه همگرا یا به تعداد مشخص شده برسد ، تکرار می شود. برای ترازهای عظیم ، 2 توصیه می شود.

تراز سریع زوج

حساسیت سرعت ترازهای اولیه را کنترل کنید.

اندازه قطعه دقیقاً مطابق که استفاده می شود. برای DNA می تواند از 1 تا 4 باشد. این افزایش را برای افزایش سرعت افزایش دهید. برای بهبود حساسیت کاهش می یابد.

طول پنجره

تعداد مورب های اطراف هر مورب "بالا" که در نظر گرفته می شود. کاهش برای سرعت ؛برای حساسیت بیشتر افزایش می یابد.

نمرات شباهت ممکن است به عنوان نمرات خام (تعداد باقیمانده های یکسان منهای "مجازات شکاف" برای هر شکاف) یا به عنوان درصد درصد بیان شود. اگر توالی ها از طول بسیار متفاوتی برخوردار باشند ، نمرات درصد بیشتر حس می کنند.

مورب های برتر

تعداد بهترین موربها در نقشه ماتریس نقطه ای خیالی که در نظر گرفته می شود. برای افزایش سرعت کاهش می یابد. افزایش برای بهبود حساسیت.

تعداد باقیمانده های تطبیق که باید برای معرفی شکاف پیدا شود. این باید بزرگتر از اندازه K-Tuple باشد. این تأثیر کمی در سرعت یا حساسیت دارد.

تراز چندگانه

شکاف ها را در ترازهای چندگانه نهایی کنترل کنید.

این کار را برای تشویق شکاف در هر اندازه کاهش دهید. آن را افزایش دهید تا آنها را دلسرد کنید. شکاف های ترمینال مانند سایرین مجازات می شوند به جز انتخاب شکاف های نهایی. مراقب باشید که این کار را خیلی کوچک کنید (تقریباً 5 یا بیشتر) ؛اگر پنالتی خیلی کوچک باشد ، برنامه ممکن است ترجیح دهد هر دنباله مقابل یک شکاف طولانی را تراز کند.

بدون شکاف پایان

در اینجا می توانید اگر می خواهید شکاف های ترمینال جریمه شود یا خیر ، انتخاب کنید.

گسترش شکاف

این کار را برای تشویق شکاف های طولانی تر کاهش دهید. آن را افزایش دهید تا آنها را کوتاه کنید. شکاف های ترمینال مانند سایرین مجازات می شوند. مراقب باشید که این کار را خیلی کوچک کنید (تقریباً 5 یا بیشتر) ؛اگر پنالتی خیلی کوچک باشد ، برنامه ممکن است ترجیح دهد هر دنباله مقابل یک شکاف طولانی را تراز کند.

فاصله فاصله

مجازات برای فاصله بین شکاف ها. شکاف هایی که کمتر از این فاصله از هم فاصله دارند ، بیش از سایر شکاف ها مجازات می شوند. این مانع از شکاف های نزدیک نمی شود. این امر باعث می شود آنها کمتر شایع شوند و ظاهر بلوک مانند تراز را ارتقا بخشند.

وزن انتقال

وزن بین 0 تا 1 را به انتقال می دهد. وزن 0 به این معنی است که انتقال به عنوان عدم تطابق نمره می شود ، وزن 1 به انتقال نمره مسابقه می دهد. برای توالی های DNA از راه دور ، وزن باید نزدیک به 0 باشد ، برای توالی های نزدیک به هم می توان برای تعیین نمره بالاتر مفید بود.

توالی واگرا را به تأخیر بیندازید

سوئیچ تراز کردن تراز بیشترین توالی های مرتبط را تا زمانی که پس از نزدیکترین توالی های مرتبط با آن تراز شوند ، تأخیر می کند. تنظیم میزان درصد هویت مورد نیاز برای تأخیر در افزودن یک دنباله را نشان می دهد. توالی هایی که نسبت به این سطح با هر سکانس دیگر یکسان هستند ، بعداً تراز می شوند.

با درخت می توانید در هر مرحله از تراز مترقی تکرار کنید. با تراز می توانید فقط در تراز نهایی تکرار کنید.

تعداد تکرارها

تعداد پیش فرض تکرارها 3 است. اگر این مقدار را افزایش دهید ، برنامه تا زمانی که نمره o را همگرا شود تا حداکثر تعداد تکرارها حاصل شود ، تکرار می شود.

فرمت خروجی

ترازها را می توان در یکی از این قالب ها بدست آورد: قلاب با اعداد ، قلاب بدون عدد ، GCG ، GDE ، Phylip ، PIR یا Nexus.

3. تجزیه و تحلیل توالی ها

توالی برنامه نویسی کدون توسط کدون مورد تجزیه و تحلیل قرار می گیرد. اگر یک کدون در هر یک از سکانس ها شکاف داشته باشد ، این کدون کاملاً از تجزیه و تحلیل خارج می شود. اگر یک کدون یک کدون توقف باشد ، شمارش ها به گونه ای انجام می شود که انگار اسید آمینه دیگری است ، اما یک هشدار در صفحه خروجی نشان داده شده است.

توالی های غیر کدگذاری با موقعیت مورد تجزیه و تحلیل قرار می گیرند. اگر یک موقعیت در هر یک از توالی ها شکاف داشته باشد ، این موقعیت کاملاً از تجزیه و تحلیل خارج می شود.

در همه موارد ، تعداد واگرا توسط Jukes & Cantor (Jukes and Cantor 1969) اصلاح می شود و نتایج با و بدون این اصلاح نشان داده می شود.

درمان سایت ها یا کدون ها با تغییرات متعدد

هنگام انجام آزمون ، شمارش در جدول احتمالی می تواند باشد:

سایت ها: موقعیت هایی در تراز که یا چند شکل در یک گونه هستند یا در بین گونه ها واگرا هستند. هر سایت فقط یک بار قابل شمارش است. به عنوان مثال ، اگر یک سایت بیش از دو نوع در یک گونه داشته باشد ، به عنوان 1 سایت چند شکل شمرده می شود. به همین دلیل ، هنگامی که همان سایت به طور همزمان چند شکل و واگرا است ، زیرا نمی توان آن را به یک کلاس واحد طبقه بندی کرد ، این سایت در نظر گرفته نمی شود.

تغییرات: تعداد تخمین زده شده از جهش هایی که از زمان اجداد هر دو گونه مورد تجزیه و تحلیل در موقعیت رخ داده اند. هنگامی که تغییرات مورد تجزیه و تحلیل قرار می گیرند ، در صورت داشتن بیش از دو نوع ، یک سایت (موقعیت) ممکن است در نهایت چندین تغییر (جهش) را درگیر کند ، و بنابراین آن سایت بیش از یک بار در جدول احتمالی شمارش می شود. در این حالت ، هیچ مشکلی آماری وجود ندارد که همان سایت واگرا و چند شکل در همان زمان باشد.

 

مثال:
گونه های 1atg tt c ct a gtt
atg tt a ct a gtt
atg tt t ct t gtt
گونه های 2Atg tt c ct g gtt

در مثال ، موقعیت سوم کدون دوم دارای 3 نوع است. این به عنوان 1 سایت شمرده می شود اما به عنوان 2 تغییر. موقعیت سوم کدون سوم چند شکل و واگرا در همان زمان است. بنابراین این موقعیت برای سایت ها در نظر گرفته نمی شود ، اما به عنوان 1 تغییر چند شکل + 1 تغییر واگرا شمارش می شود.

تجزیه و تحلیل از جمله تغییرات مترادف یا غیر مترادف ، فقط تغییرات محاسبه می شود. برای هر نوع تجزیه و تحلیل دیگر ، دو آزمایش مختلف انجام می شود: یکی برای تغییرات و دیگری برای سایت ها.

تخمین تعداد تغییرات مترادف و غیر مترادف

تعداد تغییرات چند شکل مترادف و غیر مترادف برای گونه های 1 و 2 به طور مستقل تخمین زده می شود ، و سپس هر دو تعداد با هم اضافه می شوند. سپس تعداد تغییرات واگرا مترادف و غیر مترادف تخمین زده می شود.

ما برای این تخمین ها از حداکثر معیار پارسیمونی استفاده می کنیم. برای هر کدون در تراز ، ما تمام کدون های مختلف را در یک گونه نشان می دهیم و کوتاهترین مسیری را که تمام کدونها را به هم وصل می کند محاسبه می کنیم. در میان اینها ، ما مسیری را که شامل کمترین تعداد تعویض ها است ، حفظ می کنیم (گاهی اوقات مسیرهای مختلف شامل همان تعداد تعویض ها می شوند و آنها به همان اندازه پارسا هستند ؛ تعداد متناوب تعویض ها به جدول احتمالی اضافه می شوند).

برخی موارد خاص اعمال می شود. اول ، هنگامی که یکی از کدون ها در همان موقعیت از گونه های دیگر برابر با یک کدون واسطه در یک مسیر است ، این مسیر به عنوان پارسائی ترین انتخاب می شود. دوم ، کدون های متوقف شده در تراز به عنوان اسید آمینه دیگری درمان می شوند ، اما وقتی یک کدون توقف در تراز ظاهر می شود ، این نتایج در نتایج هشدار می شود. آنها فقط در صورت قرار گرفتن در آخرین کدون در تراز قرار می گیرند. علاوه بر این ، هر مسیر مربوط به کدون های توقف میانی از این امر مستثنی نیست ، مگر اینکه هر دو کدون انتهایی کدون متوقف شوند.

مثلا:

این رویکرد برای واگرایی یکسان است. ما تمام مسیرهای ممکن را از هر کدون گونه 1 تا هر کدون گونه 2 محاسبه می کنیم و مسیر را با کمترین تعداد تعویض انتخاب می کنیم.

تخمین تعداد سایتها/تغییرات انحطاط

برای برآورد تعداد سایتهای انحطاط/تغییرات ، دنباله اول را به عنوان مرجع دریافت می کنیم. برای هر کدون ، میزان انحطاط را که در جدول زیر نشان داده شده است تعیین می کنیم و تعداد سایت ها/تغییرات را برای همه توالی ها محاسبه می کنیم:

در این بازنمایی از کد ژنتیکی استاندارد ، N مخفف هر نوکلئوتید (T ، C ، A یا G) ، Y برای هر پیریمیدین (T یا C) و R برای هر پورین (A یا G) است. H در مجموعه کدون های ایزولوسین (ILE) مخفف not-g (t ، c یا a) است. تداخل ها به شرح زیر است: N نشان دهنده یک سایت انحطاط چهار برابر ، Y و R سایت های انحطاط دو برابر است. H به عنوان یک سایت انحطاط دو برابر و همچنین اولین نوکلئوتیدها در چهار کدون لوسین (TTA ، TTG ، CTA و CTG) و چهار کدون آرژنین (CGA ، CGG ، AGA و AGG) در نظر گرفته شده است. تمام نوکلئوتیدهای دیگر غیر دفع هستند.

مثلا:

دنباله 1: ATG TTA TCA CAA درجه انحطاط: 000 202 004 002

تخمین تعداد سایتها/تغییرات در مناطق غیر کدگذاری

ما تعداد سایتها/تغییرات پلی مورفیک و واگرا برای هر موقعیت در تراز را شمارش می کنیم.

4. خروجی MKT

MKT استاندارد و پیشرفته:

خروجی تجزیه و تحلیل شامل موارد زیر است:

یک جدول با خلاصه ای از مقایسه های انجام شده

اطلاعات مربوط به پارامترهای اصلی ورودی:

  • کد ژنتیکی مورد استفاده قرار گرفت
  • اگر انواع با فرکانس پایین حذف شوند ، مقدار آستانه نشان داده شده است
  1. تعداد توالی برای هر گونه
  2. طول تراز
  3. The percentage of gaps within the alignment. Note that end gaps are not taken into account. There is a waing when the percentage is >30 ٪
  4. یک دکمه jalview برای تجسم توالی های تراز
  5. توالی ورودی تراز شده در هر قالب انتخاب شده. هنگامی که گونه ها به طور مستقل تراز می شوند ، هر دو تراز نیز نشان داده می شوند

یک جدول احتمالی 2x2 برای هر مقایسه انجام شده:

هنگامی که یک مقایسه شامل دو کلاس از سایت هایی است که از آن برنامه هر دو تغییر و سایت را تجزیه و تحلیل کرده است ، نتایج نشان می دهد این دو تجزیه و تحلیل: یکی برای تغییرات و دیگری برای سایت ها.

از این جدول ، تخمین های زیر محاسبه می شود:

هر دو جدول احتمالی و تخمین ها با واگرایی اصلاح شده توسط Jukes & Cantor و بدون هیچ گونه اصلاح برای واگرایی محاسبه می شوند. نتایج پیش فرض نشان داده شده توسط Jukes & Cantor اصلاح می شود ، اما نتایج بدون تصحیح را می توان با انتخاب دکمه "بدون هیچ گونه تصحیح برای واگرایی" در صفحه خروجی مشاهده کرد.

خروجی تجزیه و تحلیل شامل موارد زیر است:

یک جدول با خلاصه ای از مقایسه های انجام شده

اطلاعات مربوط به پارامترهای اصلی ورودی:

  • کد ژنتیکی مورد استفاده قرار گرفت
  • اگر انواع با فرکانس پایین حذف شوند ، مقدار آستانه نشان داده شده است
  1. تعداد توالی برای هر گونه
  2. طول تراز
  3. The percentage of gaps within the alignment. Note that end gaps are not taken into account. There is a waing when the percentage is >30 ٪
  4. یک دکمه Jalview برای دیدن توالی های تراز
  5. توالی ورودی تراز شده در هر قالب انتخاب شده. هنگامی که گونه ها به طور مستقل تراز می شوند ، هر دو تراز نیز نشان داده می شوند

یک جدول احتمالی 2x2 برای هر مقایسه انجام شده و مکان:

هنگامی که یک مقایسه شامل دو کلاس از سایت هایی است که از آن برنامه هر دو تغییر و سایت را تجزیه و تحلیل کرده است ، نتایج نشان می دهد این دو تجزیه و تحلیل: یکی برای تغییرات و دیگری برای سایت ها.

از این جدول ، تخمین های زیر محاسبه می شود:

برآوردگر مانتل-هانسیل معادل شاخص بی طرفی است (رند و کن 1996) برای تست های یک چراغ نشان داده شده و نشان می دهد که میزان سطح پلی مورفیسم اسید آمینه از مدل مورد انتظار تا چه اندازه فاصله دارد.

: میانگین نسبت تعویض تطبیقی (اسمیت و ای ر-واکر 2002) ، از -∞ تا 1 و تخمین زده می شود:

توجه داشته باشید که اگر فقط یک مکان به این رابط وارد شود ، برآوردهای خروجی همانند استاندارد یا MKT پیشرفته خواهد بود و یک هشدار نمایش داده می شود.

هم جداول احتمالی و هم تخمین ها با واگرایی اصلاح شده توسط Jukes & Cantor و بدون هیچ گونه تصحیح برای واگرایی محاسبه می شوند. نتایج پیش فرض نشان داده شده توسط Jukes & Cantor اصلاح می شود ، اما نتایج بدون تصحیح را می توان با انتخاب دکمه "بدون هیچ گونه تصحیح برای واگرایی" در صفحه خروجی مشاهده کرد.

سیگنالهای معاملاتی...
ما را در سایت سیگنالهای معاملاتی دنبال می کنید

برچسب : نویسنده : عارف لرستانی بازدید : 47 تاريخ : پنجشنبه 10 فروردين 1402 ساعت: 17:27