K-تایی
در بیوانفورماتیک، k-تایی یک زیر رشته به طول k از رشته بیولوژیکی است. در ابتدا، k-تایی در ژنومیک محاسباتی و آنالیز دنباله استفاده میشد که در آن K-تایی تشکیل شده از نوکلئوتایدها (A,T، C,G) هستند. k-تاییها به خاطر بازسازی توالیهای DNA،[۱] شناسایی گونهها در نمونههای متاژنومی،[۲] و تولید واکسن زنده[۳] مطرح شدند. معمولاً کلمه k-تایی به همه رشتههای دنبالهای به طول k اشاره دارد. برای مثال، رشتهٔ AGAT میتواند ۴ مونومر (A , G , A , T)، سه ۲-تایی (AG, GA, AT)، دو ۳-تایی (AGA, GAT) و یک ۴-تایی داشته باشد، که زیررشته ۴-تایی برابر خود رشتهاست. بهطور کلی یک رشته به طول L میتواند L-k+1 رشته k-تایی داشته باشد. همچنین برای n مونومر، n^k تا k-تایی ممکن وجود دارد؛ که در رشته DNA تعداد مونومرها برابر با ۴ است.
معرفی[ویرایش]
k-تاییها زیر رشتههایی به طول k هستند. برای مثال در جدول زیر تمام k-تاییها برای یک رشته نمونه از DNA را مشاهده میکنید.
k | k-تایی |
---|---|
۱ | G, T, A, G, A, G, C, T, G, T |
۲ | GT, TA, AG, GA, AG, GC, CT, TG, GT |
۳ | GTA, TAG, AGA, GAG, AGC, GCT, CTG, TGT |
۴ | GTAG, TAGA, AGAG, GAGC, AGCT, GCTG, CTGT |
۵ | GTAGA, TAGAG, AGAGC, GAGCT, AGCTG, GCTGT |
۶ | GTAGAG, TAGAGC, AGAGCT, GAGCTG, AGCTGT |
۷ | GTAGAGC, TAGAGCT, AGAGCTG, GAGCTGT |
۸ | GTAGAGCT, TAGAGCTG, AGAGCTGT |
۹ | GTAGAGCTG, TAGAGCTGT |
۱۰ | GTAGAGCTGT |
یک روش برای نمایش دادن k-تاییها استفاده از طیف k-تایی است. طیف k-تایی یک نمایش گرافیکی از یک پایگاه دادهاست که نشان میدهد چند تا k-تایی به تعداد مشخصی تکرار شدهاند؛ بنابراین محور x آن فرکانس تکرار k-تایی را نشان میدهد و محور y تعداد k-تاییهایی که به آن اندازه تکرار شدهاند.[۴] شکل توزیع طیف k-تایی اطلاعات مفیدی از ویژگیهای نمونه بیولوژیکی را به ما میدهد.[۵] تعداد مدها در توزیع طیف k-تایی برای ژنوم یک گونه میتواند متفاوت باشد. در این بین تکمدیها بیشترین آمار تعداد گونه را دارند. در حالیکه تمام پستانداران توزیع طیف k-تایی چندمدی دارند. همچنین در یک طیف k-تایی، توزیع در مناطق مختلف ژنوم میتواند متفاوت باشد. برای مثال انسانها در مناطق ترجمه نشده '۵ و اگزونها طیف تکمدی دارند و در مناطق ترجمه نشده '۳ و اینترونها طیف چندمدی دارند.
عوامل تأثیرگذار در فراوانی k-تایی DNA[ویرایش]
تعداد k-تاییها از عوامل متعددی در سطوح مختلف تأثیر میپذیرند که معمولاً با هم در تعارضاند. لازم است ذکر شود که k-تاییها با k بزرگتر از عوامل تأثیرگذار روی k-تایی با k کوچکتر تأثیر میپذیرند. برای مثال اگر مونومر A وجود نداشته باشد، هیچکدام از ۲-تاییهای شامل A هم نمیتوانند وجود داشته باشند. به این ترتیب عوامل مختلف با یکدیگر پیوند میخورند.
k = ۱[ویرایش]
در مثال بالا، در حالتی که k=۱ باشد، ۴ تا k-تایی برای DNA داریم (A,T،G,C). در سطح مولکولی ۳ پیوند هیدروژنی بین G,C وجود دارد. در حالی که در بین A,T فقط دو پیوند هیدروژنی برقرار میشود؛ بنابراین، پیوندهای بین G,C قویتر از پیوندهای بین A,T است.[۶]
پرندهها و پستانداران تعداد بیشتری G,C نسبت به A,T دارند(محتوی CG). که منجر به فرضیهای شد که ثبات حرارتی یک عامل تفاوت تعداد CGها است. هرچند فرضیه امیدوارکننده بود، این فرضیه مورد بررسی قرار نگرفت، چرا که آنالیز روی انواع پروکاریودها هیچ شواهدی از رابطهٔ فراوانی CGها با دما نشان نداد. در حقیقت اگر انتخاب طبیعی نیروی محرکهٔ تفاوت فراوانی CGها باشد، منجر به چند ریختی تک نوکلئوتیدی میشود که معمولاً جایگزینی مترادف است و تناسب یک ارگانیسم را تغییر نمیدهد.
منابع[ویرایش]
- ↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
- ↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
- ↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
- ↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
- ↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
- ↑ خطای لوآ در پودمان:Citation/CS1/en/Identifiers در خط 47: attempt to index field 'wikibase' (a nil value).
This article "K-تایی" is from Wikipedia. The list of its authors can be seen in its historical and/or the page Edithistory:K-تایی. Articles copied from Draft Namespace on Wikipedia could be seen on the Draft Namespace of Wikipedia and not main one.