معلومة

ما هو أصل الحمض النووي غير المرغوب فيه؟

ما هو أصل الحمض النووي غير المرغوب فيه؟



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

تمتلك معظم حقيقيات النوى كمية معينة من الحمض النووي غير المرغوب فيه في نواة الخلية. ما هو أصل (أصول) هذا الحمض النووي غير المرغوب فيه ، وهل هو حقًا خردة (زائدة عن الحاجة)؟


يُطلق على "الحمض النووي غير المرغوب فيه" اسم الحمض النووي غير المشفر بشكل أكثر ملاءمة. يتم تعريف هذا على أنه أي منطقة DNA لا يتم ترميزها لجين أو بشكل أكثر دقة ليست ضمن إطار قراءة مفتوح. يتكون أكثر من 98٪ في الجينوم البشري من دنا غير مشفر. ومع ذلك ، كلما تعلمنا المزيد عن البيولوجيا الجزيئية ، زاد فهمنا للوظيفة البيولوجية وأهمية الحمض النووي غير المشفر. أمثلة على الوظائف المهمة هي:

  1. المناطق التنظيمية التي تتحكم في التعبير عن الجين
  2. ترميز المناطق للحمض النووي الريبي التنظيمي
  3. المناطق التي يحدث فيها التنظيم اللاجيني

ومع ذلك ، هناك أيضًا مناطق من المحتمل ألا يكون لها وظيفة بيولوجية مفيدة ، والتي قد يطلق عليها حقًا اسم خردة:

  1. الينقولات هي مناطق وراثية يمكنها نسخ نفسها (إما عن طريق RNA النشط إنزيميًا أو عن طريق ترميز البروتين transposase). يُعتقد أنها تطورت كـ "جينات أنانية" وتوجد العديد من الآليات الدفاعية المعروفة ضد الينقولات المارقة (siRNA ، RNAi). أصبحت الينقولات وآليات الدفاع الآن أدوات قوية في أبحاث البيولوجيا الجزيئية.
  2. متواليات الفيروسات القهقرية الذاتية والتي هي بقايا الفيروسات القهقرية التي أدخلت نفسها في الخط الجرثومي وتصبح غير نشطة من خلال الطفرة.

ومع ذلك ، يُعتقد أنه حتى هذه المناطق "غير المرغوب فيها" لها وظائف تطورية مهمة مثل الحماية من الطفرات من خلال الفيروسات القهقرية: نظرًا لوجود مناطق كبيرة من الحمض النووي حيث الترتيب الدقيق والوظيفة غير مهمين ، فإن الفيروسات القهقرية تدخل نفسها في مواقع عشوائية من الجينوم أقل احتمالا للتسبب في ضرر دائم.


باختصار ، نحن نعرف العديد من الآليات التي يمكن من خلالها زيادة حجم الجينوم. رباعيات الأرجل لديها ما لا يقل عن اثنين من مضاعفات الجينوم الكامل في تاريخها. تتوسع الينقولات. إدراج الفيروسات القهقرية ؛ الازدواج الجزئي يؤدي إلى الجينات الكاذبة. ويمكن أن تكون آليات التوسع هذه سريعة - مضاعفة الجينوم الكامل مضاعفة الحجم في جيل واحد.

لكننا نعرف آليات قليلة جدًا يمكن بواسطتها تصغير الجينومات ، ومعظمها بطيء جدًا ، وقليل جدًا منها مستهدف.

من وجهة نظر ميكانيكية ، من الصعب جدًا تخيل طريقة مستهدفة لإزالة الحمض النووي غير المجدي ولكن غير المؤذي بسرعة وبدقة 100٪. إذا لم تكن الدقة 100٪ ، فسيكون المسار أكثر ضررًا من الحمض النووي الذي يسعى لإزالته.

المفتاح هو أنه إذا كان الحمض النووي الإضافي غير ضار أو شبه ضار ، فلا يوجد سبب للقضاء عليه ، وهناك أسباب (أخطاء في الإزالة) لعدم محاولة إزالته.

لذا فإن الإجابة المختصرة والبسيطة هي أن الجينوم يمكن أن يراكم الحمض النووي عديم الفائدة بسهولة أكبر بكثير مما يمكنهم التخلص منه. إنه مجرد منطق عام يتطابق مع 30 عامًا من التجارب.


يكشف "الحمض النووي غير المرغوب فيه" عن طبيعة أسلافنا القدماء

تم الكشف عن مفتاح حل أحد الألغاز العظيمة في علم الأحياء التطوري ، أصل الفقاريات - حيوانات ذات هيكل عظمي داخلي مصنوع من العظام - في بحث جديد من كلية دارتموث وجامعة بريستول.

تعتبر الفقاريات أكثر الكائنات الحية تعقيدًا من الناحية التشريحية والوراثية ، لكن شرح كيفية تحقيقها لهذا التعقيد أثار حفيظة العلماء. الدراسة التي نشرت اليوم [20 أكتوبر] في وقائع الأكاديمية الوطنية للعلوم يدعي أنه حل هذا اللغز العلمي من خلال تحليل الجينوميات للأسماك الحية البدائية مثل أسماك القرش والجلكى ، وأقاربهم الضعفاء مثل نافورات البحر. & # 160

درست أليشا هايمبيرج من كلية دارتموث وزملاؤها العلاقات الأسرية للفقاريات البدائية. استخدم الفريق microRNAs ، وهي فئة من الجزيئات الصغيرة التي تم اكتشافها مؤخرًا فقط داخل ما كان يُعتبر عادةً "DNA غير المرغوب فيه" ، لإظهار أن الجلكيات والثعابين الوحل هي أقارب بعيدة للفقاريات الفكية.

قال أليشا: & # 147 نتعلم من نتائجنا أن الجلكى وسمك الهاg مرتبطان بنفس القدر بالفقاريات الفكية وأن سمك الهاg لا يمثل فقاريات أكثر بدائية ، مما يشير إلى أن الفقاريات الأسلاف كانت أكثر تعقيدًا مما كان يعتقده أي شخص سابقًا.

& # 147 تطورت الفقاريات منذ مئات الملايين من السنين لكنها لا تزال تعبر عن نفس جينات الرنا الميكروي في نفس الأعضاء كما كانت عندما ظهر كلاهما لأول مرة. & # 148

واصل الفريق اختبار فكرة أن هذه الجينات نفسها & # 145 junk DNA & # 146 ، microRNAs ، كانت مسؤولة عن أصل تطور الخصائص التشريحية للفقاريات. ووجدوا أن نفس مجموعة الرنا الميكروي تم التعبير عنها في نفس الأعضاء والأنسجة ، في الجلكيات والفئران.

قال المؤلف المشارك ، البروفيسور فيليب دونوجو من كلية علوم الأرض بجامعة بريستول و 146 ثانية: & # 147 أصل الفقاريات وأصل هذه الجينات ليس من قبيل الصدفة. & # 148

قال البروفيسور كيفين بيترسون من كلية دارتموث: & # 147 هذه الدراسة لا تشير فقط إلى الطريق لفهم الأصل التطوري لنسبنا ، ولكنها تساعدنا أيضًا على فهم كيفية تجميع الجينوم الخاص بنا في وقت عميق. & # 148


محتويات

  1. ^ Pennisi E (سبتمبر 2012). "علم الجينوم. مشروع ENCODE يكتب تأبين الحمض النووي غير المرغوب فيه". علم. 337 (6099): 1159-1161. دوى: 10.1126 / العلوم .337.6099.1159. بميد22955811.
  2. ^
  3. اتحاد مشروع ENCODE (سبتمبر 2012). "موسوعة متكاملة لعناصر الحمض النووي في الجينوم البشري". طبيعة سجية. 489 (7414): 57-74. بيب كود: 2012 Natur.489. 57 ت. دوى: 10.1038 / nature11247. PMC3439153. بميد22955616. .
  4. ^ Cite error: تم استدعاء المرجع المسمى Costa non-coding لكن لم يتم تعريفه (راجع صفحة التعليمات).
  5. ^ أب
  6. كاري م (2015). الحمض النووي غير المرغوب فيه: رحلة عبر المادة المظلمة للجينوم. مطبعة جامعة كولومبيا. ردمك 9780231170840.
  7. ^
  8. McKie R (24 فبراير 2013). "هاجم العلماء بسبب الادعاء بأن" الحمض النووي غير المرغوب فيه أمر حيوي للحياة ". المراقب.
  9. ^
  10. Eddy SR (نوفمبر 2012). "مفارقة القيمة C والحمض النووي غير المرغوب فيه والترميز". علم الأحياء الحالي. 22 (21): R898-9. دوى: 10.1016 / j.cub.2012.10.002. بميد23137679. S2CID28289437.
  11. ^
  12. Doolittle WF (أبريل 2013). "هل الحمض النووي غير مرغوب فيه؟ نقد للترميز". وقائع الأكاديمية الوطنية للعلوم بالولايات المتحدة الأمريكية. 110 (14): 5294 - 300. بيب كود: 2013PNAS..110.5294D. دوى: 10.1073 / pnas.1221376110. PMC3619371. PMID23479647.
  13. ^
  14. Palazzo AF ، Gregory TR (مايو 2014). "قضية الحمض النووي غير المرغوب فيه". علم الوراثة PLOS. 10 (5): e1004351. دوى: 10.1371 / journal.pgen.1004351. PMC4014423. PMID24809441.
  15. ^
  16. Graur D ، Zheng Y ، Price N ، Azevedo RB ، Zufall RA ، Elhaik E (2013). "حول خلود أجهزة التلفزيون:" الوظيفة "في الجينوم البشري وفقًا لبشارة ENCODE الخالية من التطور". بيولوجيا الجينوم والتطور. 5 (3): 578-90. دوى: 10.1093 / gbe / evt028. PMC3622293. PMID23431001.
  17. ^
  18. Ponting CP ، Hardison RC (نوفمبر 2011). "ما هو جزء من الجينوم البشري وظيفية؟". أبحاث الجينوم. 21 (11): 1769–76. دوى: 10.1101 / غرام .116814.110. PMC3205562. PMID21875934.
  19. ^ أب
  20. Kellis M و Wold B و Snyder MP و Bernstein BE و Kundaje A و Marinov GK وآخرون. (أبريل 2014). "تحديد عناصر الحمض النووي الوظيفية في الجينوم البشري". وقائع الأكاديمية الوطنية للعلوم بالولايات المتحدة الأمريكية. 111 (17): 6131–8. بيب كود: 2014PNAS..111.6131K. دوى: 10.1073 / pnas.1318948111. PMC4035993. بميد24753594.
  21. ^
  22. Rands CM ، Meader S ، Ponting CP ، Lunter G (يوليو 2014). "8.2٪ من الجينوم البشري مقيد: التباين في معدلات الدوران عبر فئات العناصر الوظيفية في سلالة الإنسان". علم الوراثة PLOS. 10 (7): e1004525. دوى: 10.1371 / journal.pgen.1004525. PMC4109858. بميد 25057982.
  23. ^
  24. ماتيك شبيبة (2013). "مدى الوظيفة في الجينوم البشري". مجلة هوغو. 7 (1): 2. دوى: 10.1186 / 1877-6566-7-2. PMC4685169.
  25. ^
  26. موريس ك ، أد. (2012). الحمض النووي الريبي غير المشفر والتنظيم اللاجيني للتعبير الجيني: محركات الانتقاء الطبيعي. نورفولك ، المملكة المتحدة: Caister Academic Press. ردمك 978-1904455943.

تختلف كمية الحمض النووي الجينومي الكلي بشكل كبير بين الكائنات الحية ، كما أن نسبة الحمض النووي المشفر وغير المشفر داخل هذه الجينومات تختلف اختلافًا كبيرًا أيضًا. على سبيل المثال ، تم اقتراح أن أكثر من 98٪ من الجينوم البشري لا يشفر تسلسلات البروتين ، بما في ذلك معظم التسلسلات داخل الإنترونات ومعظم الحمض النووي بين الجينات ، [2] بينما 20٪ من جينوم بدائيات النوى النموذجي غير مشفر. [3]

في حقيقيات النوى ، لا يرتبط حجم الجينوم ، وبالتالي كمية الحمض النووي غير المشفر ، بتعقيد الكائن الحي ، وهي ملاحظة تُعرف باسم لغز القيمة C. [4] على سبيل المثال ، جينوم الخلية أحادية الخلية Polychaos dubium (معروف سابقا ب الأميبا الدوبيا) يحتوي على أكثر من 200 ضعف كمية الحمض النووي في البشر. [5] السمكة المنتفخة Takifugu rubripes يبلغ حجم الجينوم حوالي ثُمن حجم الجينوم البشري ، ومع ذلك يبدو أنه يحتوي على عدد مماثل من الجينات حوالي 90٪ من تاكيفوغو الجينوم هو DNA غير مشفر. [2] لذلك ، فإن معظم الاختلاف في حجم الجينوم لا يرجع إلى الاختلاف في كمية الحمض النووي المشفر ، بل يرجع إلى الاختلاف في كمية الحمض النووي غير المشفر. [6]

في عام 2013 ، تم اكتشاف "رقم قياسي" جديد لجينوم حقيقيات النوى الأكثر كفاءة Utricularia gibba، وهو نبات مثاني يحتوي على 3 ٪ فقط من الحمض النووي غير المشفر و 97 ٪ من الحمض النووي المشفر. تم حذف أجزاء من الحمض النووي غير المشفر بواسطة النبات ، وهذا يشير إلى أن الحمض النووي غير المشفر قد لا يكون مهمًا للنباتات ، على الرغم من أن الحمض النووي غير المشفر مفيد للبشر. [1] اكتشفت دراسات أخرى أجريت على النباتات وظائف مهمة في أجزاء من الحمض النووي غير المشفر كان يُعتقد سابقًا أنه مهمل وأضفت طبقة جديدة لفهم تنظيم الجينات. [7]

عناصر رابطة الدول المستقلة وعبر التنظيم تحرير

العناصر التنظيمية لرابطة الدول المستقلة هي تسلسلات تتحكم في نسخ الجين المجاور. وتشارك العديد من هذه العناصر في التطور والتحكم في التنمية. [8] قد توجد عناصر رابطة الدول المستقلة في 5 'أو 3' مناطق غير مترجمة أو داخل إنترونات. تتحكم العناصر العابرة للتنظيم في نسخ الجين البعيد.

تسهل المروجين نسخ جين معين وعادة ما تكون منبع منطقة الترميز. قد يكون لتسلسل المحسن أيضًا تأثيرات بعيدة جدًا على مستويات نسخ الجينات. [9]

تحرير إنترونس

الإنترونات عبارة عن أقسام غير مشفرة من الجين ، يتم نسخها في تسلسل mRNA السلائف ، ولكن يتم إزالتها في النهاية بواسطة تضفير RNA أثناء المعالجة لتنضج الرنا المرسال. يبدو أن العديد من الإنترونات عبارة عن عناصر وراثية متحركة. [10]

دراسات المجموعة الأولى من introns رباعية الغشاء تشير الأوليات إلى أن بعض الإنترونات تبدو عناصر وراثية أنانية ، محايدة بالنسبة للمضيف لأنها تزيل نفسها من exons المحيطة أثناء معالجة RNA ولا تنتج تحيزًا تعبيريًا بين الأليلات مع الإنترون وبدونه. [10] يبدو أن بعض الإنترونات لها وظيفة بيولوجية مهمة ، ربما من خلال وظائف الريبوزيم التي قد تنظم نشاط الرنا الريباسي والرنا الريباسي بالإضافة إلى التعبير الجيني لترميز البروتين ، وهو واضح في العوائل التي أصبحت معتمدة على هذه الإنترونات على مدى فترات طويلة من الزمن على سبيل المثال ، ال trnL- إنترون توجد في جميع النباتات الخضراء ويبدو أنها موروثة عموديًا لعدة مليارات من السنين ، بما في ذلك أكثر من مليار سنة داخل البلاستيدات الخضراء و 2-3 مليار سنة إضافية في أسلاف البكتيريا الزرقاء للبلاستيدات الخضراء. [10]

تحرير الجينات الكاذبة

الجينات الكاذبة هي سلاسل دنا مرتبطة بالجينات المعروفة ، والتي فقدت قدرتها على ترميز البروتين أو لم يعد يتم التعبير عنها في الخلية. تنشأ الجينات الكاذبة من التحويل الرجعي أو الازدواج الجيني للجينات الوظيفية ، وتصبح "أحافير جينية" غير وظيفية بسبب الطفرات التي تمنع نسخ الجين ، مثل داخل منطقة محفز الجين ، أو تغير ترجمة الجين بشكل قاتل ، مثل كودونات التوقف المبكر أو فرامشيرتس. [11] تُعرف الجينات الخادعة الناتجة عن التحويل الرجعي للحمض النووي الريبي الوسيط بالجينات الخادعة المعالجة التي تنشأ من البقايا الجينية للجينات المضاعفة أو بقايا الجينات المعطلة وهي جينات خادعة غير معالجة. [11] عمليات تبديل جينات الميتوكوندريا التي كانت تعمل مرة واحدة من السيتوبلازم إلى النواة ، والمعروفة أيضًا باسم NUMTs ، تعتبر أيضًا نوعًا واحدًا من الجينات الزائفة الشائعة. [12] تحدث الأعداد في العديد من الأصناف حقيقية النواة.

بينما يقترح قانون دولو أن فقدان الوظيفة في الجينات الكاذبة من المحتمل أن يكون دائمًا ، فإن الجينات الصامتة قد تحتفظ بالفعل بوظائفها لعدة ملايين من السنين ويمكن "إعادة تنشيطها" في تسلسلات ترميز البروتين [13] ويتم نسخ عدد كبير من الجينات الخادعة بنشاط. [11] [14] نظرًا لأنه يُفترض أن الجينات الكاذبة تتغير دون قيود تطورية ، فإنها يمكن أن تكون بمثابة نموذج مفيد لنوع وترددات الطفرات الجينية العفوية المختلفة. [15]

كرر التسلسلات ، الينقولات والعناصر الفيروسية تحرير

الينقولات واللينقولات الرجعية هي عناصر وراثية متحركة. المتواليات المتكررة Retrotransposon ، والتي تشمل عناصر نووية متناثرة طويلة (LINEs) وعناصر نووية قصيرة متناثرة (SINEs) ، تمثل نسبة كبيرة من التسلسلات الجينية في العديد من الأنواع. متواليات Alu ، المصنفة كعنصر نووي قصير ، هي العناصر المتحركة الأكثر وفرة في الجينوم البشري. تم العثور على بعض الأمثلة على SINEs التي تمارس التحكم النسخي لبعض جينات ترميز البروتين. [16] [17] [18]

تسلسل الفيروسات القهقرية الذاتية هي نتاج النسخ العكسي لجينومات الفيروسات القهقرية في جينومات الخلايا الجرثومية. يمكن للطفرة داخل هذه التسلسلات المكتوبة بأثر رجعي تعطيل الجينوم الفيروسي. [19]

يتكون أكثر من 8٪ من الجينوم البشري من (متحللة في الغالب) متواليات الفيروسات القهقرية الذاتية ، كجزء من أكثر من 42٪ جزء مشتق من الينقولات العكسية ، في حين يمكن التعرف على 3٪ أخرى على أنها بقايا الينقولات DNA. من المتوقع أن يكون معظم النصف المتبقي من الجينوم الذي لا يحتوي حاليًا على أصل موضح قد وجد أصله في العناصر القابلة للنقل التي كانت نشطة منذ فترة طويلة (& gt 200 مليون سنة) بحيث جعلت الطفرات العشوائية هذه العناصر غير قابلة للتعرف عليها. [20] اختلاف حجم الجينوم في نوعين على الأقل من النباتات هو في الغالب نتيجة لتسلسل الينقولات العكسية. [21] [22]

تحرير التيلوميرات

التيلوميرات هي مناطق من الحمض النووي المتكرر في نهاية الكروموسوم ، والتي توفر الحماية من تدهور الكروموسومات أثناء تكرار الحمض النووي. أظهرت الدراسات الحديثة أن التيلوميرات تعمل للمساعدة في استقرارها. الحمض النووي الريبي المحتوي على التيلومير (تيرا) عبارة عن نسخ مشتقة من التيلوميرات. لقد ثبت أن TERRA تحافظ على نشاط التيلوميراز وتطيل نهايات الكروموسومات. [23]

أصبح مصطلح "الحمض النووي غير المرغوب فيه" شائعًا في الستينيات. [24] [25] وفقًا لـ T. Ryan Gregory ، تمت مناقشة طبيعة الحمض النووي غير المرغوب فيه لأول مرة بشكل صريح في عام 1972 من قبل عالم الأحياء الجينومية ، David Comings ، الذي طبق المصطلح على جميع الحمض النووي غير المشفر. [26] تمت صياغة المصطلح رسميًا في نفس العام من قبل Susumu Ohno ، [6] الذي أشار إلى أن الحمل الطفري من الطفرات الضارة وضع حدًا أعلى لعدد المواقع الوظيفية التي يمكن توقعها بالنظر إلى معدل الطفرة النموذجي. افترض Ohno أن جينومات الثدييات لا يمكن أن تحتوي على أكثر من 30000 موضع قيد الاختيار قبل أن تتسبب "التكلفة" من الحمل الطفري في انخفاض لا مفر منه في اللياقة البدنية ، وفي النهاية الانقراض. لا يزال هذا التنبؤ قوياً ، حيث يحتوي الجينوم البشري على ما يقرب من (ترميز البروتين) 20000 جين. مصدر آخر لنظرية أونو هو الملاحظة التي تشير إلى أنه حتى الأنواع ذات الصلة الوثيقة يمكن أن يكون لها أحجام جينوم مختلفة على نطاق واسع (أوامر من حيث الحجم) ، والتي أطلق عليها اسم مفارقة القيمة C في عام 1971. [27]

تم التشكيك في مصطلح "DNA غير المرغوب فيه" على أساس أنه يثير قوة بداهة افتراض عدم وظيفية بالكامل وقد أوصى البعض باستخدام مصطلحات أكثر حيادية مثل "DNA غير المشفر" بدلاً من ذلك. [26] ومع ذلك ، فإن "الحمض النووي غير المرغوب فيه" يظل علامة لأجزاء من تسلسل الجينوم الذي لم يتم تحديد وظيفة ملحوظة له ، وذلك من خلال تحليل الجينوميات المقارن لا يظهر تحت أي قيود وظيفية مما يشير إلى أن التسلسل نفسه لم يوفر أي ميزة تكيفية.

منذ أواخر السبعينيات ، أصبح من الواضح أن غالبية الحمض النووي غير المشفر في الجينوم الكبير يجد أصله في التضخيم الأناني للعناصر القابلة للنقل ، والتي كتب عنها دبليو فورد دوليتل وكارمن سابينزا في عام 1980 في المجلة. طبيعة سجية: "عندما يمكن إثبات أن حمضًا نوويًا معينًا ، أو فئة من الحمض النووي ، ذات وظيفة نمطية غير مثبتة ، قد طورت استراتيجية (مثل التحويل) تضمن بقاءها الجيني ، فلا داعي لتفسير آخر لوجودها." [28] يمكن توقع أن تعتمد كمية الحمض النووي غير المرغوب فيه على معدل تضخيم هذه العناصر ومعدل فقدان الحمض النووي غير الوظيفي. [29] في نفس العدد من طبيعة سجيةكتب ، ليزلي أورجيل وفرانسيس كريك أن الحمض النووي غير المرغوب فيه "لديه القليل من الخصوصية وينقل ميزة انتقائية قليلة أو معدومة إلى الكائن الحي". [30] يظهر المصطلح بشكل رئيسي في العلوم الشعبية وبطريقة عامية في المنشورات العلمية ، وقد اقترح أن دلالاته ربما أخرت الاهتمام بالوظائف البيولوجية للحمض النووي غير المشفر. [31]

تشير بعض الأدلة إلى أن بعض متواليات "الحمض النووي غير المرغوب فيه" هي مصادر للنشاط الوظيفي (المستقبلي) في التطور من خلال تكامل الحمض النووي الأناني الأصلي أو غير الوظيفي. [32]

تحرير مشروع ENCODE

في عام 2012 ، أفاد مشروع ENCODE ، وهو برنامج بحثي يدعمه المعهد الوطني لأبحاث الجينوم البشري ، أن 76٪ من تسلسل الحمض النووي غير المشفر للجينوم البشري قد تم نسخه وأن نصف الجينوم تقريبًا كان متاحًا بطريقة ما للبروتينات التنظيمية الجينية. مثل عوامل النسخ. [33] ومع ذلك ، فإن اقتراح ENCODE بأن أكثر من 80٪ من الجينوم البشري يعمل كيميائيًا حيوي قد انتقد من قبل علماء آخرين ، [34] الذين يجادلون بأنه لا إمكانية وصول أجزاء من الجينوم إلى عوامل النسخ ولا نسخها يضمن أن تلك الأجزاء لها وظيفة كيميائية حيوية وأن نسخها مفيد بشكل انتقائي. بعد كل شيء ، يمكن نسخ المقاطع غير الوظيفية من الجينوم ، بالنظر إلى أن عوامل النسخ ترتبط عادةً بالتسلسلات القصيرة التي يتم العثور عليها (بشكل عشوائي) في جميع أنحاء الجينوم بأكمله. [35]

علاوة على ذلك ، استندت التقديرات الأقل بكثير للوظائف قبل ENCODE إلى الحفظ الجينومي تقديرات عبر أنساب الثدييات. [27] [36] [37] [38] تمت مناقشة النسخ والتضفير على نطاق واسع في الجينوم البشري كمؤشر آخر للوظيفة الجينية بالإضافة إلى الحفاظ على الجينوم الذي قد يغيب عن التسلسلات الوظيفية المحفوظة بشكل سيئ. [39] علاوة على ذلك ، يشارك الكثير من الدنا غير المرغوب فيه في تنظيم الوراثة اللاجينية ويبدو أنه ضروري لتطوير الكائنات الحية المعقدة. [40] [41] [42] المناهج الجينية قد تفقد العناصر الوظيفية التي لا تظهر جسديًا على الكائن الحي ، المناهج التطورية تواجه صعوبات في استخدام محاذاة تسلسل دقيق لأنواع متعددة لأن الجينوم حتى الأنواع ذات الصلة الوثيقة تختلف اختلافًا كبيرًا ، ومع النهج البيوكيميائية، على الرغم من وجود قابلية استنساخ عالية ، فإن التوقيعات البيوكيميائية لا تشير دائمًا تلقائيًا إلى وظيفة. [39] كيليس وآخرون. لاحظ أن 70 ٪ من تغطية النسخ كانت أقل من نسخة واحدة لكل خلية (وبالتالي قد تستند إلى نسخ الخلفية الزائفة). من ناحية أخرى ، جادلوا بأن 12-15٪ جزء من الحمض النووي البشري قد يكون تحت قيود وظيفية ، وربما لا يزال أقل من الواقع عندما يتم تضمين قيود خاصة بالنسب. في نهاية المطاف ، يمكن استخدام المناهج الجينية والتطورية والكيميائية الحيوية بطريقة تكميلية لتحديد المناطق التي قد تكون وظيفية في علم الأحياء والمرض البشري. [39] جادل بعض النقاد بأنه لا يمكن تقييم الوظيفة إلا بالرجوع إلى فرضية العدم المناسبة. في هذه الحالة ، ستكون الفرضية الصفرية هي أن هذه الأجزاء من الجينوم غير وظيفية ولها خصائص ، سواء كانت على أساس الحفظ أو النشاط الكيميائي الحيوي ، وهو ما يمكن توقعه من هذه المناطق بناءً على فهمنا العام للتطور الجزيئي و الكيمياء الحيوية. وفقًا لهؤلاء النقاد ، حتى يتم إثبات أن المنطقة المعنية لها ميزات إضافية ، بخلاف ما هو متوقع من الفرضية الصفرية ، يجب تصنيفها مؤقتًا على أنها غير وظيفية. [43]

يجب أن يكون لبعض تسلسلات الحمض النووي غير المشفرة بعض الوظائف البيولوجية المهمة. يُشار إلى ذلك من خلال دراسات الجينوم المقارنة التي تشير إلى مناطق محمية للغاية من الحمض النووي غير المشفر ، وأحيانًا على نطاقات زمنية لمئات الملايين من السنين. هذا يعني أن هذه المناطق غير المشفرة تخضع لضغط تطوري قوي واختيار إيجابي. [44] على سبيل المثال ، في جينومات البشر والفئران ، والتي تباعدت عن سلف مشترك قبل 65-75 مليون سنة ، تمثل تسلسلات الحمض النووي المشفر للبروتين حوالي 20٪ فقط من الحمض النووي المحفوظ ، مع 80٪ المتبقية من الحمض النووي المحفوظ ممثلة في المناطق غير المشفرة. [45] غالبًا ما يحدد رسم خرائط الارتباط مناطق الكروموسومات المرتبطة بمرض ما مع عدم وجود دليل على متغيرات الترميز الوظيفي للجينات داخل المنطقة ، مما يشير إلى أن المتغيرات الجينية المسببة للمرض تكمن في الحمض النووي غير المشفر. [45] تم استكشاف أهمية طفرات الحمض النووي غير المشفرة في السرطان في أبريل 2013. [46]

تلعب الأشكال الجينية غير المشفرة دورًا في قابلية الإصابة بالأمراض المعدية ، مثل التهاب الكبد سي. [48]

قد تكون بعض التسلسلات المحددة للحمض النووي غير المشفر ميزات أساسية لبنية الكروموسوم ووظيفة السنترومير والتعرف على الكروموسومات المتجانسة أثناء الانقسام الاختزالي. [49]

وفقًا لدراسة مقارنة لأكثر من 300 جينوم بدائية النواة وأكثر من 30 جينوم حقيقيات النوى ، [50] يبدو أن حقيقيات النوى تتطلب الحد الأدنى من الحمض النووي غير المشفر. يمكن التنبؤ بالمقدار باستخدام نموذج نمو للشبكات الجينية التنظيمية ، مما يعني أنه مطلوب للأغراض التنظيمية. الحد الأدنى المتوقع عند البشر هو حوالي 5٪ من إجمالي الجينوم.

قد يعمل أكثر من 10٪ من 32 جينومًا للثدييات من خلال تكوين هياكل ثانوية معينة من الحمض النووي الريبي. [51] استخدمت الدراسة علم الجينوم المقارن لتحديد طفرات الحمض النووي التعويضية التي تحافظ على الاقتران القاعدي للحمض النووي الريبي ، وهي سمة مميزة لجزيئات الحمض النووي الريبي. أكثر من 80٪ من المناطق الجينومية التي تقدم دليلاً تطوريًا للحفاظ على بنية الحمض النووي الريبي لا تقدم حفظًا قويًا لتسلسل الحمض النووي.

قد يعمل الحمض النووي غير المشفر على تقليل احتمالية التمزق الجيني أثناء تقاطع الكروموسومات. [52]

دليل من عشرات Polygenic وتحرير GWAS

أدت دراسات الارتباط على مستوى الجينوم (GWAS) وتحليل التعلم الآلي لمجموعات البيانات الجينومية الكبيرة إلى بناء تنبؤات متعددة الجينات للسمات البشرية مثل الطول وكثافة العظام والعديد من مخاطر الأمراض. توجد مؤشرات مماثلة للأنواع النباتية والحيوانية وتستخدم في التربية الزراعية. [54] تم تحليل البنية الجينية التفصيلية للمتنبئين البشريين ، وترتبط التأثيرات المهمة المستخدمة في التنبؤ بمناطق الحمض النووي البعيدة خارج مناطق الترميز. يختلف جزء التباين الذي تم حسابه (أي جزء القدرة التنبؤية التي تم التقاطها بواسطة المتنبئ) في مناطق الترميز مقابل المناطق غير المشفرة اختلافًا كبيرًا باختلاف السمات المعقدة. على سبيل المثال ، يتم التحكم في الغالب بالرجفان الأذيني ومخاطر الإصابة بأمراض الشريان التاجي من خلال المتغيرات في المناطق غير المشفرة (جزء التباين غير المشفر يزيد عن 70 بالمائة) ، بينما يُظهر مرض السكري وارتفاع الكوليسترول النمط المعاكس (التباين غير المشفر تقريبًا 20-30 بالمائة ). [53] من الواضح أن الفروق الفردية بين البشر تتأثر بشكل كبير بالمواضع الجينية غير المشفرة ، وهو دليل قوي على التأثيرات الوظيفية. لا تحتوي الأنماط الجينية الكاملة للإكسوم (أي التي تحتوي على معلومات مقصورة على مناطق الترميز فقط) على معلومات كافية لبناء أو حتى تقييم تنبؤات متعددة الجينات للعديد من السمات المعقدة المدروسة جيدًا ومخاطر الأمراض.

في عام 2013 ، قُدر أنه ، بشكل عام ، ما يصل إلى 85 ٪ من مواقع GWAS لها متغيرات غير مشفرة كعلاقة سببية محتملة. غالبًا ما تكون المتغيرات شائعة في السكان وكان من المتوقع أن تؤثر على مخاطر المرض من خلال التأثيرات المظهرية الصغيرة ، على عكس التأثيرات الكبيرة للمتغيرات المندلية. [55]

تحدد بعض تسلسلات الحمض النووي غير المشفرة مستويات التعبير للجينات المختلفة ، سواء تلك التي يتم نسخها إلى بروتينات أو تلك التي تشارك هي نفسها في تنظيم الجينات. [56] [57] [58]

تحرير عوامل النسخ

تحدد بعض تسلسلات الحمض النووي غير المشفرة مكان ارتباط عوامل النسخ. [56] عامل النسخ هو بروتين يرتبط بتسلسلات DNA محددة غير مشفرة ، وبالتالي يتحكم في تدفق (أو نسخ) المعلومات الجينية من DNA إلى mRNA. [59] [60]

عوامل تحرير

المشغل هو جزء من الحمض النووي يرتبط به الكابت. الكابت هو بروتين مرتبط بالحمض النووي ينظم التعبير عن جين واحد أو أكثر من خلال الارتباط بالمشغل ومنع ارتباط بوليميريز الحمض النووي الريبي بالمحفز ، وبالتالي منع نسخ الجينات. يسمى حظر التعبير هذا بالقمع. [61]

معززات تحرير

المُحسِّن هو منطقة قصيرة من الحمض النووي يمكن ربطها بالبروتينات (عوامل التأثير العابر) ، مثل مجموعة عوامل النسخ ، لتعزيز مستويات نسخ الجينات في مجموعة جينية. [62]

تحرير كاتمات الصوت

كاتم الصوت هو منطقة من الحمض النووي يعطل التعبير الجيني عندما يرتبط ببروتين منظم. إنه يعمل بطريقة مشابهة جدًا للمُحسِّنات ، ويختلف فقط في تعطيل الجينات. [63]

المروجين تحرير

المحفز هو منطقة من الحمض النووي تسهل نسخ جين معين عندما يرتبط به عامل النسخ. توجد المروجين عادة بالقرب من الجينات التي تنظمها ومنبعها. [64]

تحرير العوازل

العازل الجيني هو عنصر حدودي يلعب دورين متميزين في التعبير الجيني ، إما كرمز يحظر المحسن ، أو نادرًا كحاجز ضد الكروماتين المكثف. يمكن مقارنة العازل في تسلسل الحمض النووي بمقسم الكلمات اللغوي مثل الفاصلة في الجملة ، لأن العازل يشير إلى مكان انتهاء التسلسل المحسن أو المكبوت. [65]

تطور التحرير

التسلسلات المشتركة للحمض النووي غير الوظيفي على ما يبدو هي خط رئيسي من الأدلة على الأصل المشترك. [66]

يبدو أن متواليات الجينات الزائفة تتراكم الطفرات بسرعة أكبر من تسلسلات الترميز بسبب فقدان الضغط الانتقائي. [15] يسمح ذلك بتكوين أليلات طافرة تتضمن وظائف جديدة قد يفضلها الانتقاء الطبيعي ، وبالتالي ، يمكن أن تعمل الجينات الخادعة كمواد خام للتطور ويمكن اعتبارها "جينات أولية". [67]

أظهرت دراسة نُشرت في عام 2019 أن الجينات الجديدة (يطلق عليها من جديد الولادة الجينية) من مناطق غير مشفرة. [68] تشير بعض الدراسات إلى أنه يمكن صنع عُشر الجينات على الأقل بهذه الطريقة. [68]

تحرير الارتباطات طويلة المدى

تم العثور على تمييز إحصائي بين تسلسل الحمض النووي المشفر وغير المشفر. لقد لوحظ أن النيوكليوتيدات في تسلسل الحمض النووي غير المشفر تعرض ارتباطات طويلة المدى لقانون القدرة بينما لا تفعل تسلسل الترميز. [69] [70] [71]

تحرير أنثروبولوجيا الطب الشرعي

تقوم الشرطة أحيانًا بجمع الحمض النووي كدليل لأغراض تحديد هوية الطب الشرعي. كما هو موضح في ماريلاند ضد كينغ، قرار للمحكمة العليا الأمريكية لعام 2013: [72]

يعتمد المعيار الحالي لاختبار الحمض النووي الشرعي على تحليل الكروموسومات الموجودة داخل نواة جميع الخلايا البشرية. تتكون مادة الحمض النووي في الكروموسومات من مناطق "ترميز" و "غير مشفرة". تُعرف مناطق الترميز بالجينات وتحتوي على المعلومات اللازمة للخلية لصنع البروتينات. . . . مناطق ترميز غير بروتينية. . . لا ترتبط ارتباطًا مباشرًا بصنع البروتينات ، [و] تمت الإشارة إليها باسم DNA "غير المرغوب فيه". قد تضلل صفة "الخردة" الشخص العادي ، لأنها في الواقع منطقة الحمض النووي المستخدمة بشكل شبه مؤكد لتحديد هوية الشخص. [72]


قضية الحمض النووي غير المرغوب فيه

الجينوم مثل كتب الحياة. لكن حتى وقت قريب ، كانت أغطيةهم مقفلة. أخيرًا يمكننا الآن فتح الكتب والصفحات من خلالها. لكن لدينا فقط فهم متواضع لما نراه بالفعل. ما زلنا غير متأكدين من مقدار تشفير الجينوم الخاص بنا للمعلومات المهمة لبقائنا ، ومقدار الحشو المشوه.

اليوم هو يوم جيد للغطس في الجدل حول ماهية الجينوم ، وذلك بفضل نشر تعليق مثير للاهتمام من Alex Palazzo و Ryan Gregory في علم الوراثة PLOS. يطلق عليه "The Case for Junk DNA."

يمكن أن يصبح الجدل حول الجينوم مذهلاً. أجد أفضل ترياق للدوار هو القليل من التاريخ. يبدأ هذا التاريخ في أوائل القرن العشرين.

في ذلك الوقت ، علم علماء الوراثة أننا نحمل الجينات - العوامل التي تنتقل من الآباء إلى الأبناء والتي تؤثر على أجسادنا - لكنهم لم يعرفوا ما هي الجينات التي تتكون منها.

تغير ذلك ابتداء من الخمسينيات. أدرك العلماء أن الجينات تتكون من الحمض النووي ، ثم اكتشفوا كيف تشكل الجينات بيولوجيتنا.

الحمض النووي الخاص بنا عبارة عن سلسلة من الوحدات تسمى القواعد. تقرأ خلايانا القواعد في امتداد DNA - جين - وتبني جزيء يسمى RNA مع تسلسل مماثل. ثم تستخدم الخلايا الحمض النووي الريبي كدليل لبناء البروتين. تحتوي أجسامنا على العديد من البروتينات المختلفة ، والتي تمنحها البنية وتؤدي وظائف مثل هضم الطعام.

ولكن في الخمسينيات من القرن الماضي ، بدأ العلماء أيضًا في اكتشاف أجزاء من الحمض النووي خارج مناطق ترميز البروتين والتي كانت مهمة أيضًا. عملت هذه العناصر التنظيمية المزعومة كمفاتيح للجينات المشفرة للبروتين. يمكن للبروتين الذي يلتصق بأحد هذه المفاتيح أن يدفع الخلية إلى إنتاج الكثير من البروتينات من جين معين. أو يمكن أن توقف الجين تمامًا.

في غضون ذلك ، كان العلماء يعثرون أيضًا على قطع من الحمض النووي في الجينوم يبدو أنها ليست جينات مشفرة للبروتين ولا عناصر تنظيمية. في الستينيات ، على سبيل المثال ، وجد روي بريتن وديفيد كوني مئات الآلاف من الأجزاء المتكررة من الحمض النووي ، والتي تبين أن كل منها لا يتجاوز بضع مئات من القواعد. كان العديد من هذه التسلسلات المتكررة نتاج امتدادات تشبه الفيروسات من الحمض النووي. صنعت هذه القطع من "الحمض النووي الأناني" نسخًا من نفسها تم إدخالها مرة أخرى في الجينوم. ثم قامت الطفرات بتحويلها إلى شظايا خاملة.

اكتشف علماء آخرون نسخًا إضافية من الجينات التي بها طفرات تمنعها من صنع البروتينات - وهو ما أصبح يُعرف باسم الجينات الكاذبة.

الجينوم البشري ، كما نعلم الآن ، يحتوي على حوالي 20 ألف جين مشفر للبروتين. قد يبدو هذا مثل الكثير من المواد الجينية. لكنها تشكل فقط حوالي 2٪ من الجينوم. بعض النباتات أكثر تطرفًا. بينما لدينا حوالي 3.2 مليار قاعدة في جينوماتنا ، فإن البصل يحتوي على 16 مليارًا ، تتكون معظمها من تسلسلات متكررة وحمض نووي شبيه بالفيروسات.

أصبح باقي الجينوم برية غامضة لعلماء الوراثة. سيذهبون في رحلات استكشافية لرسم خريطة للمناطق غير المشفرة ومحاولة معرفة ما تم صنعهم منه.

تبين أن بعض أجزاء الحمض النووي لها وظائف ، حتى لو لم تقم بتشفير البروتينات أو تعمل كمفاتيح. على سبيل المثال ، في بعض الأحيان تصنع خلايانا جزيئات RNA التي لا تعمل فقط كقوالب للبروتينات. بدلاً من ذلك ، لديهم وظائف خاصة بهم ، مثل استشعار المواد الكيميائية في الخلية. لذا فإن هذه الامتدادات من الحمض النووي تعتبر جينات أيضًا - وليس فقط جينات مشفرة للبروتين.

مع استكشاف الجينوم ، ظهرت مجموعة من الملصقات ، والتي استخدم بعضها في طرق مربكة - وأحيانًا غير مبالية. أصبح "الحمض النووي غير المشفر" اختصارًا للحمض النووي الذي لا يشفر البروتينات. لكن لا يزال بإمكان الحمض النووي غير المشفر أن يكون له وظيفة ، مثل إيقاف تشغيل الجينات أو إنتاج جزيئات RNA مفيدة.

بدأ العلماء أيضًا في الإشارة إلى "الحمض النووي غير المرغوب فيه". استخدم علماء مختلفون المصطلح للإشارة إلى أشياء مختلفة. استخدم عالم الوراثة الياباني سوسومو أونو المصطلح عند تطوير نظرية لكيفية تحور الحمض النووي. تصور Ohno تضاعف الجينات المشفرة للبروتين عن طريق الخطأ. في وقت لاحق ، ستصيب الطفرات النسخ الجديدة من تلك الجينات. In a few cases, the mutations would give the new gene copies a new function. In most, however, they just killed the gene. He referred to the extra useless copies of genes as junk DNA. Other people used the term to refer broadly to any piece of DNA that didn’t have a function.

And then–like crossing the streams in Ghostbusters–junk DNA and non-coding DNA got mixed up. Sometimes scientists discovered a stretch of non-coding DNA that had a function. They might clip out the segment from the DNA in an egg and find it couldn’t develop properly. BAM!–there was a press release declaring that non-coding DNA had long been dismissed as junk, but lo and behold, non-coding DNA can do something after all.

Given that regulatory elements were discovered in the 1950s (the discovery was recognized with Nobel Prizes), this is just illogical.

Nevertheless, a worthwhile questioned remained: how of the genome had a function? How much was junk?

To Britten and Kohne, the idea that repeating DNA was useless was “repugnant.” Seemingly on aesthetic grounds, they preferred the idea that it had a function that hadn’t been discovered yet.

Others, however, argued that repeating DNA (and pseudogenes and so on) were just junk–vast vestiges of disabled genetic material that we carry down through the generations. If the genome was mostly functional, then it was hard to see why it takes five times more functional DNA to make an onion than a human–or to explain the huge range of genome sizes:

In recent years, a consortium of scientists carried out a project called the Encyclopedia of DNA Elements (ENCODE for short) to classify all the parts of the genome. To see if non-coding DNA was functional, they checked for proteins that were attached to them–possibly switching on regulatory elements. They found a lot of them.

“These data enabled us to assign biochemical functions for 80% of the genome, in particular outside of the well-studied protein-coding regions,” they reported.

علم translated that conclusion into a headline, “ENCODE Project writes eulogy for junk DNA.”

A lot of defenders of junk have attacked this conclusion–or, to be more specific, how the research got translated into press releases and then into news articles. In their new review, Palazzo and Gregory present some of the main objections.

Just because proteins grab onto a piece of DNA, for example, doesn’t actually mean that there’s a gene nearby that is going to make something useful. It could just happen to have the right sequence to make the proteins stick to it.

And even if a segment of DNA does give rise to RNA, that RNA may not have a function. The cell may accidentally make RNA molecules, which they then chop up.

If I had to guess why Britten and Kohne found junk DNA repugnant, it probably had to do with evolution. Darwin, after all, had shown how natural selection can transform a population, and how, over millions of years, it could produce adaptations. In the 1900s, geneticists turned his idea into a modern theory. Genes that boosted reproduction could become more common, while ones that didn’t could be eliminated from a population. You’d expect that natural selection would have left the genome mostly full of functional stuff.

Palazzo and Gregory, on the other hand, argue that evolution يجب produce junk. The reason has to do with the fact that natural selection can be quite weak in some situations. The smaller a population gets, the less effective natural selection is at favoring beneficial mutations. In small populations, a mutation can spread even if it’s not beneficial. And compared to bacteria, the population of humans is very small. (Technically speaking, it’s the “effective population size” that’s small–follow the link for an explanation of the difference.) When non-functional DNA builds up in our genome, it’s harder for natural selection to strip it out than if we were bacteria.

While junk is expected, a junk-free genome is not. Palazzo and Gregory based this claim on a concept with an awesome name: mutational meltdown.

Here’s how it works. A population of, say, frogs is reproducing. Every time they produce a new tadpole, that tadpole gains a certain number of mutations. A few of those mutations may be beneficial. The rest will be neutral or harmful. If harmful mutations emerge at a rate that’s too fast for natural selection to weed them out, they’ll start to pile up in the genome. Overall, the population will get sicker, producing fewer offspring. Eventually the mutations will drive the whole population to extinction.

Mutational meltdown puts an upper limit on how many genes an organism can have. If a frog has 10,000 genes, those are 10,000 potential targets for a harmful mutation. If the frog has 100,000 genes, it has ten times more targets.

Estimates of the human mutation rate suggest that somewhere between 70 to 150 new mutations strike the genome of every baby. Based on the risk of mutational meltdown, Palazzo and Gregory estimate that only ten percent of the human genome can be functional.* The other ninety percent must be junk DNA. If a mutation alters junk DNA, it doesn’t do any harm because the junk isn’t doing us any good to begin with. If our genome was 80 percent functional–the figure batted around when the ENCODE project results first came out–then we should be extinct.

It may sound wishy-washy for me to say this, but the junk DNA debates will probably settle somewhere in between the two extremes. Is the entire genome functional? No. Is everything aside from protein-coding genes junk? No–we’ve already known that non-coding DNA can be functional for over 50 years. Even if “only” ten percent of the genome turns out to be functional, that’s a huge collection of DNA. It’s six times bigger than the DNA found in all our protein-coding genes. There could be thousands of RNA molecules scientists have yet to understand.

Even if ninety percent of the genome does prove to be junk, that doesn’t mean the junk hasn’t played a role in our evolution. As I wrote last week in the نيويورك تايمز, it’s from these non-coding regions that many new protein-coding genes evolve. What’s more, much of our genome is made up of viruses, and every now and then evolution has, in effect, harnessed those viral genes to carry out a job for our own bodies. The junk is a part of us, and it, too, helps to make us what we are.

*I mean functional in terms of its sequence. The DNA might still do something important structurally–helping the molecule bend in a particular way, for example.

[Update: Fixed caption. Tweaked the last paragraph to clarify that it’s not a case of teleology.]


قائمة المصطلحات

DNA: Deoxyribonucleic acid is the chemical that stores genetic information in our cells. Shaped like a double helix, DNA passes down from one generation to the next.

RNA: Ribonucleic acid is a type of molecule used in making proteins in the body.

Genome: The complete genetic makeup of an organism, which contains all the biological information to build and keep it alive.

Gene: A stretch of DNA that tells a cell how to make specific proteins or RNA molecules.

Enzyme: A molecule that promotes a chemical reaction inside a living organism.

Stem cell: A biological master cell that can multiply and become many different types of tissue. They can also replicate to make more stem cells.


Functions for the Useless

Nearly a decade after the completion of the Human Genome Project, which gave us the first full read of our genetic script at the start of the century, a team of over 400 scientists released what they called the Encyclopedia of DNA Elements , or ENCODE for short. The international collaboration explored the function of every letter in the genome. The results of the massive undertaking called for a reassessment of junk DNA. Though less than two percent of the genome makes proteins, around 80 percent carries out some sort of function.

What fell into ENCODE’s definition of functionality was pretty broad, however. Any “biochemical activity” was fair game — getting transcribed into RNA, even if chopped later in the process, qualified sequences as functional. But many of the “junk” sections do have important roles, including regulating how DNA is transcribed and translated from there into proteins. If protein-coding sequences are the notes of a symphony, then some of the non-coding sequences act like the conductor, influencing the pace and repetitions of the masterpiece.

But not every bit of junk DNA might have a functional use. In a study published in Molecular Biology of the Cell in 2008, scientists cleaned junk DNA from yeast’s genome. For particular genes, they got rid of introns — the sections that get chopped away after DNA transcription. They reported the intron removal had no significant consequences for the cells under laboratory conditions, supporting the notion that they don’t have any function.

But studies published in Nature this year argued otherwise. When food is scarce, researchers found these sequences are essential for yeast survival. The usefulness of these introns might depend on the context, these studies argue — still a far cry from being junk.


Research team finds important role for junk DNA

Scientists have called it "junk DNA." They have long been perplexed by these extensive strands of genetic material that dominate the genome but seem to lack specific functions. Why would nature force the genome to carry so much excess baggage?

Now researchers from Princeton University and Indiana University who have been studying the genome of a pond organism have found that junk DNA may not be so junky after all. They have discovered that DNA sequences from regions of what had been viewed as the "dispensable genome" are actually performing functions that are central for the organism. They have concluded that the genes spur an almost acrobatic rearrangement of the entire genome that is necessary for the organism to grow.

It all happens very quickly. Genes called transposons in the single-celled pond-dwelling organism Oxytricha produce cell proteins known as transposases. During development, the transposons appear to first influence hundreds of thousands of DNA pieces to regroup. Then, when no longer needed, the organism cleverly erases the transposases from its genetic material, paring its genome to a slim 5 percent of its original load.

Laura Landweber (Photo: Denise Applewhite)

"The transposons actually perform a central role for the cell," said Laura Landweber, a professor of ecology and evolutionary biology at Princeton and an author of the study. "They stitch together the genes in working form." The work appeared in the May 15 edition of Science.

In order to prove that the transposons have this reassembly function, the scientists disabled several thousand of these genes in some Oxytricha. The organisms with the altered DNA, they found, failed to develop properly.

Other authors from Princeton's Department of Ecology and Evolutionary Biology include: postdoctoral fellows Mariusz Nowacki and Brian Higgins 2006 alumna Genevieve Maquilan and graduate student Estienne Swart. Former Princeton postdoctoral fellow Thomas Doak, now of Indiana University, also contributed to the study.

Landweber and other members of her team are researching the origin and evolution of genes and genome rearrangement, with particular focus on Oxytricha because it undergoes massive genome reorganization during development.

In her lab, Landweber studies the evolutionary origin of novel genetic systems such as Oxytricha's. By combining molecular, evolutionary, theoretical and synthetic biology, Landweber and colleagues last year discovered an RNA (ribonucleic acid)-guided mechanism underlying its complex genome rearrangements.

"Last year, we found the instruction book for how to put this genome back together again -- the instruction set comes in the form of RNA that is passed briefly from parent to offspring and these maternal RNAs provide templates for the rearrangement process," Landweber said. "Now we've been studying the actual machinery involved in the process of cutting and splicing tremendous amounts of DNA. Transposons are very good at that."

The term "junk DNA" was originally coined to refer to a region of DNA that contained no genetic information. Scientists are beginning to find, however, that much of this so-called junk plays important roles in the regulation of gene activity. No one yet knows how extensive that role may be.

Instead, scientists sometimes refer to these regions as "selfish DNA" if they make no specific contribution to the reproductive success of the host organism. Like a computer virus that copies itself ad nauseum, selfish DNA replicates and passes from parent to offspring for the sole benefit of the DNA itself. The present study suggests that some selfish DNA transposons can instead confer an important role to their hosts, thereby establishing themselves as long-term residents of the genome.


Is 75% of the Human Genome Junk DNA?

By the rude bridge that arched the flood,
Their flag to April’s breeze unfurled,
Here once the embattled farmers stood,
And fired the shot heard round the world.

–Ralph Waldo Emerson, Concord Hymn

Emerson referred to the Battles of Lexington and Concord, the first skirmishes of the Revolutionary War, as the “shot heard round the world.”

While not as loud as the gunfire that triggered the Revolutionary War, a recent article published in Genome Biology and Evolution by evolutionary biologist Dan Graur has garnered a lot of attention, 1 serving as the latest salvo in the junk DNA wars—a conflict between genomics scientists and evolutionary biologists about the amount of functional DNA sequences in the human genome.

Clearly, this conflict has important scientific ramifications, as researchers strive to understand the human genome and seek to identify the genetic basis for diseases. The functional content of the human genome also has significant implications for creation-evolution skirmishes. If most of the human genome turns out to be junk after all, then the case for a Creator potentially suffers collateral damage.

According to Graur, no more than 25% of the human genome is functional—a much lower percentage than reported by the ENCODE Consortium. Released in September 2012, phase II results of the ENCODE project indicated that 80% of the human genome is functional, with the expectation that the percentage of functional DNA in the genome would rise toward 100% when phase III of the project reached completion.

If true, Graur’s claim would represent a serious blow to the validity of the ENCODE project conclusions and devastate the RTB human origins creation model. Intelligent design proponents and creationists (like me) have heralded the results of the ENCODE project as critical in our response to the junk DNA challenge.

Junk DNA and the Creation vs. Evolution Battle

Evolutionary biologists have long considered the presence of junk DNA in genomes as one of the most potent pieces of evidence for biological evolution. Skeptics ask, “Why would a Creator purposely introduce identical nonfunctional DNA sequences at the same locations in the genomes of different, though seemingly related, organisms?”

When the draft sequence was first published in 2000, researchers thought only around 2–5% of the human genome consisted of functional sequences, with the rest being junk. Numerous skeptics and evolutionary biologists claim that such a vast amount of junk DNA in the human genome is compelling evidence for evolution and the most potent challenge against intelligent design/creationism.

But these arguments evaporate in the wake of the ENCODE project. If valid, the ENCODE results would radically alter our view of the human genome. No longer could the human genome be regarded as a wasteland of junk rather, the human genome would have to be recognized as an elegantly designed system that displays sophistication far beyond what most evolutionary biologists ever imagined.

ENCODE Skeptics

The findings of the ENCODE project have been criticized by some evolutionary biologists who have cited several technical problems with the study design and the interpretation of the results. (See articles listed under “Resources to Go Deeper” for a detailed description of these complaints and my responses.) But ultimately, their criticisms appear to be motivated by an overarching concern: if the ENCODE results stand, then it means key features of the evolutionary paradigm can’t be correct.

Calculating the Percentage of Functional DNA in the Human Genome

Graur (perhaps the foremost critic of the ENCODE project) has tried to discredit the ENCODE findings by demonstrating that they are incompatible with evolutionary theory. Toward this end, he has developed a mathematical model to calculate the percentage of functional DNA in the human genome based on mutational load—the amount of deleterious mutations harbored by the human genome.

Graur argues that junk DNA functions as a “ sponge ” absorbing deleterious mutations, thereby protecting functional regions of the genome. Considering this buffering effect, Graur wanted to know how much junk DNA must exist in the human genome to buffer against the loss of fitness—which would result from deleterious mutations in functional DNA—so that a constant population size can be maintained.

Historically, the replacement level fertility rates for human beings have been two to three children per couple. Based on Graur’s modeling, this fertility rate requires 85–90% of the human genome to be composed of junk DNA in order to absorb deleterious mutations—ensuring a constant population size, with the upper limit of functional DNA capped at 25%.

Graur also calculated a fertility rate of 15 children per couple, at minimum, to maintain a constant population size, assuming 80% of the human genome is functional. According to Graur’s calculations, if 100% of the human genome displayed function, the minimum replacement level fertility rate would have to be 24 children per couple.

He argues that both conclusions are unreasonable. On this basis, therefore, he concludes that the ENCODE results cannot be correct.

Response to Graur

So, has Graur’s work invalidated the ENCODE project results? بالكاد. Here are four reasons why I’m skeptical.

1. Graur’s estimate of the functional content of the human genome is based on mathematical modeling, not experimental results.

An adage I heard repeatedly in graduate school applies: “Theories guide, experiments decide.” Though the ENCODE project results نظريا don’t make sense in light of the evolutionary paradigm, that is not a reason to consider them invalid. A growing number of studies provide independent تجريبي validation of the ENCODE conclusions. (Go here and here for two recent examples.)

To question experimental results because they don’t align with a theory’s predictions is a “ Bizarro World ” approach to science. Experimental results and observations determine a theory’s validity, not the other way around. Yet when it comes to the ENCODE project, its conclusions seem to be weighed based on their conformity to evolutionary theory. Simply put, ENCODE skeptics are doing science backwards.

While Graur and other evolutionary biologists argue that the ENCODE results don’t make sense from an evolutionary standpoint, I would argue as a biochemist that the high percentage of functional regions in the human genome makes perfect sense. The ENCODE project determined that a significant fraction of the human genome is transcribed. They also measured high levels of protein binding.

ENCODE skeptics argue that this biochemical activity is merely biochemical noise. But this assertion does not make sense because (1) biochemical noise costs energy and (2) random interactions between proteins and the genome would be harmful to the organism.

Transcription is an energy- and resource-intensive process. To believe that most transcripts are merely biochemical noise would be untenable. Such a view ignores cellular energetics. Transcribing a large percentage of the genome when most of the transcripts serve no useful function would routinely waste a significant amount of the organism’s energy and material stores. If such an inefficient practice existed, surely natural selection would eliminate it and streamline transcription to produce transcripts that contribute to the organism’s fitness.

Apart from energetics considerations, this argument ignores the fact that random protein binding would make a dire mess of genome operations. Without minimizing these disruptive interactions, biochemical processes in the cell would grind to a halt. It is reasonable to think that the same considerations would apply to transcription factor binding with DNA.

2. Graur’s model employs some questionable assumptions.

Graur uses an unrealistically high rate for deleterious mutations in his calculations.

Graur determined the deleterious mutation rate using protein-coding genes. These DNA sequences are highly sensitive to mutations. In contrast, other regions of the genome that display function—such as those that (1) dictate the three-dimensional structure of chromosomes, (2) serve as transcription factors, and (3) aid as histone binding sites—are much more tolerant to mutations. Ignoring these sequences in the modeling work artificially increases the amount of required junk DNA to maintain a constant population size.

3. The way Graur determines if DNA sequence elements are functional is questionable.

Graur uses the selected-effect definition of function. According to this definition, a DNA sequence is only functional if it is undergoing negative selection. In other words, sequences in genomes can be deemed functional فقط if they evolved under evolutionary processes to perform a particular function. Once evolved, these sequences, if they are functional, will resist evolutionary change (due to natural selection) because any alteration would compromise the function of the sequence and endanger the organism. If deleterious, the sequence variations would be eliminated from the population due to the reduced survivability and reproductive success of organisms possessing those variants. Hence, functional sequences are those under the effects of selection.

In contrast, the ENCODE project employed a سببي definition of function. Accordingly, function is ascribed to sequences that play some observationally or experimentally determined role in genome structure and/or function.

The ENCODE project focused on experimentally determining which sequences in the human genome displayed biochemical activity using assays that measured

  • transcription,
  • binding of transcription factors to DNA,
  • histone binding to DNA,
  • DNA binding by modified histones,
  • DNA methylation, and
  • three-dimensional interactions between enhancer sequences and genes.

In other words, if a sequence is involved in any of these processes—all of which play well-established roles in gene regulation—then the sequences must have functional utility. That is, if sequence س performs function جي, then sequence س is functional.

So why does Graur insist on a selected-effect definition of function? For no other reason than a causal definition ignores the evolutionary framework when determining function. He insists that function be defined exclusively within the context of the evolutionary paradigm. In other words, his preference for defining function has more to do with philosophical concerns than scientific ones—and with a deep-seated commitment to the evolutionary paradigm.

As a biochemist, I am troubled by the selected-effect definition of function because it is theory-dependent. In science, cause-and-effect relationships (which include biological and biochemical function) need to be established experimentally and observationally, independent of any particular theory. Once these relationships are determined, they can then be used to evaluate the theories at hand. Do the theories predict (or at least accommodate) the established cause-and-effect relationships, or not?

Using a theory-dependent approach poses the very real danger that experimentally determined cause-and-effect relationships (or, in this case, biological functions) will be discarded if they don’t fit the theory. And, again, it should be the other way around. A theory should be discarded, or at least reevaluated, if its predictions don’t match these relationships.

What difference does it make which definition of function Graur uses in his model? A big difference. The selected-effect definition is more restrictive than the causal-role definition. This restrictiveness translates into overlooked function and increases the replacement level fertility rate.

4. Buffering against deleterious mutations is a function.

As part of his model, Graur argues that junk DNA is necessary in the human genome to buffer against deleterious mutations. By adopting this view, Graur has inadvertently identified function for junk DNA. In fact, he is not the first to argue along these lines. Biologist Claudiu Bandea has posited that high levels of junk DNA can make genomes resistant to the deleterious effects of transposon insertion events in the genome. If insertion events are random, then the offending DNA is much more likely to insert itself into “junk DNA” regions instead of coding and regulatory sequences, thus protecting information-harboring regions of the genome.

If the last decade of work in genomics has taught us anything, it is this: we are in our infancy when it comes to understanding the human genome. The more we learn about this amazingly complex biochemical system, the more elegant and sophisticated it becomes. Through this process of discovery, we continue to identify functional regions of the genome—DNA sequences long thought to be “ junk. ”

In short, the criticisms of the ENCODE project reflect a deep-seated commitment to the evolutionary paradigm and, bluntly, are at war with the experimental facts.

Bottom line: if the ENCODE results stand, it means that key aspects of the evolutionary paradigm can’t be correct.


Perennial Problem of C-Value

Information and Structure.

The junk idea long predates genomics and since its early decades has been grounded in the “C-value paradox,” the observation that DNA amounts (C-value denotes haploid nuclear DNA content) and complexities correlate very poorly with organismal complexity or evolutionary “advancement” (10 ⇓ ⇓ ⇓ –14). Humans do have a thousand times as much DNA as simple bacteria, but lungfish have at least 30 times more than humans, as do many flowering plants and some unicellular protists (14). Moreover, as is often noted, the disconnection between C-value and organismal complexity is also found within more restricted groups comprising organisms of seemingly similar lifestyle and comparable organismal or behavioral complexity. The most heavily burdened lungfish (Protopterus aethiopicus) lumbers around with 130,000 Mb, but the pufferfish تاكيفوغو (سابقا Fugu) rubripes gets by on less than 400 Mb (15, 16). A less familiar but better (because monophyletic) animal example might be amphibians, showing a 120-fold range from frogs to salamanders (17). Among angiosperms, there is a thousandfold variation (14). Additionally, even within a single genus, there can be substantial differences. Salamander species belonging to بليثودون boast a fourfold range, to cite a comparative study popular from the 1970s (18). Sometimes, such within-genus genome size differences reflect large-scale or whole-genome duplications and sometimes rampant selfish DNA or transposable element (TE) multiplication. Schnable et al. (19) figure that the maize genome has more than doubled in size in the last 3 million y, overwhelmingly through the replication and accumulation of TEs for example. If we do not think of this additional or “excess” DNA, so manifest through comparisons between and within biological groups, as junk (irrelevant if not frankly detrimental to the survival and reproduction of the organism bearing it), how then are we to think of it?

Of course, DNA inevitably does have a basic structural role to play, unlinked to specific biochemical activities or the encoding of information relevant to genes and their expression. Centromeres and telomeres exemplify noncoding chromosomal components with specific functions. More generally, DNA as a macromolecule bulks up and gives shape to chromosomes and thus, as many studies show, determines important nuclear and cellular parameters such as division time and size, themselves coupled to organismal development (11 ⇓ –13, 17). The “selfish DNA” scenarios of 1980 (20 ⇓ –22), in which C-value represents only the outcome of conflicts between upward pressure from reproductively competing TEs and downward-directed energetic restraints, have thus, in subsequent decades, yielded to more nuanced understandings. Cavalier-Smith (13, 20) called DNA’s structural and cell biological roles “nucleoskeletal,” considering C-value to be optimized by organism-level natural selection (13, 20). Gregory, now the principal C-value theorist, embraces a more “pluralistic, hierarchical approach” to what he calls “nucleotypic” function (11, 12, 17). A balance between organism-level selection on nuclear structure and cell size, cell division times and developmental rate, selfish genome-level selection favoring replicative expansion, and (as discussed below) supraorganismal (clade-level) selective processes—as well as drift—must all be taken into account.

These forces will play out differently in different taxa. González and Petrov (23) point out, for instance, that ذبابة الفاكهة and humans are at opposite extremes in terms of the balance of processes, with the minimalist genomes of the former containing few (but mostly young and quite active) TEs, whereas at least one-half of our own much larger genome comprises the moribund remains of older TEs, principally SINEs and LINEs (short and long interspersed nuclear elements). Such difference may in part reflect population size. As Lynch notes, small population size (characteristic of our species) will have limited the effectiveness of natural selection in preventing a deleterious accumulation of TEs (24, 25).

Zuckerkandl (26) once mused that all genomic DNA must be to some degree “polite,” in that it must not lethally interfere with gene expression. Indeed, some might suggest, as I will below, that true junk might better be defined as DNA not currently held to account by selection for any sort of role operating at any level of the biological hierarchy (27). However, junk advocates have to date generally considered that even DNA fulfilling bulk structural roles remains, in terms of encoded information, just junk. Cell biology may require a certain C-value, but most of the stretches of noncoding DNA that go to satisfying that requirement are junk (or worse, selfish).

In any case, structural roles or multilevel selection theorizing are not what ENCODE commentators are endorsing when they proclaim the end of junk, touting the existence of 4 million gene switches or myriad elements that determine gene expression and assigning biochemical functions for 80% of the genome. Indeed, there would be no excitement in either the press or the scientific literature if all the ENCODE team had done was acknowledge an established theory concerning DNA’s structural importance. Rather, the excitement comes from interpreting ENCODE’s data to mean that a much larger fraction of our DNA than until very recently thought contributes to our survival and reproduction as organisms, because it encodes information transcribed or expressed phenotypically in one tissue or another, or specifically regulates such expression.

A Thought Experiment.

ENCODE (5) defines a functional element (FE) as “a discrete genome segment that encodes a defined product (for example, protein or non-coding RNA) or displays a reproducible biochemical signature (for example, protein binding, or a specific chromatin structure).” A simple thought experiment involving FEs so-defined is at the heart of my argument.

Suppose that there had been (and probably, some day, there will be) ENCODE projects aimed at enumerating, by transcriptional and chromatin mapping, factor footprinting, and so forth, all of the FEs in the genomes of تاكيفوغو and a lungfish, some small and large genomed amphibians (including several species of بليثودون), plants, and various protists. There are, I think, two possible general outcomes of this thought experiment, neither of which would give us clear license to abandon junk.

The first outcome would be that FEs (estimated to be in the millions in our genome) turn out to be more or less constant in number, regardless of C-value—at least among similarly complex organisms. If larger C-value by itself does not imply more FEs, then there will, of course, be great differences in what we might call functional density (FEs per kilobase) (26) among species. FEs spaced by kilobases in أرابيدوبسيس would be megabases apart in maize on average. Averages obscure details: the extra DNA in the larger genomes might be sequestered in a few giant silent regions rather than uniformly stretching out the space between FEs or lengthening intragenic introns. However, in either case, this DNA could be seen as a sort of polite functionless filler or diluent. At best, such DNA might have functions only of the structural or nucleoskeletal/nucleotypic sort. Indeed, even this sort of functional attribution is not necessary. There is room within an expanded, pluralistic and hierarchical theory of C-value (see below) (12, 27) for much DNA that makes no contribution whatever to survival and reproduction at the organismal level and thus is junk at that level, although it may be under selection at the sub- or supraorganismal levels (TEs and clade selection).

If the human genome is junk-free, then it must be very luckily poised at some sort of minimal size for organisms of human complexity. We may no longer think that mankind is at the center of the universe, but we still consider our species’ genome to be unique, first among many in having made such full and efficient use of all of its millions of SINES and LINES (retrotransposable elements) and introns to encode the multitudes of lncRNAs and house the millions of enhancers necessary to make us the uniquely complex creatures that we believe ourselves to be. However, were this extraordinary coincidence the case, a corollary would be that junk would not be defunct for many other larger genomes: the term would not need to be expunged from the genomicist’s lexicon more generally. As well, if, as is commonly believed, much of the functional complexity of the human genome is to be explained by evolution of our extraordinary cognitive capacities, then many other mammals of lesser acumen but similar C-value must truly have junk in their DNA.

The second likely general outcome of my thought experiment would be that FEs as defined by ENCODE increase in number with C-value, regardless of apparent organismal complexity. If they increase roughly proportionately, FE numbers will vary over a many-hundredfold range among organisms normally thought to be similarly complex. Defining or measuring complexity is, of course, problematic if not impossible. Still, it would be hard to convince ourselves that lungfish are 300 times more complex than تاكيفوغو or 40 times more complex than us, whatever complexity might be. More likely, if indeed FE numbers turn out to increase with C-value, we will decide that we need to think again about what function is, how it becomes embedded in macromolecular structures, and what FEs as defined by ENCODE have to tell us about it.


What's the origin of junk DNA? - مادة الاحياء

NIST-led Research De-Mystifies Origins Of 'Junk' DNA

One man's junk, is another's treasure
Washington - Mar 26, 2004
A debate over the origins of what is sometimes called "junk" DNA has been settled by research involving scientists at the Center for Advanced Research in Biotechnology (CARB) and a collaborator, who developed rigorous proof that these mysterious sections were added to DNA "late" in the evolution of life on earth--after the formation of modern-sized genes, which contain instructions for making proteins.

A biologist with the Commerce Department's National Institute of Standards and Technology (NIST) led the research team, which reported its findings in the March 10 online edition of Molecular Biology and Evolution.

The results are based on a systematic, statistically rigorous analysis of publicly available genetic data carried out with bioinformatics software developed at CARB.

In humans, there is so much apparent "junk" DNA (sections of the genome with no known function) that it takes up more space than the functional parts. Much of this junk consists of "introns," which appear as interruptions plopped down in the middle of genes.

Discovered in the 1970s, introns mystify scientists but are readily accounted for by cells: when the cellular machinery transcribes a gene in preparation for making a protein, introns are simply spliced out of the transcript.

Research from the CARB group appears to resolve a debate over the "early versus late" timing of the appearance of introns. Since introns were discovered in 1978, scientists have debated whether genes were born split (the "introns-early" view), or whether they became split after eukaryotic cells (the ones that gave rise to animals and their relatives) diverged from bacteria roughly 2 billion years ago (the "introns-late" view).

Bacterial genomes lack introns. Although the study did not attempt to propose a function for introns, or determine whether they are beneficial or harmful, the results appear to rule out the "introns-early" view.

The CARB analysis shows that the probability of a modern intron's presence in an ancestral gene common to the genes studied is roughly 1 percent, indicating that the vast majority of today's introns appeared subsequent to the origin of the genes.

This conclusion is supported by the findings regarding placement patterns for introns within genes. It long has been observed that, in the sequences of nitrogen-containing compounds that make up our DNA genomes, introns prefer some sites more than others. The CARB study indicates that these preferences are side effects of late-stage intron gain, rather than side effects of intron-mediated gene formation.

The CARB results are based on an analysis of carefully processed data for 10 families of protein-coding genes in animals, plants, fungi and their relatives (see sidebar for details of the method used). A variety of statistical modeling, theoretical, and automated analytical approaches were used while most were conventional, their combined application to the study of introns was novel.

The CARB study also is unique in using an evolutionary model as the basis for inferring the presence of ancestral introns. The research was made possible in part by the increasing availability, over the past decade, of massive amounts of genetic sequence data.

The lead researcher is Arlin B. Stoltzfus of NIST collaborators include Wei-Gang Qiu, formerly of CARB and the University of Mayland and now at Hunter College in New York City, and Nick Schisler, currently at Furman University, Greenville, S.C.

CARB is a cooperative venture of NIST and the University of Maryland Biotechnology Institute.

CARB's Approach to Understanding the Origins of 'Junk' DNA

Scientists long have compared the sequences of chemical compounds in different proteins, genes and entire genomes to derive clues about structure and function.

The most sophisticated comparative methods are evolutionary and rely on matching similar sequences from different organisms, inferring family trees to determine relationships, and reconstructing changes that must have occurred to create biologically relevant differences.

This type of analysis is usually done with one sequence family at a time. The Center for Advanced Research in Biotechnology (CARB), a cooperative venture of the Commerce Department's National Institute of Standards and Technology (NIST) and the University of Maryland Biotechnology Institute, developed software to automate the analysis of dozens--and perhaps hundreds, eventually--of sequence families at a time.

The automated methods also assess the reliability of all the information, so that conclusions are based on the most reliable parts of the analysis.

The CARB method has two parts. The first part consists of a combination of manual and automated processing of gene data from public databases. The data are clustered into families through matching of similar sequences, first in pairs and then in groups.

Then family trees are developed indicating how the genes are related to each other. A file is developed for each family that includes data on sequence matches, intron locations, family trees and reliability measures.

These datasets then are loaded into the second part of the system, which is fully automated. It consist of a relational database combined with software that computes probabilities for introns being present in ancestral genes using a method developed at CARB.

Each gene is assigned to a kingdom (plants, animals, fungi and others), and a matrix of intron presence/absence data is determined for each family based on the sequence alignments. This matrix, along with the family tree, is used to estimate ancestral states of introns, as well as rates of intron loss and gain. Additional software is used for analysis and visualization of results.

The CARB study analyzed data for 10 families of protein-coding genes in multi-celled organisms, encompassing 1,868 introns at 488 different positions.

Life-Seeking Chip Will Join Space Probes
Pasadena (UPI) Mar 23, 2004
U.S. scientists said Tuesday they have developed a miniature laboratory that can spot a tell-tale chemical signature of life.

With the rise of Ad Blockers, and Facebook - our traditional revenue sources via quality network advertising continues to decline. And unlike so many other news sites, we don't have a paywall - with those annoying usernames and passwords.


شاهد الفيديو: ما هو الحمض النووي DNA وكيف يعمل شرح بسيط وعلمي (أغسطس 2022).