معلومة

النسخ العكسي على نطاق واسع؟

النسخ العكسي على نطاق واسع؟



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أحتاج لعمل RNA: DNA مزدوج. يمكنني صنع 100 إلى 200 ميكروغرام من مرنا من خلاله في المختبر النسخ ، وأنا أعرف كيفية استخدام النسخ العكسي لإنشاء مكتبة cDNA ، لكن لدي أسئلة حول هذا.

إن mRNA الذي أصنعه باستخدام IVT هو كل poly A RNA ، ومجموعة النسخ العكسي التي أشرت إليها لاستخدام 5ug من إجمالي RNA أو 500ng من poly A RNA. أحتاج إلى إنتاج ما لا يقل عن 10 ميكروغرام من RNA: DNA ، وهو 20 ضعف الحد المقترح لـ poly A RNA ، لذلك ربما لا يكون التوسع المباشر عمليًا.

لا يمكنني العثور على سابقة أدبية لصنع مثل هذه الكميات الكبيرة من الحمض النووي من خلال النسخ العكسي ، كل ما وجدته يستخدم الحمض النووي الريبي: استخدمت نسخ الحمض النووي المزدوجة خيوطًا قصيرة تم تصنيعها ودمجها كيميائيًا ، و mRNA الخاص بي يبلغ طوله 1800 قاعدة ، لذا يمكنني ذلك. ر فقط أطلب قلة ، لا بد لي من القيام بذلك.

تحرير: لا يمكنني التعليق على سؤالي الخاص.

الدوبلكس سيكون طوله حوالي 1800 قاعدة ، إنه لوزيفيراز اليراع.

إن محاولة صنع الحمض النووي للنسخة المزدوجة من قالب الحمض النووي الأصلي يعرض قضايا أخرى. في حين أنه سيكون من السهل قطعه عن البلازميد ، إلا أنه سيكون مزدوجًا ، وسأضطر إلى الاختلاط مع RNA وتسخينه لفصل كل شيء وأتمنى أن يكون الحمض النووي الريبي مرتبطًا قبل إعادة ربط خيوط الحمض النووي. أعتقد أيضًا أنه سيعقد ضوابطي ، لأنه سيكون من الصعب القول أن أي تعبير أراه بعد توصيل هذه النسخ المزدوجة جاء من الحمض النووي الريبي وليس الحمض النووي. بالطبع ، يمكن أن يؤدي تصنيع الحمض النووي من الحمض النووي الريبي إلى إحداث هذه المشكلة.

تشير بعض الحسابات الأولية إلى أن dNTPs هي الكاشف المحدد لنسخة بهذا الحجم ، وأنه حتى مع 5ug من mRNA يجب أن يكون لدي ما يكفي من oligo dT التمهيدي للتفاعل. أنا الآن أقوم بتشغيل ردود فعل من 0.5 إلى 5ug من mRNA ، و 1uL من التمهيدي ، و 4uL من dNTPs ، للتأكد من أن لدي ما يكفي. نأمل أن يتحول الجل بشكل جيد.

تحرير: حصلت على النتائج. حتى الآن يبدو أن 3.0ug من mRNA يعمل بشكل أفضل. يحتوي على أحلك شريط ويبدو الطول المناسب. يعطي القليل من mRNA نطاقات أكثر خفوتًا تبدو قصيرة جدًا ، ويعطي المزيد من mRNA نطاقات أكثر خفوتًا قليلاً والتي تبدو قصيرة جدًا. أيضًا ، قمت بتشغيل رد الفعل لمدة ساعتين بدلاً من 1.


أفضل طريقة لتوسيع نطاق هذه الأنواع من التفاعلات هي إعداد العديد من التفاعلات. قم بإعداد Mastermix لنقل 20 من ردود الفعل. يمكنك تجميعها معًا ، وترسيب الحمض النووي الريبي (RNA) والذوبان إلى التركيز المناسب في الماء الخالي من نوكلياز. أيضًا ، استخدم التمهيدي الخاص بالجينات بدلاً من oligo-dT ولا تضيف ذيول poly-A (لا يؤثر poly-A على استقرار الحمض النووي الريبي في المختبر).

كما أشار Mad Scientist بالفعل ، لن تحتاج إلى صنع DNA مرة أخرى من RNA. ما عليك سوى أخذ نسبة 1: 2 مولار من نموذج IVT الخاص بك dsDNA (تقييد هضم) و RNA (post IVT). يسخن ويصلب ببطء. تعتبر هجينة DNA-RNA أقوى من هجينة DNA-DNA ومن المرجح أن تتشكل الأولى بعد التلدين. يمكنك هضم الخيوط غير المتزاوجة باستخدام إنزيمات مثل نوكلياز مونج الفول.


تفاعل البوليميراز المتسلسل للنسخ العكسي في الحويصلات العملاقة أحادية الطبقة

قمنا بتقييم قابلية تطبيق الحويصلات أحادية الطبقة العملاقة (GUVs) للكشف عن الحمض النووي الريبي باستخدام في الحويصلة تفاعل البوليميراز المتسلسل للنسخ العكسي (RT-PCR). لقد أعددنا GUVs التي تغلف خليط تفاعل RT-PCR أحادي الوعاء بما في ذلك قالب RNA ، والبادئات ، ومسبار Taqman ، باستخدام طريقة نقل مستحلب الماء في الزيت. بعد ركوب الدراجات الحرارية ، قمنا بتحليل GUVs التي أظهرت إشارات مضان مكثفة ، والتي مثلت تضخيم cDNA. أظهر التحليل التفصيلي لبيانات قياس التدفق الخلوي أنه يمكن تضخيم الرنا الريباسي والرنا المرسال في إجمالي الحمض النووي الريبي من 10-100 نسخة في GUVs بقطر 5-10 ميكرومتر ، على الرغم من أن جزء GUV القابل للتفاعل كان 60٪ تقريبًا على الأكثر. علاوة على ذلك ، أبلغنا أن الحمض النووي الريبي المستهدف ، الذي تم نقله مباشرة إلى مفاعلات GUV عبر اندماج الغشاء ، يمكن تضخيمه واكتشافه باستخدام في الحويصلة RT-PCR. تشير هذه النتائج إلى أنه يمكن استخدام GUVs كمفاعلات محاكاة حيوية قادرة على أداء PCR و RT-PCR ، وهما مهمان في التطبيقات التحليلية والتشخيصية ذات الوظائف الإضافية.


خطية النسخ العكسي

يمكن أن يؤثر التركيز النسبي للحمض النووي الريبي الكلي على كفاءة RT وتركيز (كدنا) الناتج من نسخة معينة. لذلك ، من المستحسن تضمين نفس تركيز RNA أو تركيز مشابه جدًا في جميع تفاعلات تخليق (كدنا) المكونة من خطوتين ، ما لم يتم التحقق من أن نظام RT لديه استجابة خطية. كما يمكن رؤيته في الشكل 8.2، باستخدام بروتوكول RT التقليدي ، لا ينتج عن التخفيفات 100 ضعف من RNA الإدخال فرق مقابل 100 ضعف في عائد (كدنا) للقوالب التي تم اختبارها. ومن المثير للاهتمام ، أن البيانات المقدمة هي عبارة عن qPCR مكررة يتم تشغيلها على تفاعلات RT مكررة. كما هو مبين ، فإن عدم وجود خطية يمكن استنساخه بين تفاعلين RT.

الشكل 8.2. تم تخفيف إجمالي الحمض النووي الريبي من خلال 100 ضعف والنسخ العكسي باستخدام تمهيد عشوائي من خطوتين تم إجراء تفاعلين RT مستقلين. تم اكتشاف β-actin في qPCRs مكررة لكل تفاعل RT. RT قابل للتكرار ، لكن عائد (كدنا) لا يتناسب مع تركيز الحمض النووي الريبي المدخلات. لذلك ، إذا كانت القيود التجريبية تتطلب أن يتم تضمين تركيز متغير من الحمض النووي الريبي في RT ، فمن الأهمية بمكان التحقق من أن البروتوكول ومجموعة الكاشف يؤديان إلى استجابة خطية.

في المثال الموضح في الشكل 8.3، تم استخدام كاشف ReadyScript ® RT (RDRT) لعكس نسخ إجمالي الحمض النووي الريبي من 2 أضعاف والتخفيف التسلسلي 10 أضعاف للقالب باستخدام بروتوكول من خطوتين ومزيج من oligo-dT (O4387) والتهيئة العشوائية (الموصوفة) أدناه). تم اكتشاف جين CANX في كلتا سلسلتي التخفيف بتناسب مباشر مع تركيز RNA المدخل.

الشكل 8.3. تم استخدام كاشف ReadyScript® RT (RDRT) لعكس نسخ إجمالي الحمض النووي الريبي من ضعفين و 10 أضعاف تخفيف تسلسلي. تم اكتشاف الجين CANX في كل من سلسلتي التخفيف مما أدى إلى تناسب مباشر مع تركيز إدخال الحمض النووي الريبي (البيانات من مجموعات الطلاب الذين يحضرون ورشة عمل EMBL Advanced qPCR).


محتويات

تم اكتشاف النسخ العكسية بواسطة Howard Temin في جامعة ويسكونسن ماديسون في ساركوما روس virions [5] وعزلها ديفيد بالتيمور بشكل مستقل في عام 1970 في معهد ماساتشوستس للتكنولوجيا من اثنين من فيروسات ورم الحمض النووي الريبي: فيروس سرطان الدم الفئران ومرة ​​أخرى فيروس ساركوما روس. [6] تقديراً لإنجازاتهم ، فقد تقاسموا جائزة نوبل عام 1975 في علم وظائف الأعضاء أو الطب (مع ريناتو دولبيكو).

تشمل النسخ العكسية المدروسة جيدًا ما يلي:

  • يحتوي النسخ العكسي لفيروس HIV-1 من النوع الأول من فيروس نقص المناعة البشرية (PDB: 1HMV) على وحدتين فرعيتين لهما أوزان جزيئية خاصة تبلغ 66 و 51 كيلو دالتون. [7]
  • إن إنزيم النسخ العكسي M-MLV من فيروس ابيضاض الدم في الفئران مولوني هو مونومر واحد 75 كيلو دالتون. [8]
  • يحتوي النسخ العكسي لـ AMV من فيروس الأرومة النقوية للطيور أيضًا على وحدتين فرعيتين ، وحدة فرعية 63 كيلو دالتون ووحدة فرعية 95 كيلو دالتون. [8] التي تحافظ على تيلوميرات الكروموسومات حقيقية النواة. [9]

يتم ترميز الإنزيمات واستخدامها من قبل الفيروسات التي تستخدم النسخ العكسي كخطوة في عملية النسخ المتماثل. تستخدم فيروسات RNA العكسية ، مثل الفيروسات القهقرية ، الإنزيم لعكس نسخ جينومات RNA الخاصة بها إلى DNA ، والتي يتم دمجها بعد ذلك في جينوم المضيف وتكرارها معها. يمكن لفيروسات DNA النسخ العكسي ، مثل فيروسات الكبد ، أن تسمح لـ RNA بالعمل كقالب في تجميع وصنع خيوط الحمض النووي. يصيب فيروس نقص المناعة البشرية البشر باستخدام هذا الإنزيم. بدون النسخ العكسي ، لن يكون الجينوم الفيروسي قادرًا على الاندماج في الخلية المضيفة ، مما يؤدي إلى فشل التكاثر.

عملية النسخ العكسي أو النسخ العكسي تحرير

يُنشئ إنزيم النسخ العكسي DNA مزدوج الشريطة من قالب RNA.

في أنواع الفيروسات ذات النسخ العكسية التي تفتقر إلى نشاط بوليميريز الحمض النووي المعتمد على الحمض النووي ، يمكن أن يتم إنشاء DNA مزدوج الشريطة بواسطة بوليميراز الحمض النووي المشفر بالمضيف δ ، مع الخلط بين الحمض النووي الريبي DNA-RNA الفيروسي وتوليف DNA مزدوج الشريطة بواسطة مماثل آلية كما هو الحال في إزالة التمهيدي ، حيث يزيح الحمض النووي المركب حديثًا قالب RNA الأصلي.

عملية النسخ العكسي ، والتي تسمى أيضًا النسخ العكسي أو النسخ الرجعي ، معرضة جدًا للخطأ ، وخلال هذه الخطوة قد تحدث الطفرات. قد تسبب هذه الطفرات مقاومة الأدوية.

تحرير النسخ العكسي الفيروسي

الفيروسات القهقرية ، التي يشار إليها أيضًا باسم فيروسات الفئة VI ssRNA-RT ، هي فيروسات النسخ العكسي للحمض النووي الريبي مع وسيط DNA. تتكون جينوماتها من جزيئين من الحمض النووي الريبي أحادي الجديلة موجب الاتجاه بغطاء 5 'و 3' ذيل متعدد الأدينيلات. تشمل أمثلة الفيروسات القهقرية فيروس نقص المناعة البشرية (HIV) وفيروس T-lymphotropic البشري (HTLV). يحدث تكوين DNA مزدوج الشريطة في العصارة الخلوية [10] كسلسلة من الخطوات التالية:

    يعمل الحمض الريبي النووي النقال (tRNA) كطبقة أولية ويهجن إلى جزء مكمل من جينوم الحمض النووي الريبي للفيروس يسمى موقع الربط التمهيدي أو PBS.
  1. ثم يضيف النسخ العكسي نيوكليوتيدات الحمض النووي على الطرف 3 'من التمهيدي ، ويخلق الحمض النووي التكميلي لـ U5 (المنطقة غير المشفرة) ومنطقة R (تكرار مباشر موجود في طرفي جزيء الحمض النووي الريبي) من الحمض النووي الريبي الفيروسي.
  2. مجال على إنزيم النسخ العكسي يسمى RNAse H يحط من U5 و R في نهاية 5 'من الحمض النووي الريبي.
  3. ثم "يقفز" التمهيدي tRNA إلى الطرف الثالث من الجينوم الفيروسي ، ويتم تهجين خيوط DNA المركبة حديثًا إلى منطقة R التكميلية على RNA.
  4. تم تمديد الحمض النووي التكميلي (cDNA) المضاف في (2) بشكل أكبر.
  5. تتحلل غالبية الحمض النووي الريبي الفيروسي بواسطة RNAse H ، تاركًا فقط تسلسل PP.
  6. يبدأ تركيب خيط الحمض النووي الثاني ، باستخدام جزء PP المتبقي من الحمض النووي الريبي الفيروسي كأساس.
  7. يترك التمهيدي tRNA ويحدث "قفزة". يتهجين برنامج تلفزيوني من الخيط الثاني مع برنامج تلفزيوني مكمل على الخيط الأول.
  8. يتم تمديد كلا الخيطين لتشكيل نسخة كاملة من الحمض النووي مزدوج الشريطة من جينوم الحمض النووي الريبي الفيروسي الأصلي ، والذي يمكن بعد ذلك دمجه في جينوم المضيف عن طريق الإنزيم المتكامل.

يتضمن أيضًا إنشاء DNA مزدوج الشريطة نقل حبلا، حيث يوجد انتقال لمنتج DNA قصير من تخليق DNA الأولي المعتمد على RNA إلى مناطق قالب متقبل في الطرف الآخر من الجينوم ، والتي يتم الوصول إليها في وقت لاحق ومعالجتها بواسطة النسخ العكسي لنشاط الحمض النووي المعتمد على الحمض النووي. [11]

يتم ترتيب Retroviral RNA في نهاية 5 إلى 3. يُطلق على الموقع الذي يتم فيه تلدين التمهيدي إلى RNA الفيروسي موقع ربط التمهيدي (PBS). يسمى RNA 5 الذي يصل إلى موقع PBS باسم U5 ، ونهاية RNA 3 إلى PBS تسمى القائد. يتم فك التمهيدي tRNA بين 14 و 22 نيوكليوتيد ويشكل قاعدة مزدوجة مزدوجة مع الحمض النووي الريبي الفيروسي في PBS. حقيقة أن PBS يقع بالقرب من الطرف الخامس للحمض النووي الريبي الفيروسي أمر غير معتاد لأن النسخ العكسي يقوم بتجميع الحمض النووي من 3 "نهاية التمهيدي في اتجاه 5" إلى 3 "(فيما يتعلق بحبل الحمض النووي المركب حديثًا). لذلك ، يجب نقل النسخة الأولية والنسخة العكسية إلى نهاية 3 'من الحمض النووي الريبي الفيروسي. من أجل إنجاز هذا التغيير ، هناك حاجة إلى خطوات متعددة وإنزيمات مختلفة بما في ذلك بوليميريز الحمض النووي ، ريبونوكلياز H (RNase H) وفك عديد النوكليوتيد. [12] [13]

يحتوي النسخ العكسي لفيروس العوز المناعي البشري أيضًا على نشاط ريبونوكلياز يعمل على تحطيم الحمض النووي الريبي الفيروسي أثناء تخليق (كدنا) ، بالإضافة إلى نشاط بوليميريز الحمض النووي المعتمد على الحمض النووي الذي ينسخ الإحساس (كدنا) إلى خيط مضاد المعنى DNA لتشكيل وسيط DNA فيروسي مزدوج الشريطة (vDNA). [14]

تستخدم امتدادات التكاثر الذاتي لجينومات حقيقية النواة المعروفة باسم الينقولات العكسية النسخ العكسية للانتقال من موضع في الجينوم إلى آخر عبر وسيط RNA. توجد بكثرة في جينومات النباتات والحيوانات. تيلوميراز هو نسخة عكسية أخرى موجودة في العديد من حقيقيات النوى ، بما في ذلك البشر ، والتي تحمل قالب RNA الخاص بها ، ويستخدم هذا الحمض النووي الريبي كقالب لتكرار الحمض النووي. [15]

تعود التقارير الأولية عن النسخ العكسي في بدائيات النوى إلى عام 1971 في فرنسا (بيلجانسكي وآخرون ، 1971 أ ، 1972) وبعد ذلك ببضع سنوات في الاتحاد السوفياتي (روماشينكو 1977 [16]). تم وصف هذه منذ ذلك الحين على نطاق واسع كجزء من Retrons البكتيرية ، وهي متواليات متميزة ترمز إلى النسخ العكسي للنسخة ، وتستخدم في تخليق msDNA. من أجل بدء تصنيع الحمض النووي ، هناك حاجة إلى التمهيدي. في البكتيريا ، يتم تصنيع التمهيدي أثناء النسخ المتماثل. [17]

يجادل فاليريان دولجا من ولاية أوريغون بأن الفيروسات ، نظرًا لتنوعها ، لعبت دورًا تطوريًا في تطوير الحياة الخلوية ، مع لعب النسخ العكسي دورًا مركزيًا. [18]

تستخدم النسخة العكسية بنية "اليد اليمنى" مشابهة لتلك الموجودة في بوليميرات الحمض النووي الفيروسي الأخرى. [19] [20] بالإضافة إلى وظيفة النسخ ، تحتوي النسخ العكسية للفيروسات القهقرية على مجال ينتمي إلى عائلة RNase H ، وهو أمر حيوي لتكرارها. عن طريق تحطيم قالب الحمض النووي الريبي ، فإنه يسمح بتوليف الشريط الآخر من الحمض النووي. [21] بعض الأجزاء من عملية الهضم تعمل أيضًا كأساس لبوليميراز الحمض النووي (إما نفس الإنزيم أو بروتين مضيف) ، وهو المسؤول عن صنع الشريط الآخر (الزائد). [19]

هناك ثلاثة أنظمة نسخ مختلفة خلال دورة حياة الفيروسات القهقرية. العملية الأولى هي تخليق النسخ العكسي للحمض النووي الفيروسي من الحمض النووي الريبي الفيروسي ، والذي يشكل بعد ذلك خيوط دنا مكملة مصنوعة حديثًا. تحدث عملية النسخ المتماثل الثانية عندما يقوم بوليميراز الحمض النووي الخلوي المضيف بتكرار الحمض النووي الفيروسي المتكامل. أخيرًا ، يقوم RNA polymerase II بنسخ DNA الأولي إلى RNA ، والذي سيتم تعبئته في virions. يمكن أن تحدث الطفرة أثناء إحدى خطوات النسخ المتماثل هذه أو جميعها. [22]

يحتوي النسخ العكسي على معدل خطأ مرتفع عند نسخ الحمض النووي الريبي إلى الحمض النووي لأنه ، على عكس معظم بوليمرات الحمض النووي الأخرى ، ليس لديه القدرة على التدقيق اللغوي. يسمح معدل الخطأ المرتفع هذا للطفرات بالتراكم بمعدل متسارع بالنسبة لأشكال التدقيق اللغوي للنسخ المتماثل. يتم اقتباس النسخ العكسية المتاحة تجارياً التي تنتجها Promega في كتيباتها على أنها تحتوي على معدلات خطأ في نطاق 1 في 17000 قاعدة لـ AMV و 1 من 30000 قاعدة لـ M-MLV. [23]

بخلاف إنشاء تعدد الأشكال أحادي النوكليوتيدات ، فقد ثبت أيضًا أن النسخ العكسية تشارك في عمليات مثل اندماج النسخ ، وخلط إكسون ، وإنشاء نسخ اصطناعية مضادة للتعبير. [24] [25] لقد تم التكهن بأن هذا تبديل القالب نشاط النسخ العكسي ، والذي يمكن إثباته بالكامل في الجسم الحي، ربما كان أحد أسباب العثور على عدة آلاف من النسخ غير الموضح عليها في جينومات الكائنات الحية النموذجية. [26]

تعديل تبديل القالب

يتم تجميع جينومين من الحمض النووي الريبي في كل جسيم من الفيروسات القهقرية ، ولكن بعد الإصابة ، يولد كل فيروس فيروس واحد فقط. [27] بعد الإصابة ، يكون النسخ العكسي مصحوبًا بتبديل القالب بين نسختين من الجينوم (إعادة تركيب اختيار النسخ). [27] هناك نموذجان يقترحان سبب تبديل RNA transcriptase للقوالب. الأول ، نموذج اختيار النسخ القسري ، يقترح أن النسخ العكسي يغير قالب الحمض النووي الريبي عندما يواجه نك ، مما يعني أن إعادة التركيب إلزامي للحفاظ على سلامة جينوم الفيروس. الثاني ، نموذج الاختيار الديناميكي ، يقترح أن النسخ العكسي يغير القوالب عندما لا تكون وظيفة RNAse ووظيفة البوليميراز متزامنين من حيث معدل المزامنة ، مما يعني أن إعادة التركيب تحدث عشوائيًا ولا تستجيب للضرر الجيني. دراسة قام بها Rawson et al. دعم كلا نموذجي إعادة التركيب. [27] من 5 إلى 14 حدث إعادة تركيب لكل جينوم تحدث في كل دورة تكرار. [28] يبدو أن تبديل القوالب (إعادة التركيب) ضروري للحفاظ على سلامة الجينوم وكآلية إصلاح لإنقاذ الجينومات التالفة. [29] [27]

الأدوية المضادة للفيروسات

نظرًا لأن فيروس نقص المناعة البشرية يستخدم النسخ العكسي لنسخ مادته الجينية وتوليد فيروسات جديدة (جزء من دائرة انتشار الفيروسات القهقرية) ، فقد تم تصميم أدوية معينة لتعطيل العملية وبالتالي قمع نموها. تُعرف هذه الأدوية بشكل جماعي بمثبطات النسخ العكسي وتشمل نظائر النيوكليوزيد والنيوكليوتيدات زيدوفودين (الاسم التجاري ريتروفير) ولاميفودين (إبيفير) وتينوفوفير (فيريد) ، بالإضافة إلى مثبطات غير نوكليوزيد ، مثل نيفيرابين (فيرامون).

تحرير البيولوجيا الجزيئية

يشيع استخدام النسخ العكسي في البحث لتطبيق تقنية تفاعل البوليميراز المتسلسل على الحمض النووي الريبي في تقنية تسمى تفاعل البوليميراز المتسلسل للنسخ العكسي (RT-PCR). يمكن تطبيق تقنية PCR الكلاسيكية فقط على خيوط الحمض النووي ، ولكن بمساعدة النسخ العكسي ، يمكن نسخ الحمض النووي الريبي إلى الحمض النووي ، مما يجعل تحليل PCR لجزيئات الحمض النووي الريبي ممكنًا. يتم استخدام النسخ العكسي أيضًا لإنشاء مكتبات (كدنا) من مرنا. أدى التوافر التجاري للنسخة العكسية إلى تحسين المعرفة في مجال البيولوجيا الجزيئية إلى حد كبير ، حيث سمح للعلماء ، إلى جانب الإنزيمات الأخرى ، باستنساخ الحمض النووي الريبي وتسلسله وتوصيفه.

كما تم استخدام النسخ العكسي في إنتاج الأنسولين. عن طريق إدخال mRNA حقيقية النواة لإنتاج الأنسولين جنبًا إلى جنب مع النسخ العكسي في البكتيريا ، يمكن إدخال mRNA في جينوم بدائيات النوى. يمكن بعد ذلك إنتاج كميات كبيرة من الأنسولين ، وتجنب الحاجة إلى حصاد بنكرياس الخنزير والمصادر التقليدية الأخرى. لن ينجح إدخال دنا حقيقيات النوى مباشرة في البكتيريا لأنه يحمل الإنترونات ، لذلك لن يُترجم بنجاح باستخدام الريبوسومات البكتيرية. المعالجة في الخلية حقيقية النواة أثناء إنتاج الرنا المرسال تزيل الإنترونات لتوفير قالب مناسب. يحول إنزيم النسخ العكسي هذا الحمض النووي الريبي المعدل مرة أخرى إلى الحمض النووي بحيث يمكن دمجه في الجينوم.


النسخ العكسي على نطاق واسع؟ - مادة الاحياء

النشاط التحفيزي القوي (حتى في درجات الحرارة العالية) والدقة العالية وتقارب القالب التمهيدي هي خصائص النسخ العكسي (RT) المرغوبة في معظم تطبيقات التكنولوجيا الحيوية.

تعد RTs لفيروسات اللوكيميا الفأرية المهندسة هي الإنزيمات الأكثر استخدامًا ، على الرغم من أن الإنزيمات من الفيروسات القهقرية الأخرى (فيروس داء الأرومات النخاعية للطيور أو HIV-1) والمجموعة البكتيرية II intron RTs فعالة أيضًا في معظم التطبيقات.

التقنيات الجديدة التي تستخدم النسخ العكسي وتبشر بالخير في أبحاث علوم الحياة والتكنولوجيا هي تسلسل الحمض النووي الريبي (RNA-seq) (تحليل النسخ) ، وعلم الترانسكريبتوميكس والبيولوجيا التركيبية ، وتحرير الجينوم (من خلال استخدام المحررين الرئيسيين).

النسخ العكسية (RTs) هي إنزيمات يمكن أن تولد خيطًا مكملًا من الحمض النووي (cDNA) من الحمض النووي الريبي. إلى جانب PCR ، تم استخدام RTs على نطاق واسع للكشف عن الحمض النووي الريبي واستنساخ الجينات المعبر عنها. تم تحسين RTs الفيروسية الرجعية الكلاسيكية من خلال هندسة البروتين. هذه الإنزيمات و RTs المميزة حديثًا هي عناصر أساسية في تطوير تقنيات التسلسل من الجيل التالي التي يتم تطبيقها الآن في دراسة علم النسخ. بالإضافة إلى ذلك ، أظهرت RTs المصممة هندسيًا المندمجة في CRISPR / Cas9 Nickase مؤخرًا إمكانات كبيرة كأدوات لمعالجة الجينومات حقيقية النواة. في هذه المراجعة ، نناقش خصائص واستخدامات RTs المصممة هندسيًا والنوع البري في تطبيقات التكنولوجيا الحيوية ، من RT-PCR التقليدي إلى التحرير الأولي الذي تم تقديمه مؤخرًا.


محتويات

تحرير إعداد المكتبة

الخطوات العامة لإعداد مكتبة DNA (cDNA) التكميلية للتسلسل موصوفة أدناه ، ولكنها غالبًا ما تختلف بين المنصات. [8] [3] [9]

  1. عزل الحمض النووي الريبي:يتم عزل الحمض النووي الريبي من الأنسجة ويخلط مع ديوكسي ريبونوكلياز (الدناز). يقلل DNase من كمية الحمض النووي الجيني. يتم فحص مقدار تدهور الحمض النووي الريبي باستخدام هلام ورحلان كهربائي شعري ويستخدم لتعيين رقم سلامة الحمض النووي الريبي للعينة. تؤخذ جودة الحمض النووي الريبي (RNA) والمقدار الإجمالي لبدء RNA في الاعتبار أثناء خطوات التحضير والتسلسل والتحليل اللاحقة للمكتبة.
  1. اختيار / نضوب الحمض النووي الريبي (RNA): لتحليل الإشارات ذات الأهمية ، يمكن إما الاحتفاظ بـ RNA المعزول كما هو ، ويتم ترشيحه لـ RNA مع ذيول 3 'polyadylated (poly (A)) لتشمل فقط mRNA ، المستنفد من RNA الريبوسومي (rRNA) ، و / أو تمت تصفيته لـ RNA الذي يربط تسلسلات محددة (طرق اختيار واستنفاد الحمض النووي الريبي الجدول أدناه). يتكون الحمض النووي الريبي ذو ذيول 3 'poly (A) بشكل أساسي من متواليات ناضجة ومعالجة ومشفرة. يتم إجراء اختيار Poly (A) عن طريق خلط RNA مع أوليغومرات بولي (T) المرتبطة تساهميًا بركيزة ، حبات مغناطيسية عادةً. [10] [11] اختيار Poly (A) له قيود مهمة في اكتشاف النمط الحيوي لـ RNA. العديد من الأنماط الحيوية للحمض النووي الريبي ليست متعددة الأدينيلات ، بما في ذلك العديد من نسخ الحمض النووي الريبي غير المشفر وبروتين هيستون النواة ، أو يتم تنظيمها عبر طول ذيلها المتعدد (على سبيل المثال ، السيتوكينات) وبالتالي قد لا يتم اكتشافها بعد اختيار بولي (أ). [12] علاوة على ذلك ، قد يؤدي اختيار poly (A) إلى زيادة انحياز 3 '، خاصة مع انخفاض جودة RNA. [13] [14] يمكن تجنب هذه القيود مع نضوب الريبوسوم ، وإزالة الرنا الريباسي الذي يمثل عادةً أكثر من 90٪ من الحمض النووي الريبي في الخلية. كل من خطوات التخصيب المتعدد (A) واستنفاد الريبوسوم تتطلب عمالة مكثفة ويمكن أن تؤدي إلى تحيزات ، لذلك تم تطوير مناهج أكثر بساطة لتجاهل هذه الخطوات. [15] يمكن عزل أهداف الحمض النووي الريبي الصغيرة ، مثل ميرنا ، بشكل أكبر من خلال اختيار الحجم باستخدام المواد الهلامية أو الحبيبات المغناطيسية أو المجموعات التجارية.
  1. توليف (كدنا): يتم نسخ الحمض النووي الريبي بشكل عكسي إلى (كدنا) لأن الحمض النووي أكثر استقرارًا ويسمح بالتضخيم (الذي يستخدم بوليميراز الحمض النووي) والاستفادة من تقنية تسلسل الحمض النووي الأكثر نضجًا. ينتج عن التضخيم اللاحق للنسخ العكسي فقدان السلاسل ، والذي يمكن تجنبه بالوسم الكيميائي أو تسلسل الجزيء الفردي. يتم إجراء تحديد التجزئة والحجم لتنقية التسلسلات ذات الطول المناسب لآلة التسلسل. يتم تجزئة الحمض النووي الريبي أو (كدنا) أو كليهما بواسطة الإنزيمات أو الصوتنة أو البخاخات. يقلل تجزئة الحمض النووي الريبي (RNA) من 5 تحيز للنسخ العكسي العشوائي وتأثير مواقع الربط التمهيدي ، [11] مع الجانب السلبي المتمثل في تحويل النهايتين 5 و 3 إلى DNA بشكل أقل كفاءة. يتبع التجزئة اختيار الحجم ، حيث تتم إزالة التسلسلات الصغيرة أو تحديد نطاق ضيق من أطوال التسلسل. نظرًا لفقدان الحمض النووي الريبي الصغير مثل الجزيئات الدقيقة ، يتم تحليلها بشكل مستقل. يمكن فهرسة (كدنا) لكل تجربة برمز شريطي سداسي أو ثماني ، بحيث يمكن تجميع هذه التجارب في حارة واحدة للتسلسل متعدد الإرسال.

تحرير تسلسل الحمض النووي التكميلي (cDNA-Seq)

يتم بعد ذلك تسلسل مكتبة (كدنا) المشتقة من الأنماط الحيوية للحمض النووي الريبي إلى تنسيق يمكن قراءته بواسطة الكمبيوتر. هناك العديد من تقنيات التسلسل عالية الإنتاجية لتسلسل cDNA بما في ذلك الأنظمة الأساسية التي طورتها Illumina و Thermo Fisher و BGI / MGI و PacBio و Oxford Nanopore Technologies. [16] بالنسبة لتسلسل قراءة قصيرة من Illumina ، وهي تقنية شائعة لتسلسل cDNA ، يتم ربط المحولات بـ cDNA ، ويتم توصيل الحمض النووي بخلية التدفق ، ويتم إنشاء المجموعات من خلال دورات تضخيم الجسر وإحداث تغيير في الطبيعة ، ويكون التسلسل تلو التوليف هو يتم إجراؤها في دورات تخليق خيوط تكميلية وإثارة بالليزر للقواعد ذات أجهزة إنهاء قابلة للانعكاس. يتم توجيه اختيار النظام الأساسي المتسلسل والمعلمات من خلال التصميم التجريبي والتكلفة. تشمل اعتبارات التصميم التجريبي الشائعة تحديد طول التسلسل ، وعمق التسلسل ، واستخدام التسلسل أحادي الطرف مقابل التسلسل المزدوج ، وعدد التكرارات ، وتعدد الإرسال ، والعشوائية ، والارتفاع الإضافي. [17]

تعديل تسلسل الحمض النووي الريبي الصغير / غير المشفر

عند تسلسل الحمض النووي الريبي بخلاف mRNA ، يتم تعديل إعداد المكتبة. يتم تحديد الحمض النووي الريبي الخلوي بناءً على نطاق الحجم المطلوب. بالنسبة لأهداف الحمض النووي الريبي الصغيرة ، مثل ميرنا ، يتم عزل الحمض النووي الريبي من خلال اختيار الحجم. يمكن إجراء ذلك باستخدام هلام استبعاد الحجم ، أو من خلال الخرز المغناطيسي لاختيار الحجم ، أو باستخدام مجموعة مطورة تجاريًا. بمجرد عزلها ، تتم إضافة الروابط إلى نهايتي 3 'و 5' ثم تنقيتها. الخطوة الأخيرة هي توليد (كدنا) من خلال النسخ العكسي.

تحرير تسلسل الحمض النووي الريبي المباشر

نظرًا لأن تحويل الحمض النووي الريبي إلى (كدنا) ، فقد ثبت أن الربط والتضخيم ومعالجات العينات الأخرى تقدم تحيزات ومصنوعات قد تتداخل مع كل من التوصيف الصحيح والقياس الكمي للنصوص ، [18] وقد تم استكشاف تسلسل الحمض النووي الريبي المباشر لجزيء واحد من قبل الشركات بما في ذلك Helicos (إفلاس) ، أكسفورد نانوبور تكنولوجيز ، [19] وآخرون. تقوم هذه التقنية بترتيب جزيئات الحمض النووي الريبي مباشرة بطريقة متوازية بشكل كبير.

تحرير تسلسل الحمض النووي الريبي في الوقت الحقيقي لجزيء واحد

تم استكشاف جزيء واحد متوازي بشكل كبير من RNA-Seq كبديل لـ RNA-Seq التقليدي ، حيث قد يؤدي تحويل RNA-to-cDNA والربط والتضخيم وخطوات معالجة العينات الأخرى إلى التحيزات والتحف. [20] منصات التكنولوجيا التي تؤدي جزيء واحد في الوقت الحقيقي RNA-Seq تشمل Oxford Nanopore Technologies (ONT) Nanopore Sequences ، [19] PacBio IsoSeq ، و Helicos (المفلسة). يحافظ تسلسل الحمض النووي الريبي في شكله الأصلي على التعديلات مثل المثيلة ، مما يسمح بفحصها بشكل مباشر وفي وقت واحد. [19] فائدة أخرى من جزيء واحد من RNA-Seq هي أنه يمكن تغطية النصوص كاملة الطول ، مما يسمح باكتشاف وتقدير شكل إسوي عالي الثقة مقارنة بتسلسل القراءة القصيرة. تقليديا ، تتميز طرق RNA-Seq أحادية الجزيء بمعدلات خطأ أعلى مقارنة بتسلسل القراءة القصيرة ، ولكن الأساليب الأحدث مثل ONT RNA-Seq المباشر تحد من الأخطاء عن طريق تجنب التجزئة وتحويل cDNA. أظهرت الاستخدامات الحديثة لـ ONT RNA-Seq المباشر للتعبير التفاضلي في مجموعات الخلايا البشرية أن هذه التكنولوجيا يمكن أن تتغلب على العديد من قيود تسلسل cDNA القصير والطويل. [21]

تحرير تسلسل الحمض النووي الريبي أحادي الخلية (تسلسل سكرنا)

تحلل الطرق القياسية مثل المصفوفات الدقيقة وتحليل RNA-Seq القياسي السائب التعبير عن الحمض النووي الريبي من مجموعات كبيرة من الخلايا. في مجموعات الخلايا المختلطة ، قد تحجب هذه القياسات الاختلافات الحرجة بين الخلايا الفردية داخل هذه المجموعات السكانية. [22] [23]

يوفر تسلسل الحمض النووي الريبي أحادي الخلية (scRNA-Seq) ملفات تعريف التعبير للخلايا الفردية. على الرغم من أنه من غير الممكن الحصول على معلومات كاملة عن كل RNA التي تعبر عنها كل خلية ، نظرًا للكمية الصغيرة من المواد المتاحة ، يمكن تحديد أنماط التعبير الجيني من خلال تحليلات التجميع الجيني. يمكن أن يكشف هذا عن وجود أنواع خلايا نادرة داخل مجموعة خلايا ربما لم يسبق رؤيتها من قبل. على سبيل المثال ، تم تحديد خلايا متخصصة نادرة في الرئة تسمى الخلايا الشاردة الرئوية التي تعبر عن منظم توصيل الغشاء عبر التليف الكيسي في عام 2018 من قبل مجموعتين تقومان بإجراء scRNA-Seq على ظهارة مجرى الهواء الرئوي. [24] [25]

تحرير الإجراءات التجريبية

تتضمن بروتوكولات scRNA-Seq الحالية الخطوات التالية: عزل خلية واحدة و RNA ، والنسخ العكسي (RT) ، والتضخيم ، وإنشاء المكتبة والتسلسل. يتم فصل الخلايا المفردة ميكانيكيًا إلى خلايا دقيقة (على سبيل المثال ، BD Rhapsody ، Takara ICELL8 ، Vycap Puncher Platform ، أو CellMicrosystems CellRaft) أو مغلفة في قطرات (على سبيل المثال ، 10x Genomics Chromium ، Illumina Bio-Rad ddSEQ ، 1CellBio InDrop ، Dolomite Bio Nadia). [26] يتم تمييز الخلايا المفردة عن طريق إضافة خرزات تحتوي على قليل النوكليوتيدات المشفرة ، حيث يتم توفير كل من الخلايا والخرز بكميات محدودة بحيث يكون الإشغال المشترك مع خلايا وحبيبات متعددة حدثًا نادرًا جدًا. بمجرد اكتمال النسخ العكسي ، يمكن خلط cDNAs من العديد من الخلايا معًا لتسلسل النصوص من خلية معينة بواسطة الرمز الشريطي الفريد لكل خلية. [27] [28] يمكن ربط المعرف الجزيئي الفريد (UMIs) بالتسلسلات المستهدفة mRNA / cDNA للمساعدة في التعرف على القطع الأثرية أثناء تحضير المكتبة. [29]

تشمل التحديات التي تواجه scRNA-Seq الحفاظ على الوفرة النسبية الأولية لـ mRNA في الخلية وتحديد النصوص النادرة. [30] تعتبر خطوة النسخ العكسي أمرًا بالغ الأهمية لأن كفاءة تفاعل RT تحدد مقدار تعداد الحمض النووي الريبي للخلية الذي سيتم تحليله في النهاية بواسطة جهاز التسلسل. قد تؤثر عملية النسخ العكسية والاستراتيجيات الأولية المستخدمة على إنتاج cDNA كامل الطول وتوليد مكتبات منحازة نحو نهاية الجينات 3 أو 5.

في خطوة التضخيم ، يتم استخدام PCR أو النسخ في المختبر (IVT) حاليًا لتضخيم (كدنا). تتمثل إحدى مزايا الطرق المستندة إلى تفاعل البوليميراز المتسلسل (PCR) في القدرة على توليد (كدنا) كامل الطول. ومع ذلك ، قد يتم أيضًا تضخيم كفاءة PCR المختلفة على تسلسلات معينة (على سبيل المثال ، محتوى GC وهيكل snapback) بشكل كبير ، مما ينتج عنه مكتبات ذات تغطية غير متساوية. من ناحية أخرى ، في حين أن المكتبات التي تم إنشاؤها بواسطة IVT يمكن أن تتجنب تحيز التسلسل الناجم عن PCR ، فقد يتم نسخ تسلسلات محددة بشكل غير فعال ، مما يتسبب في تسرب التسلسل أو إنشاء تسلسلات غير كاملة. [31] [22] تم نشر العديد من بروتوكولات scRNA-Seq: Tang et al. ، [32] STRT ، [33] SMART-seq ، [34] CEL-seq ، [35] RAGE-seq ، [36] الكوارتز -seq [37] و C1-CAGE. [38] تختلف هذه البروتوكولات من حيث استراتيجيات النسخ العكسي وتوليف cDNA والتضخيم وإمكانية استيعاب الرموز الشريطية الخاصة بالتسلسل (أي UMIs) أو القدرة على معالجة العينات المجمعة. [39]

في عام 2017 ، تم تقديم طريقتين لقياس مرنا أحادية الخلية وتعبير البروتين في وقت واحد من خلال الأجسام المضادة التي تحمل علامات قليلة النوكليوتيد والمعروفة باسم REAP-seq ، [40] و CITE-seq. [41]

تحرير التطبيقات

أصبح استخدام سكرنا- Seq على نطاق واسع عبر التخصصات البيولوجية بما في ذلك التنمية ، وعلم الأعصاب ، [42] علم الأورام ، [43] [44] [45] أمراض المناعة الذاتية ، [46] والأمراض المعدية. [47]

قدم سكرنا- Seq نظرة ثاقبة في تطور الأجنة والكائنات الحية ، بما في ذلك الدودة أنواع معينة انيقةو [48] و المستوي التجديدي شميدتية البحر الأبيض المتوسط. [49] [50] كانت الحيوانات الفقارية الأولى التي تم رسم خرائط لها بهذه الطريقة هي الزرد [51] [52] و Xenopus laevis. [53] في كل حالة تمت دراسة مراحل متعددة للجنين ، مما يسمح بتخطيط عملية التطور بأكملها على أساس كل خلية على حدة. [8] اعترف العلم بهذه التطورات باعتبارها أفضل اختراقة للعام 2018. [54]

تحرير الاعتبارات التجريبية

يتم أخذ مجموعة متنوعة من المعلمات في الاعتبار عند تصميم تجارب RNA-Seq وإجرائها:

  • خصوصية الأنسجة: يختلف التعبير الجيني داخل الأنسجة وبينها ، ويقيس RNA-Seq هذا المزيج من أنواع الخلايا. هذا قد يجعل من الصعب عزل الآلية البيولوجية للفائدة. يمكن استخدام تسلسل الخلية الواحدة لدراسة كل خلية على حدة ، مما يخفف من حدة هذه المشكلة.
  • الاعتماد على الوقت: يتغير التعبير الجيني بمرور الوقت ، ولا يأخذ RNA-Seq سوى لقطة سريعة. يمكن إجراء تجارب الدورة الزمنية لملاحظة التغييرات في النسخ.
  • التغطية (تُعرف أيضًا بالعمق): يحمل الحمض النووي الريبي نفس الطفرات التي لوحظت في الحمض النووي ، ويتطلب الكشف تغطية أعمق. مع تغطية عالية بما فيه الكفاية ، يمكن استخدام RNA-Seq لتقدير تعبير كل أليل. قد يوفر هذا نظرة ثاقبة لظواهر مثل آثار البصمة أو اللوائح التنظيمية. يمكن استقراء عمق التسلسل المطلوب لتطبيقات محددة من تجربة تجريبية. [55]
  • عناصر إنشاء البيانات (المعروفة أيضًا باسم التباين التقني): The reagents (e.g., library preparation kit), personnel involved, and type of sequencer (e.g., Illumina, Pacific Biosciences) can result in technical artifacts that might be mis-interpreted as meaningful results. As with any scientific experiment, it is prudent to conduct RNA-Seq in a well controlled setting. If this is not possible or the study is a meta-analysis, another solution is to detect technical artifacts by inferring latent variables (typically principal component analysis or factor analysis) and subsequently correcting for these variables. [56]
  • Data management: A single RNA-Seq experiment in humans is usually 1-5 Gb (compressed), or more when including intermediate files. [57] This large volume of data can pose storage issues. One solution is compressing the data using multi-purpose computational schemas (e.g., gzip) or genomics-specific schemas. The latter can be based on reference sequences or de novo. Another solution is to perform microarray experiments, which may be sufficient for hypothesis-driven work or replication studies (as opposed to exploratory research).

Transcriptome assembly Edit

Two methods are used to assign raw sequence reads to genomic features (i.e., assemble the transcriptome):

  • De novo: This approach does not require a reference genome to reconstruct the transcriptome, and is typically used if the genome is unknown, incomplete, or substantially altered compared to the reference. [58] Challenges when using short reads for de novo assembly include 1) determining which reads should be joined together into contiguous sequences (contigs), 2) robustness to sequencing errors and other artifacts, and 3) computational efficiency. The primary algorithm used for de novo assembly transitioned from overlap graphs, which identify all pair-wise overlaps between reads, to de Bruijn graphs, which break reads into sequences of length k and collapse all k-mers into a hash table. [59] Overlap graphs were used with Sanger sequencing, but do not scale well to the millions of reads generated with RNA-Seq. Examples of assemblers that use de Bruijn graphs are Trinity, [58] Oases [60] (derived from the genome assembler Velvet[61] ), Bridger, [62] and rnaSPAdes. [63] Paired-end and long-read sequencing of the same sample can mitigate the deficits in short read sequencing by serving as a template or skeleton. Metrics to assess the quality of a de novo assembly include median contig length, number of contigs and N50. [64]
  • Genome guided: This approach relies on the same methods used for DNA alignment, with the additional complexity of aligning reads that cover non-continuous portions of the reference genome. [65] These non-continuous reads are the result of sequencing spliced transcripts (see figure). Typically, alignment algorithms have two steps: 1) align short portions of the read (i.e., seed the genome), and 2) use dynamic programming to find an optimal alignment, sometimes in combination with known annotations. Software tools that use genome-guided alignment include Bowtie, [66] TopHat (which builds on BowTie results to align splice junctions), [67][68] Subread, [69] STAR, [65] HISAT2, [70] and GMAP. [71] The output of genome guided alignment (mapping) tools can be further utilized by tools such as Cufflinks [68] or StringTie [72] to reconstruct contiguous transcript sequences (بمعنى آخر., a FASTA file).The quality of a genome guided assembly can be measured with both 1) de novo assembly metrics (e.g., N50) and 2) comparisons to known transcript, splice junction, genome, and protein sequences using precision, recall, or their combination (e.g., F1 score). [64] In addition, في السيليكو assessment could be performed using simulated reads. [73][74]

A note on assembly quality: The current consensus is that 1) assembly quality can vary depending on which metric is used, 2) assembly tools that scored well in one species do not necessarily perform well in the other species, and 3) combining different approaches might be the most reliable. [75] [76] [77]

Gene expression quantification Edit

Expression is quantified to study cellular changes in response to external stimuli, differences between healthy and diseased states, and other research questions. Transcript levels are often used as a proxy for protein abundance, but these are often not equivalent due to post transcriptional events such as RNA interference and nonsense-mediated decay. [78]

Expression is quantified by counting the number of reads that mapped to each locus in the transcriptome assembly step. Expression can be quantified for exons or genes using contigs or reference transcript annotations. [8] These observed RNA-Seq read counts have been robustly validated against older technologies, including expression microarrays and qPCR. [55] [79] Tools that quantify counts are HTSeq, [80] FeatureCounts, [81] Rcount, [82] maxcounts, [83] FIXSEQ, [84] and Cuffquant. These tools determine read counts from aligned RNA-Seq data, but alignment-free counts can also be obtained with Sailfish [85] and Kallisto. [86] The read counts are then converted into appropriate metrics for hypothesis testing, regressions, and other analyses. Parameters for this conversion are:

  • Sequencing depth/coverage: Although depth is pre-specified when conducting multiple RNA-Seq experiments, it will still vary widely between experiments. [87] Therefore, the total number of reads generated in a single experiment is typically normalized by converting counts to fragments, reads, or counts per million mapped reads (FPM, RPM, or CPM). The difference between RPM and FPM was historically derived during the evolution from single-end sequencing of fragments to paired-end sequencing. In single-end sequencing, there is only one read per fragment (بمعنى آخر., RPM = FPM). In paired-end sequencing, there are two reads per fragment (بمعنى آخر., RPM = 2 x FPM). Sequencing depth is sometimes referred to as library size, the number of intermediary cDNA molecules in the experiment.
  • Gene length: Longer genes will have more fragments/reads/counts than shorter genes if transcript expression is the same. This is adjusted by dividing the FPM by the length of a feature (which can be a gene, transcript, or exon), resulting in the metric fragments per kilobase of feature per million mapped reads (FPKM). [88] When looking at groups of features across samples, FPKM is converted to transcripts per million (TPM) by dividing each FPKM by the sum of FPKMs within a sample. [89][90][91]
  • Total sample RNA output: Because the same amount of RNA is extracted from each sample, samples with more total RNA will have less RNA per gene. These genes appear to have decreased expression, resulting in false positives in downstream analyses. [87] Normalization strategies including quantile, DESeq2, TMM and Median Ratio attempt to account for this difference by comparing a set of non-differentially expressed genes between samples and scaling accordingly. [92]
  • Variance for each gene's expression: is modeled to account for sampling error (important for genes with low read counts), increase power, and decrease false positives. Variance can be estimated as a normal, Poisson, or negative binomial distribution [93][94][95] and is frequently decomposed into technical and biological variance.

Spike-ins for absolute quantification and detection of genome-wide effects Edit

RNA spike-ins are samples of RNA at known concentrations that can be used as gold standards in experimental design and during downstream analyses for absolute quantification and detection of genome-wide effects.

  • Absolute quantification: Absolute quantification of gene expression is not possible with most RNA-Seq experiments, which quantify expression relative to all transcripts. It is possible by performing RNA-Seq with spike-ins, samples of RNA at known concentrations. After sequencing, read counts of spike-in sequences are used to determine the relationship between each gene's read counts and absolute quantities of biological fragments [11][96] In one example, this technique was used in Xenopus Tropicalis embryos to determine transcription kinetics. [97]
  • Detection of genome-wide effects: Changes in global regulators including chromatin remodelers, transcription factors (e.g., MYC), acetyltransferase complexes, and nucleosome positioning are not congruent with normalization assumptions and spike-in controls can offer precise interpretation. [98] [99]

Differential expression Edit

The simplest but often most powerful use of RNA-Seq is finding differences in gene expression between two or more conditions (على سبيل المثال, treated vs not treated) this process is called differential expression. The outputs are frequently referred to as differentially expressed genes (DEGs) and these genes can either be up- or down-regulated (بمعنى آخر., higher or lower in the condition of interest). There are many tools that perform differential expression. Most are run in R, Python, or the Unix command line. Commonly used tools include DESeq, [94] edgeR, [95] and voom+limma, [93] [100] all of which are available through R/Bioconductor. [101] [102] These are the common considerations when performing differential expression:

  • Inputs: Differential expression inputs include (1) an RNA-Seq expression matrix (M genes x N samples) and (2) a design matrix containing experimental conditions for N samples. The simplest design matrix contains one column, corresponding to labels for the condition being tested. Other covariates (also referred to as factors, features, labels, or parameters) can include batch effects, known artifacts, and any metadata that might confound or mediate gene expression. In addition to known covariates, unknown covariates can also be estimated through unsupervised machine learning approaches including principal component, surrogate variable, [103] and PEER [56] analyses. Hidden variable analyses are often employed for human tissue RNA-Seq data, which typically have additional artifacts not captured in the metadata (على سبيل المثال, ischemic time, sourcing from multiple institutions, underlying clinical traits, collecting data across many years with many personnel).
  • أساليب: Most tools use regression or non-parametric statistics to identify differentially expressed genes, and are either based on read counts mapped to a reference genome (DESeq2, limma, edgeR) or based on read counts derived from alignment-free quantification (sleuth, [104] Cuffdiff, [105] Ballgown [106] ). [107] Following regression, most tools employ either familywise error rate (FWER) or false discovery rate (FDR) p-value adjustments to account for multiple hypotheses (in human studies,

20,000 protein-coding genes or

Downstream analyses for a list of differentially expressed genes come in two flavors, validating observations and making biological inferences. Owing to the pitfalls of differential expression and RNA-Seq, important observations are replicated with (1) an orthogonal method in the same samples (like real-time PCR) or (2) another, sometimes pre-registered, experiment in a new cohort. The latter helps ensure generalizability and can typically be followed up with a meta-analysis of all the pooled cohorts. The most common method for obtaining higher-level biological understanding of the results is gene set enrichment analysis, although sometimes candidate gene approaches are employed. Gene set enrichment determines if the overlap between two gene sets is statistically significant, in this case the overlap between differentially expressed genes and gene sets from known pathways/databases (على سبيل المثال, Gene Ontology, KEGG, Human Phenotype Ontology) or from complementary analyses in the same data (like co-expression networks). Common tools for gene set enrichment include web interfaces (على سبيل المثال, ENRICHR, g:profiler, WEBGESTALT) [114] and software packages. When evaluating enrichment results, one heuristic is to first look for enrichment of known biology as a sanity check and then expand the scope to look for novel biology.

Alternative splicing Edit

RNA splicing is integral to eukaryotes and contributes significantly to protein regulation and diversity, occurring in >90% of human genes. [115] There are multiple alternative splicing modes: exon skipping (most common splicing mode in humans and higher eukaryotes), mutually exclusive exons, alternative donor or acceptor sites, intron retention (most common splicing mode in plants, fungi, and protozoa), alternative transcription start site (promoter), and alternative polyadenylation. [115] One goal of RNA-Seq is to identify alternative splicing events and test if they differ between conditions. Long-read sequencing captures the full transcript and thus minimizes many of issues in estimating isoform abundance, like ambiguous read mapping. For short-read RNA-Seq, there are multiple methods to detect alternative splicing that can be classified into three main groups: [116] [89] [117]

  • Count-based (also event-based, differential splicing): estimate exon retention. Examples are DEXSeq, [118] MATS, [119] and SeqGSEA. [120]
  • Isoform-based (also multi-read modules, differential isoform expression): estimate isoform abundance first, and then relative abundance between conditions. Examples are Cufflinks 2 [121] and DiffSplice. [122]
  • Intron excision based: calculate alternative splicing using split reads. Examples are MAJIQ [123] and Leafcutter. [117]

Differential gene expression tools can also be used for differential isoform expression if isoforms are quantified ahead of time with other tools like RSEM. [124]

Coexpression networks Edit

Coexpression networks are data-derived representations of genes behaving in a similar way across tissues and experimental conditions. [125] Their main purpose lies in hypothesis generation and guilt-by-association approaches for inferring functions of previously unknown genes. [125] RNA-Seq data has been used to infer genes involved in specific pathways based on Pearson correlation, both in plants [126] and mammals. [127] The main advantage of RNA-Seq data in this kind of analysis over the microarray platforms is the capability to cover the entire transcriptome, therefore allowing the possibility to unravel more complete representations of the gene regulatory networks. Differential regulation of the splice isoforms of the same gene can be detected and used to predict their biological functions. [128] [129] Weighted gene co-expression network analysis has been successfully used to identify co-expression modules and intramodular hub genes based on RNA seq data. Co-expression modules may correspond to cell types or pathways. Highly connected intramodular hubs can be interpreted as representatives of their respective module. An eigengene is a weighted sum of expression of all genes in a module. Eigengenes are useful biomarkers (features) for diagnosis and prognosis. [130] Variance-Stabilizing Transformation approaches for estimating correlation coefficients based on RNA seq data have been proposed. [126]

Variant discovery Edit

RNA-Seq captures DNA variation, including single nucleotide variants, small insertions/deletions. and structural variation. Variant calling in RNA-Seq is similar to DNA variant calling and often employs the same tools (including SAMtools mpileup [131] and GATK HaplotypeCaller [132] ) with adjustments to account for splicing. One unique dimension for RNA variants is allele-specific expression (ASE): the variants from only one haplotype might be preferentially expressed due to regulatory effects including imprinting and expression quantitative trait loci, and noncoding rare variants. [133] [134] Limitations of RNA variant identification include that it only reflects expressed regions (in humans, <5% of the genome), could be subject to biases introduced by data processing (e.g., de novo transcriptome assemblies underestimate heterozygosity [135] ), and has lower quality when compared to direct DNA sequencing.

RNA editing (post-transcriptional alterations) Edit

Having the matching genomic and transcriptomic sequences of an individual can help detect post-transcriptional edits (RNA editing). [3] A post-transcriptional modification event is identified if the gene's transcript has an allele/variant not observed in the genomic data.

Fusion gene detection Edit

Caused by different structural modifications in the genome, fusion genes have gained attention because of their relationship with cancer. [136] The ability of RNA-Seq to analyze a sample's whole transcriptome in an unbiased fashion makes it an attractive tool to find these kinds of common events in cancer. [4]

The idea follows from the process of aligning the short transcriptomic reads to a reference genome. Most of the short reads will fall within one complete exon, and a smaller but still large set would be expected to map to known exon-exon junctions. The remaining unmapped short reads would then be further analyzed to determine whether they match an exon-exon junction where the exons come from different genes. This would be evidence of a possible fusion event, however, because of the length of the reads, this could prove to be very noisy. An alternative approach is to use paired-end reads, when a potentially large number of paired reads would map each end to a different exon, giving better coverage of these events (see figure). Nonetheless, the end result consists of multiple and potentially novel combinations of genes providing an ideal starting point for further validation.

RNA-Seq was first developed in mid 2000s with the advent of next-generation sequencing technology. [139] The first manuscripts that used RNA-Seq even without using the term includes those of prostate cancer cell lines [140] (dated 2006), ميديكاغو truncatula [141] (2006), maize [142] (2007), and نبات الأرابيدوبسيس thaliana [143] (2007), while the term "RNA-Seq" itself was first mentioned in 2008 [144] The number of manuscripts referring to RNA-Seq in the title or abstract (Figure, blue line) is continuously increasing with 6754 manuscripts published in 2018. The intersection of RNA-Seq and medicine (Figure, gold line) has similar celerity. [145]

Applications to medicine Edit

RNA-Seq has the potential to identify new disease biology, profile biomarkers for clinical indications, infer druggable pathways, and make genetic diagnoses. These results could be further personalized for subgroups or even individual patients, potentially highlighting more effective prevention, diagnostics, and therapy. The feasibility of this approach is in part dictated by costs in money and time a related limitation is the required team of specialists (bioinformaticians, physicians/clinicians, basic researchers, technicians) to fully interpret the huge amount of data generated by this analysis. [146]

Large-scale sequencing efforts Edit

A lot of emphasis has been given to RNA-Seq data after the Encyclopedia of DNA Elements (ENCODE) and The Cancer Genome Atlas (TCGA) projects have used this approach to characterize dozens of cell lines [147] and thousands of primary tumor samples, [148] respectively. ENCODE aimed to identify genome-wide regulatory regions in different cohort of cell lines and transcriptomic data are paramount in order to understand the downstream effect of those epigenetic and genetic regulatory layers. TCGA, instead, aimed to collect and analyze thousands of patient's samples from 30 different tumor types in order to understand the underlying mechanisms of malignant transformation and progression. In this context RNA-Seq data provide a unique snapshot of the transcriptomic status of the disease and look at an unbiased population of transcripts that allows the identification of novel transcripts, fusion transcripts and non-coding RNAs that could be undetected with different technologies.

This article was submitted to WikiJournal of Science for external academic peer review in 2019 (reviewer reports). The updated content was reintegrated into the Wikipedia page under a CC-BY-SA-3.0 license ( 2021 ). The version of record as reviewed is: Felix Richter et al. (17 May 2021). "A broad introduction to RNA-Seq". WikiJournal of Science. 4 (2): 4. doi:10.15347/WJS/2021.004. ISSN 2470-6345. Wikidata Q100146647.


Endogenous Reverse Transcriptase Could Allow mRNA Vaccines to Permanently Alter DNA

The Defender is experiencing censorship on many social channels. Be sure to stay in touch with the news that matters by subscribing to our top news of the day. It’s free.

Research on SARS-CoV-2 RNA by scientists at Harvard and MIT has implications for how mRNA vaccines could permanently alter genomic DNA, according to Doug Corrigan, Ph.D., a biochemist-molecular biologist who says more research is needed.

Over the past year, it would be all but impossible for Americans not to notice the media’s decision to make vaccines the dominant COVID narrative, rushing to do so even before any coronavirus-attributed deaths occurred.

The media’s slanted coverage has provided a particularly fruitful public relations boost for messenger RNA (mRNA) vaccines — decades in the making but never approved for human use — helping to usher the experimental technology closer to the regulatory finish line.

Under ordinary circumstances, the body makes (“transcribes”) mRNA from the DNA in a cell’s nucleus. The mRNA then travels out of the nucleus into the cytoplasm, where it provides instructions about which proteins to make.

By comparison, mRNA vaccines send their chemically synthesized mRNA payload (bundled with spike protein-manufacturing instructions) directly into the cytoplasm.

According to the Centers for Disease Control and Prevention (CDC) and most mRNA vaccine scientists, the buck then stops there — mRNA vaccines “do not affect or interact with our DNA in any way,” the CDC says. The CDC asserts first, that the mRNA cannot enter the cell’s nucleus (where DNA resides), and second, that the cell — Mission-Impossible-style — “gets rid of the mRNA soon after it is finished using the instructions.”

A December preprint about SARS-CoV-2, by scientists at Harvard and Massachusetts Institute of Technology (MIT), produced findings about wild coronavirus that raise questions about how viral RNA operates.

The scientists conducted the analysis because they were “puzzled by the fact that there is a respectable number of people who are testing positive for COVID-19 by PCR long after the infection was gone.”

Their key findings were as follows: SARS-CoV-2 RNAs “can be reverse transcribed in human cells,” “these DNA sequences can be integrated into the cell genome and subsequently be transcribed” (a phenomenon called “retro-integration”) — and there are viable cellular pathways to explain how this happens.

According to Ph.D. biochemist and molecular biologist Dr. Doug Corrigan, these important findings (which run contrary to “current biological dogma”) belong to the category of “Things We Were Absolutely and Unequivocally Certain Couldn’t Happen Which Actually Happened.”

The findings of the Harvard and MIT researchers also put the CDC’s assumptions about mRNA vaccines on shakier ground, according to Corrigan. In fact, a month before the Harvard-MIT preprint appeared, Corrigan had already written a blog outlining possible mechanisms and pathways whereby mRNA vaccines could produce the identical phenomenon.

In a second blog post, written after the preprint came out, Corrigan emphasized that the Harvard-MIT findings about coronavirus RNA have major implications for mRNA vaccines — a fact he describes as “the big elephant in the room.” While not claiming that vaccine RNA will necessarily behave in the same way as coronavirus RNA — that is, permanently altering genomic DNA — Corrigan believes that the possibility exists and deserves close scrutiny.

In Corrigan’s view, the preprint’s contribution is that it “validates that this is at least plausible, and most likely probable.”

النسخ العكسي

As the phrase “reverse transcription” implies, the DNA-to-mRNA pathway is not always a one-way street. Enzymes called reverse transcriptases can also convert RNA into DNA, allowing the latter to be integrated into the DNA in the cell nucleus.

Nor is reverse transcription uncommon. Geneticists report that “Over 40% of mammalian genomes comprise the products of reverse transcription.”

The preliminary evidence cited by the Harvard-MIT researchers indicates that endogenous reverse transcriptase enzymes may facilitate reverse transcription of coronavirus RNAs and trigger their integration into the human genome.

The authors suggest that while the clinical consequences require further study, detrimental effects are a distinct possibility and — depending on the integrated viral fragments’ “insertion sites in the human genome” and an individual’s underlying health status — could include “a more severe immune response … such as a ‘cytokine storm’ or auto-immune reactions.”

In 2012, a study suggested that viral genome integration could “lead to drastic consequences for the host cell, including gene disruption, insertional mutagenesis and cell death.”

Corrigan makes a point of saying that the pathways hypothesized to facilitate retro-integration of viral — or vaccine — RNA into DNA “are not unknown to people who understand molecular biology at a deeper level.”

Even so, the preprint’s discussion of reverse transcription and genome integration elicited a maelstrom of negative comments from readers unwilling to rethink biological dogma, some of whom even advocated for retraction (though preprints are, by definition, unpublished) on the grounds that “conspiracy theorists … will take this paper to ‘proof’ that mRNA vaccines can in fact alter your genetic code.”

More thoughtful readers agreed with Corrigan that the paper raises important questions. For example, one reader stated that confirmatory evidence is lacking “to show that the spike protein only is expressed for a short amount of time (say 1-3 days) after vaccination,” adding, “We think that this is the case, but there is no evidence for that.”

In fact, just how long the vaccines’ synthetic mRNA — and thus the instructions for cells to keep manufacturing spike protein — persist inside the cells is an open question.

Ordinarily, RNA is a “notoriously fragile” and unstable molecule. According to scientists, “this fragility is true of the mRNA of any living thing, whether it belongs to a plant, bacteria, virus or human.”

But the synthetic mRNA in the COVID vaccines is a different story. In fact, the step that ultimately allowed scientists and vaccine manufacturers to resolve their decades-long mRNA vaccine impasse was when they figured out how to chemically modify mRNA to increase its stability and longevity — in other words, produce RNA “that hangs around in the cell much longer than viral RNA, or even RNA that our cell normally produces for normal protein production.”

It is anyone’s guess what the synthetic mRNA is doing while it is “hanging around,” but Corrigan speculates that its enhanced longevity raises the probability of it “being converted over into DNA.”

Moreover, because the vaccine mRNA is also engineered to be more efficient at being translated into protein, “negative effects could be more frequent and more pronounced with the vaccine when compared to the natural virus.” ….


نتائج

Experimental Design

To study the RT error and RDD rates at STRs, we designed the following experiment ( fig. 1). We isolated genomic DNA and total RNA from the same sample (orangutan testis of a single individual). The genomic DNA was sequenced using two different library preparation protocols—PCR-containing and PCR-free (see Materials and Methods section for details)—allowing us to test for genotype congruence between the two libraries (see “Genotyping STRs Using the DNA Sequencing Data” in Results). Total RNA was divided into two aliquots that were used to construct two separate RNA-seq libraries. Each of these two libraries was sequenced in two separate batches. Such an experiment, ideally, should allow one to differentiate between RDDs (such differences from the DNA sequence should be present in both RNA-seq libraries) and RT errors (such variants should be present in only one of the two RNA-seq libraries but in both sequencing batches). However, empirical data frequently have missing information at some loci due to limited sampling, which can distort results. For example, if a deviant STR variant is not sampled in one cDNA library, then an RT error can be incorrectly inferred instead of an RDD. For instance, if one-tenth of RNA molecules at a locus was modified from (A)6 to (A)7 due to RDD, then we should expect to observe (A)7 in both replicated cDNA libraries sequenced. However, if (A)7 was not sampled in one library, then we will observe (A)7 only in the other library, thereby misclassifying this situation as an RT error. Therefore, we developed a full likelihood method that permits sampling errors in the likelihood calculation to avoid error misclassifications.


CDNA cloning and library construction

One of the first applications of reverse transcriptase in molecular biology was the construction of cDNA libraries [2-4]. A cDNA library consists of cDNA clones that represent the transcribed sequences within a specific sample. Therefore, a library provides information about the temporal and spatial expression of genes for a given cell type, organ, or developmental stage, for example. The cDNA library clones are used in the characterization of novel RNA transcripts, determination of gene sequences, and expression of recombinant proteins.

Essential in constructing cDNA libraries is the proper representation of RNAs in their full length and/or their relative abundance, making the selection of a reverse transcriptase extremely important. Highly processive reverse transcriptases are capable of synthesizing long cDNAs as well as capturing low-abundance RNAs. Similarly, reverse transcritpases with increased thermostability are recommended for reverse-transcribing RNA with a high degree of secondary structure. (تعلم المزيد عن reverse transcriptase attributes) (White paper:Engineered reverse transcriptase)

After reverse transcription, a number of approaches may be used to insert cDNA into a vector for cloning. The double-stranded cDNAs after second-strand synthesis often have blunt ends and can be cloned into blunt-ended vectors (Figure 5A). Although this approach involves fewer steps, blunt-end cloning may result in less efficient ligation and loss of directionality after insertion. (Learn more about cloning workflow)

Alternatively, cDNA ends may be modified to include additional nucleotides of known sequences. For example, to modify the 5′ end of cDNA, oligo(dT) primers with additional 5′ nucleotides can be used to initiate reverse transcription to modify the 3′ end, short DNA oligos called linkers or adapters with desired sequences may be ligated (Figure 5B). In this manner, sites for directional insertion (e.g., restriction and homologous recombination), promoter binding (e.g., T3 and T7 sequences), and affinity purification (e.g., biotin and His tags) can be readily incorporated into the cDNA sequence. (Learn more about DNA library construction)

In another popular strategy, the 3′ ends of cDNA inserts and vectors are enzymatically extended with complementary homopolymeric tails. Using terminal deoxynucleotidyl transferase (TdT) and a single dNTP, a string of 20–30 nucleotides can be added to an insert, and a similar string of complementary nucleotides added to a vector (e.g., Cs on the insert and Gs on the vector), enabling the vector and insert tails to anneal to each other (Figure 5C). Ligation is not required because the gaps are repaired inside the bacteria after transformation.

When the target sequence is known, the insert may be generated by RT-PCR for cloning of a specific region of a cDNA (Figure 5D). (Learn more about PCR cloning)

يتعلم أكثر

Related products


استنتاج

Real-time RT-PCR is extremely powerful and can generate reliable, reproducible, and biologically meaningful results. However, this brief review of some of the underlying problems should also have made it clear that great care must be taken in planning and analyzing real-time RT-PCR assays. We have barely touched on the problems of normalization and reference genes (previously known as housekeeping genes), and have not mentioned �solute” versus relative quantification or the need for standard curves and how they should be generated. Because the reporting of Cر values alone can conceal as much as it reports, we believe it is necessary to begin a concerted effort to introduce more standard analysis and reporting procedures, as has been done for microarray technology in the establishment of the MIAME guidelines (www.mged.org/miame). Certainly, in the absence of such standards for real-time RT-PCR, it falls to the editors of journals to ensure that papers that include this technology are appropriately reviewed, and that any conclusions are rigorously supported by the actual data.

For the researcher, it is vital to consider each stage of the experimental protocol, starting with the laboratory setup and proceeding through sample acquisition, template preparation, RT, and finally the PCR step. Only if every one of these stages is properly validated is it possible to obtain reliable quantitative data. Of course, choice of chemistries, primers and probes, and instruments must be appropriate to whatever is being quantitated. Finally, data must be interpreted, and this remains a real problem. Clearly, real-time qPCR is a valuable, versatile, and powerful technique. But, like anything powerful, it needs to be treated with respect.


شاهد الفيديو: بناء البروتين النسخ والترجمة (أغسطس 2022).