معلومة

ما هي المعلومات التي تنقلها صورة ميكروأري؟

ما هي المعلومات التي تنقلها صورة ميكروأري؟



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

حسنًا ، لقد قرأت أن الخلية تولد 4 أنواع من البيانات الرقمية (على وجه الدقة المنفصلة) وهي DNA و RNA والبروتين (تسلسلات يمكن ترميزها كتسلسل سلاسل من النيوكليوتيدات / الأحماض الأمينية) وصورة المصفوفة الدقيقة. أنا لست عالم أحياء ، لكن اهتمامي هو نظرية الإحصاء والمعلومات لهذه البيانات. أود أن أعرف ما هي المعلومات التي تنقلها صورة المصفوفة الدقيقة للحمض النووي؟ على سبيل المثال بعد معالجتها بمساعدة برنامج مناسب ، ما نوع المعلومات التي نحصل عليها؟

عينة صورة مصفوفة صغيرة:


كل بقعة تتداخل مع قليل النوكليوتيد مسبار، التي تم تصميمها لتحديد تسلسل حمض نووي معين. تحتوي مصفوفات التعبير الجيني على مجسات مكملة للتسلسلات المشتقة من exons ؛ لذلك سوف يتم تهجينهم مع هذه المتواليات.

قبل التهجين ، يتم تمييز (كدنا) (في هذه الحالة) بجزيء فلوري مثل Cy3 أو Cy5 (يمكن استخدام صبغتين للتمييز بين المعالجة والتحكم). لاحظ أن كل بقعة ستحتوي على العديد من جزيئات المسبار. تتناسب كثافة الفلورسنت مع عدد خيوط الحمض النووي المهجنة ، والتي بدورها تتناسب مع تعبيرها في العينة.

تتوفر كمية كبيرة من النصوص في تحليل بيانات ميكروأري والتي يمكنك العثور عليها بسهولة تامة.


ما تحتاج إلى معرفته قبل طلب ميكروأري الكروموسومات

يمكن أن يكون اختبار المصفوفة الدقيقة للكروموسومات (CMA) أداة تشخيصية قوية عند استخدامها بشكل مناسب. قد تختلف تقنية CMA وعملية الاختبار عن الاختبارات المعملية الأخرى التي اعتدت عليها ، ولكن مع الانتباه إلى الخطوات الموضحة في هذا البرنامج ، يمكنك تطبيق هذا الاختبار بنجاح في ممارستك. في هذا القسم ، نناقش المعلومات الأساسية التي ستحتاج إليها عند اتخاذ قرار بشأن طلب المصفوفة الدقيقة للكروموسومات ، بما في ذلك كيفية عمل الاختبار ، وما يكتشفه ، ومتى ثبتت فائدته. فيما يلي الأسئلة الرئيسية التي يجب أن تفهمها قبل أن تقرر الاختبار باستخدام المصفوفة الدقيقة للكروموسومات.

ما الذي تكتشفه المصفوفة الدقيقة للكروموسومات؟

يبحث اختبار المصفوفة الدقيقة للكروموسومات (CMA) عن شرائح كروموسومية إضافية (مكررة) أو مفقودة (محذوفة) ، تسمى أحيانًا متغيرات رقم النسخ (CNVs). وتشمل هذه:

  • الحذف الدقيق والاضطرابات الدقيقة لشرائح الكروموسوم ، التي تكون صغيرة جدًا بحيث لا يمكن رؤيتها تحت المجهر ولكنها قد تحتوي على جينات متعددة (انظر الشكل أدناه)
  • معظم حالات الشذوذ في عدد الكروموسومات (التثلث الصبغي ، وحيدة الصبغي ، وما إلى ذلك) ، بما في ذلك متلازمة داون
  • معظم عمليات إعادة الترتيب غير المتوازنة لبنية الكروموسوم (انتقالات ، إلخ)

اعتمادًا على النظام الأساسي ، قد يكتشف CMA أيضًا:

  • تماثل الزيجوت المفرط ، مما يوحي بخطر الإصابة بمرض متنحي أو اضطرابات طبع (انظر تطبيق النتائج لمزيد من المعلومات)
  • تعدد الصبغيات والازدواجية الأخرى لمجموعة الكروموسوم بأكملها (رباعي الصبغيات ، إلخ)

كما هو الحال مع النمط النووي التقليدي ، يمكن اكتشاف الفسيفساء (مزيج من الخلايا الطبيعية وغير الطبيعية) بنسبة تزيد عن 20-25٪ عن طريق اختبار CMA. تختلف معدلات الكشف باختلاف منصة الاختبار المحددة بالمللي ثانية).

ماذا CMA ليس يكشف؟

لا يوجد اختبار يمكنه استبعاد جميع الأمراض الوراثية. تتطلب بعض أنواع المتغيرات اختبارًا مختلفًا ، ويصعب عزل بعض المناطق وتحليلها من الناحية الفنية.

  • تغييرات صغيرة في تسلسل الجينات الفردية (الطفرات النقطية)
  • عمليات مضاعفة وحذف صغيرة لأجزاء من الحمض النووي داخل جين واحد (متلازمة X الهش ، على سبيل المثال)
  • إعادة ترتيب الكروموسومات المتوازنة (انتقالات متوازنة وانقلابات)

تختلف قيود اختبار CMA أيضًا باختلاف المنهجية المستخدمة. لا يمكن لمعظم CMA اكتشاف الفسيفساء أقل من 20-25٪. لا تكتشف بعض الأنظمة الأساسية الزيجوت المتماثل المفرط أو ثلاثي الصبغيات وغيرها. (راجع قسم الطلب للحصول على مزيد من المعلومات حول منصات CMA المختلفة.)

كيف يعمل CMA؟

& ldquoMicroarray & rdquo يشير إلى منصة اختبار قائمة على الرقاقة الدقيقة تسمح بتحليل آلي كبير الحجم للعديد من قطع الحمض النووي مرة واحدة. تستخدم رقائق CMA ملصقات أو مجسات ترتبط بمناطق كروموسوم معينة. يستخدم تحليل الكمبيوتر لمقارنة المادة الوراثية للمريض و rsquos بتلك الخاصة بالعينة المرجعية. يسمى الفرق بين DNA و rsquos DNA والعينة المرجعية بالمتغير.

أي المرضى يمكن أن يستفيد منها؟

CMA هو بوضوح مفيد للأفراد الذين لا يتناسبون مع متلازمة محددة معروفة (مثل متلازمة داون) ، ولكن يظهرون أيًا مما يلي:

    تأخر في النمو / ضعف عقلي
  • اضطرابات طيف التوحد
  • التشوهات الخلقية المتعددة ، بما في ذلك ملامح الوجه المشوهة

قد يكون اختبار CMA أيضًا الاختبار الأكثر فعالية من حيث التكلفة عندما يتضمن التفاضل الخاص بك أكثر من حالة يمكن اكتشافها بواسطة التقنية. من الممكن أن يكون لدى المرضى أكثر من حالة وراثية واحدة ، ويمكن أخذ ذلك في الاعتبار إذا أظهر المريض ميزات لا تتعلق عادة بتشخيص راسخ. يمكن للأخصائي الوراثي أن يساعد في تحديد ما إذا كانت الاختبارات الإضافية ، مثل CMA ، ستكون مفيدة.

يتم التحقيق في CMA لاستخدامها في مجموعات المرضى الآخرين ، وسوف تتوسع استخداماتها بمرور الوقت. في هذه الحالات قد يكون مفيدًا بشكل خاص عندما تفشل الاختبارات الأخرى في الوصول إلى التشخيص:

  • اضطراب النوبة غير المبرر
  • تأخير النمو
  • الأمراض النفسية
  • الأمراض العصبية العضلية

كيف تستخدم النتائج سريريا؟

قد يكون اختبار CMA بمثابة بوابة للحصول على مزيد من المساعدة لعائلات الأطفال الذين يعانون من حالات لم يتم تشخيصها من قبل. قد لا يوفر المتغير الموجود في CMA فقط تفسيرًا طال انتظاره للنتائج السريرية للمريض و rsquos ، ولكنه يؤثر أيضًا على الإدارة بالطرق التالية:

  • تُوجه الملامح المعرفية والتنموية والوظيفية المحددة المرتبطة ببعض المتغيرات التشخيص والإدارة والتدخلات التعليمية.
  • قد تتم الإشارة إلى التقييمات أو الإحالات من أجل المتلازمات للكشف عن المضاعفات التي ربما لم يتم تفويتها.
  • تقوم دراسات الأسرة بالإبلاغ عن التخطيط الإنجابي والفحص لأفراد الأسرة المعرضين للخطر.

يمكن أن يوفر تشخيص CMA أيضًا فائدة نفسية اجتماعية للعائلة ، بما في ذلك الوصول إلى مجتمع دعم جديد من الأفراد الذين لديهم تشخيص مماثل. انظر أمثلة الحالة أدناه ، وقسم تطبيق النتائج ، للحصول على أمثلة والموارد المتعلقة بالفائدة السريرية لنتائج CMA.

هل يجب أن تحل CMA محل تحليل الكروموسوم التقليدي أو الاختبارات الجينية الأخرى؟

في عام 2010 ، أوصت الكلية الأمريكية لعلم الوراثة الطبية CMA كاختبار من الدرجة الأولى في مجموعة الأفراد الذين يعانون من تأخر في النمو ، وضعف ذهني ، طيف التوحد والتشوهات الخلقية المتعددة.

CMA يؤدي إلى تشخيص في 10-15٪ ، وهو أفضل بكثير من

3٪ عائد مع تحليل الكروموسوم التقليدي. يمكن لـ CMA أيضًا اكتشاف معظم تشوهات الكروموسومات الإجمالية التي تم اكتشافها بواسطة النمط النووي القياسي.

لا يزال النمط النووي مناسبًا للمرضى الذين يتناسبون بشدة مع خصائص تشخيص شذوذ الكروموسومات ، مثل متلازمة داون. يعد الاختبار الجيني الجزيئي المستهدف مناسبًا لظروف مثل متلازمة Fragile X التي لم يتم اكتشافها بواسطة CMA. ومع ذلك ، قد يكون اختبار CMA مفيدًا عندما تفشل هذه الاختبارات في الحصول على تشخيص ، أو عندما يكون لدى المريض تشخيص ولكن مسار غير عادي ، أو عندما يتضمن التفاضل حالات متعددة مع ميزات متداخلة.

النتائج التي توحي بتشخيص محدد يشير إلى الاختبار المستهدف قد تشمل:

  • السمات الفيزيائية المميزة
  • الأبراج المحددة من التشوهات الخلقية
  • بعض السمات المعرفية / التنموية
  • نمط الميراث الواضح في الأسرة

في حالة الشك ، استشر أخصائي علم الوراثة السريري أو المختبر (انظر كيف أحصل على المساعدة؟).

ما هي التكاليف والمخاطر؟

بشكل عام ، تكلف الاختبارات الجينية أكثر من الاختبارات المعملية الروتينية. في حين أن CMA حاليًا أغلى من تحليل الكروموسوم التقليدي ، فإن العائد التشخيصي أعلى بكثير في المرضى الذين يعانون من مؤشرات معينة. التكاليف تتناقص مع تحسن التكنولوجيا.

هناك خطر من وجود نتائج غير مؤكدة أو غير إعلامية أو غير متوقعة. ومع ذلك ، فإن النتيجة السلبية ليست بالضرورة غير مفيدة في البحث التشخيصي. يجب موازنة التأثير السريري والنفسي الاجتماعي المحتمل للنتائج المختلفة على أساس كل حالة على حدة. راجع أقسام الاستشارة قبل الاختبار وبعده للحصول على نصائح لهذه العملية.


تفاصيل المنتج

رقم الكتالوج عدد المستضدات وصف
PA001 120 المسح العام للمستضدات الذاتية البشرية
PA002 120 اضطرابات الدماغ البشري والجهاز العصبي المركزي
PA003 120 السرطان البشري والأورام
PA006 75 مسببات الحساسية البشرية الشائعة
PA009 41 الجديد! بروتينات فيروس كورونا SARS-CoV-2
PA010 120 الجديد! المناعة الذاتية للإنسان والحساسية والعدوى
PA012 120 الجديد! المناعة الذاتية المرتبطة بفيروس كورونا البشري (CAA)

صفائف غشاء النايلون

عندما كان عنق الزجاجة في تحليل التعبير الجيني هو المعيار ، مع تحليل المصفوفة ، فهو عمل الكمبيوتر. نظرًا لأن تجربة مصفوفة واحدة يمكن أن تولد آلاف نقاط البيانات ، فإن التحدي الأساسي لهذه التقنية هو فهم البيانات. توفر العديد من الشركات التجارية برامج تحليل الصور ، بما في ذلك BioDiscovery (ImaGene) و Imaging Research (ArrayVision). علاوة على ذلك ، يقدم العديد من مصنعي المصفوفات برامج خاصة لتحليل المصفوفات الخاصة بهم ويقدمون التحليل كخدمة.

لتحليل مجموعة الغشاء ، يتم إنشاء ملف البيانات عن طريق التصوير الفسفوري ثم يتم تحليل هذا الملف باستخدام البرنامج. سيقوم البرنامج بربط البقع بالجينات ويمكنه مقارنة شدة البقع لدراسات التعبير التفاضلي.

يتم التعامل مع بيانات المصفوفة الزجاجية بنفس الطريقة إلى حد كبير ، ولكن يتم مسح وميض الصورة ضوئيًا ويسمح البرنامج باكتشاف وميض كل عينة على حدة أو في وقت واحد للتحليل. يمكن لمعظم حزم البرامج تحليل عدة مصفوفات في وقت واحد.


قواعد البيانات لبيولوجيا النظم

يورغن إيلز. مارتن جينكل ، في بيولوجيا الأنظمة الحاسوبية ، 2006

2 المعايير

هناك جهود مستمرة لتطوير معايير للإبلاغ عن البيانات التجريبية وتخزينها من أنواع معينة من الأساليب. تم تطوير الحد الأدنى من المعلومات حول معيار تجربة المصفوفات الدقيقة (MIAME) لدعم تصدير البيانات ووصف تجارب المصفوفات الدقيقة بهدف تفسير التجربة بشكل لا لبس فيه من قبل مجتمع البحث بأكمله (Brazma et al. 2001). تعتمد لغة ترميز التعبير الجيني MicroArray (MAGE-ML) على نموذج كائن MAGE (MAGE-OM) ، ويمكن استخدامها لتبادل بيانات المصفوفات الدقيقة (Spellman et al.2002). تم تطوير تسمية HUPO (منظمة البروتين البشري) لتسهيل مقارنة البيانات وتبادلها والتحقق منها في مجال البروتينات بواسطة مبادرة معايير البروتينات (Orchard et al. 2003 Orchard et al.2005). في الآونة الأخيرة ، تم تشكيل لجنة بهدف وضع معايير لتوصيف الإنزيم الوظيفي ، تسمى معايير الإبلاغ عن بيانات الإنزيم (STRENDA). المعايير الموضحة في OME للتعامل مع مشاريع دعم البيانات المجهرية باستخدام ، على سبيل المثال ، فحص RNAi والتطبيقات التي تتطلب تخزين صور متعددة الأبعاد وتحليلها. تم إنشاء مخطط XML (لغة التوصيف الموسعة) ، OME XML ، لتوحيد نقل البيانات (سويدلو وآخرون 2003). تم دمج معايير المصفوفات الدقيقة والبروتيوميات في نموذج كائن بيولوجيا الأنظمة (SysBio-OM) ، والذي يدعم تمثيل بيانات المصفوفة الدقيقة وتعبير البروتين بالإضافة إلى البيانات التي تصف تفاعلات البروتين إلى البروتين وعمليات التمثيل الغذائي (Xirasagar et al. 2004).


الجديد المنتج! المصفوفات الدقيقة لمستضد فيروس كورونا SARS-CoV-2. لمزيد من المعلومات حول هذه المصفوفات الدقيقة ، يرجى زيارة https://www.genecopoeia.com/product/omicsarray-antigen-microarrays/.

بالإضافة إلى المصفوفات المصممة مسبقًا ، تتوفر المصفوفات التي تحتوي على مجموعات مخصصة من البروتينات ، بالإضافة إلى خدمات تحديد الصفيف وتحليل البيانات.

  • مضاعفة قادرة. يمكن لمصفوفات المستضدات الدقيقة من OmicsArray & trade أن تفحص ما يصل إلى 120 مستضدًا في المرة الواحدة ، مقارنةً ببروتين واحد في كل مرة لـ ELISA.
  • إنتاجية عالية. يمكن لكل شريحة معالجة ما يصل إلى 15 عينة بالتوازي.
  • حساسية عالية. يمكن لكل مجموعة اكتشاف ما لا يقل عن 1 بيكوغرام / مل من الجسم المضاد ، وهو أكثر حساسية بمقدار 100 ضعف من ELISA.
  • حجم عينة صغير. ما لا يزيد عن 1 مايكرولتر من المصل ضروري للكشف.
  • بسرعة. من عينة إلى بيانات في أقل من أسبوعين.

بيولوجيا السكر

ديفيد ف. سميث. ريتشارد دي كامينغز ، في طرق في علم الإنزيمات ، 2010

2 The Glycan Microarray المطبوع من Consortium for Functional Glycomics (CFG)

Glycan Array Synthesis Core (Core D) ينتج CFG glycan microarray (http://www.functionalglycomics.org/static/consortium/organization/sciCores/cored.shtml) ، كما هو موضح سابقًا (Blixt وآخرون.، 2004). يقدم الشكل 19.1 ملخصًا للخطوات المتضمنة في إنتاج مصفوفة الجليكان ثم تحليل الجنيه الإسترليني باستخدام مجموعة متنوعة من طرق الكشف عن الفلورسنت لإنتاج البيانات في تنسيق مدرج تكراري. تمت طباعة مجموعة CFG على شرائح مجهر زجاجية مشتقة من NHS (SCHOTT Nexterion® Slide H ، SCHOTT North America ، Elmsford ، NY). تمتلك جميع الجليكانات المتاحة لـ Glycan Array Synthesis Core D من CFG أمينًا أوليًا على رابط متصل بالنهاية المختصرة لكل جليكان. تتوفر هياكل الجليكان وهيكل الروابط الفردية لكل إصدار من مصفوفة ميكروأري جليكان CFG على (http://www.functionalglycomics.org/static/consortium/resources/resourcecoreh8.shtml). أول مصفوفة ميكروأرية مطبوعة للجليكان ، متوفرة في عام 2005 ، كانت v2.0 وتحتوي على 264 هدفًا للجليكان ، وعلى مدار 5 سنوات من خلال ثماني تكرارات ، تم توسيعها إلى 511 جليكان. تتم طباعة كل هدف glycan بنفس التركيز (100 μم) في مكررات ستة. يتم ربط عدد قليل من النانوجرامات فقط من كل جليكان بالشريحة في قطر موضعي

100 ميكرون. ملف GAL ، وهو ملف.رسالة قصيرة ملف يحدد موقع كل بقعة على ميكروأري ، ويحدد كل ميكروأري ويسمح بمحاذاة بقعة جليكان مع الصور الفلورية لربط الجنيه الإسترليني. المصفوفات الدقيقة glycan المطبوعة مستقرة ومخزنة مجففة في درجة حرارة الغرفة.

الشكل 19.1. تحليل البروتين المرتبط بالجليكان (GBP) على المصفوفات الدقيقة للجليكانات المحددة. (أ) يتم استجواب الجليكانات المحددة المطبوعة والمرتبطة تساهميًا بشرائح الزجاج المنشط باستخدام الجنيه الإسترليني الحيوي واكتشافها في الخطوة الثانية باستخدام الستربتافيدين المسمى سيانين 5. (ب) استراتيجيات بديلة للكشف عن الجنيه الاسترليني على ميكروأري. (ج) يتم حساب متوسط ​​RFU الذي تم إنشاؤه أثناء عملية مسح الفلورة للبقع المكررة ويتم تقديم البيانات على شكل رسوم بيانية لشدة التألق أو وحدات التألق النسبية (RFU) مع الانحراف المعياري أو الخطأ المعياري للمتوسط ​​المشار إليه في أشرطة الخطأ.


نتائج ومناقشة

سيناريو افتراضي

يجب أن تضمن عوامل التطبيع المقدرة أن الجين الذي له نفس مستوى التعبير في عينتين لم يتم اكتشافه على أنه DE. لمزيد من تسليط الضوء على الحاجة إلى إجراءات تطبيع أكثر تعقيدًا في بيانات RNA-seq ، فكر في تجربة فكرية بسيطة. تخيل أن لدينا تجربة تسلسل تقارن مجموعتي RNA ، A و B. في هذا السيناريو الافتراضي ، افترض أن كل جين معبر عنه في B تم التعبير عنه في A بنفس عدد النسخ. ومع ذلك ، افترض أن العينة A تحتوي أيضًا على مجموعة من الجينات متساوية في العدد والتعبير التي لم يتم التعبير عنها في B. وهكذا ، فإن العينة A تحتوي على ضعف إجمالي عدد الجينات المعبر عنها مثل العينة B ، أي أن إنتاج RNA الخاص بها هو ضعف حجم العينة ب. افترض أن كل عينة تسلسل بعد ذلك إلى نفس العمق. بدون أي تعديل إضافي ، سيكون للجين المعبر عنه في كلتا العينتين ، في المتوسط ​​، نصف عدد القراءات من العينة A ، نظرًا لأن القراءات موزعة على ضعف عدد الجينات. لذلك ، فإن التطبيع الصحيح من شأنه أن يضبط العينة أ بمعامل 2.

يسلط المثال الافتراضي أعلاه الضوء على فكرة أن نسبة القراءات المنسوبة إلى جين معين في مكتبة تعتمد على خصائص التعبير للعينة بأكملها بدلاً من مستوى التعبير عن ذلك الجين فقط. من الواضح أن المثال أعلاه مصطنع. ومع ذلك ، هناك حالات بيولوجية وحتى تقنية تتطلب مثل هذا التطبيع. على سبيل المثال ، إذا كانت عينة RNA ملوثة ، فإن القراءات التي تمثل التلوث ستأخذ قراءات من العينة الحقيقية ، وبالتالي تسقط عدد القراءات المهمة وتعوض النسبة لكل جين. ومع ذلك ، كما أوضحنا ، فإن الاختلافات البيولوجية الحقيقية في تكوين الحمض النووي الريبي بين العينات ستكون السبب الرئيسي للتطبيع.

إطار أخذ العينات

يستخدم التفسير الأكثر رسمية لمتطلبات التطبيع الإطار التالي. حدد ص حسنًامثل العد المرصود للجين ز في المكتبة ك تلخيصا من القراءات الأولية ، ميكرومتر حسنًاكمستوى التعبير الحقيقي وغير المعروف (عدد النصوص) ، إل زبطول الجين ز و ن ككعدد إجمالي للقراءات للمكتبة ك. يمكننا نمذجة القيمة المتوقعة لـ ص حسنًاكما:

س كيمثل الناتج الإجمالي للحمض النووي الريبي لعينة. المشكلة الكامنة وراء تحليل بيانات تسلسل الحمض النووي الريبي هي تلك الفترة ن كمعروف، س كغير معروف ويمكن أن يختلف اختلافًا كبيرًا من عينة إلى أخرى ، اعتمادًا على تكوين الحمض النووي الريبي. كما هو مذكور أعلاه ، إذا كان لدى السكان ناتج إجمالي أكبر من RNA ، فإن تجارب RNA-seq ستقلل من عينة العديد من الجينات ، بالنسبة لعينة أخرى.

في هذه المرحلة ، نترك التباين في النموذج أعلاه لـ ص حسنًاغير محدد. اعتمادًا على الموقف التجريبي ، يبدو Poisson مناسبًا للتكرارات التقنية [6 ، 7] وقد يكون ذو الحدين السالب مناسبًا للاختلاف الإضافي الذي لوحظ من التكرارات البيولوجية [14]. ومن الجدير بالذكر أيضًا أنه ، من الناحية العملية ، فإن إل زيتم امتصاصه بشكل عام في ميكرومتر حسنًاالمعلمة ولا يتم استخدامها في إجراء الاستدلال. ومع ذلك ، فقد ثبت جيدًا أن تحيزات طول الجينات بارزة في تحليل التعبير الجيني [15].

المتوسط ​​المشذب لطريقة تطبيع القيم M.

إجمالي إنتاج الحمض النووي الريبي ، س ك، لا يمكن تقديرها بشكل مباشر ، لأننا لا نعرف مستويات التعبير والأطوال الحقيقية لكل جين. ومع ذلك ، فإن إنتاج الحمض النووي الريبي النسبي لعينتين ، F ك = S. ك ك' يمكن تحديده بسهولة أكبر ، وهو تغيير في الطية العالمية بشكل أساسي. نقترح استراتيجية تجريبية تساوي مستويات التعبير العام للجينات بين العينات على افتراض أن الغالبية منها ليست دي. طريقة واحدة بسيطة لكنها قوية لتقدير نسبة إنتاج الحمض النووي الريبي تستخدم متوسطًا مرجحًا مشذبًا لنسب تعبير السجل (المتوسط ​​المقطوع لقيم M (TMM)). بالنسبة لتسلسل البيانات ، نحدد تغييرات طي السجل الجيني على النحو التالي:

ومستويات التعبير المطلق:

لتلخيص قيم M المرصودة بقوة ، نقوم بقص كل من قيم M والقيم A قبل أخذ المتوسط ​​المرجح. يتم استخدام أوزان الدقة (معكوس التباين) لمراعاة حقيقة أن تغييرات طية السجل (بشكل فعال ، مخاطرة نسبية للسجل) من الجينات ذات عدد القراءة الأكبر لها تباين أقل على مقياس اللوغاريتم. انظر المواد والأساليب لمزيد من التفاصيل.

للمقارنة بين عينتين ، عامل قياس نسبي واحد فقط (F ك) مطلوب. يمكن استخدامه لضبط أحجام المكتبات (قسمة المرجع على وضرب غير المرجع في) في التحليل الإحصائي (على سبيل المثال ، اختبار فيشر الدقيق انظر المواد والأساليب لمزيد من التفاصيل).

يمكن حساب عوامل التطبيع عبر عدة عينات عن طريق اختيار عينة واحدة كمرجع وحساب عامل TMM لكل عينة غير مرجعية. على غرار المقارنات بين عينتين ، يمكن دمج عوامل تطبيع TMM في النموذج الإحصائي المستخدم لاختبار DE. على سبيل المثال ، سيعدل نموذج Poisson حجم المكتبة المرصود إلى حجم مكتبة فعال ، والذي يضبط المتوسط ​​النموذجي (على سبيل المثال ، باستخدام إزاحة إضافية في نموذج خطي معمم ، انظر المواد والطرق لمزيد من التفاصيل).

مجموعة بيانات الكبد مقابل الكلى

طبقنا طريقتنا على مجموعة بيانات التنميط النسخية المتاحة للجمهور لمقارنة العديد من التكرارات التقنية لمصدر الحمض النووي الريبي للكبد والكلى [6]. يوضح الشكل 1 أ توزيع قيم M بين نسختين تقنيتين لعينة الكلى بعد إجراء التطبيع القياسي لحساب العدد الإجمالي للقراءات. يتركز توزيع قيم M لهذه التكرارات التقنية حول الصفر. ومع ذلك ، يوضح الشكل 1 ب أن نسب السجل بين عينة الكبد والكلى يتم تعويضها بشكل كبير نحو التعبير الأعلى في الكلى ، حتى بعد حساب العدد الإجمالي للقراءات. يُبرز أيضًا (الخط الأخضر) توزيع قيم M المرصودة لمجموعة من جينات التدبير المنزلي ، مما يُظهر تحولًا كبيرًا بعيدًا عن الصفر. إذا كان القياس إلى العدد الإجمالي للقراءات قد تم تطبيع بيانات RNA-seq بشكل مناسب ، فمن غير المتوقع حدوث مثل هذا التحول في تغييرات أضعاف السجل. تفسير هذا التحيز واضح ومباشر. يوضح الرسم البياني M مقابل A في الشكل 1 ج وجود مجموعة بارزة من الجينات ذات تعبير أعلى في الكبد (السهم الأسود). نتيجة لذلك ، فإن توزيع قيم M (الكبد إلى الكلى) ينحرف في الاتجاه السلبي. نظرًا لأن قدرًا كبيرًا من التسلسل مخصصًا لهذه الجينات الخاصة بالكبد ، فهناك تسلسل أقل متاح للجينات المتبقية ، مما يؤدي إلى تشويه قيم M نسبيًا (وبالتالي ، تستدعي DE) نحو كونها خاصة بالكلى.

التطبيع مطلوب لبيانات تسلسل الحمض النووي الريبي. بيانات من [6] مقارنة نسب تسجيل (أ) مكررات التقنية و (ب) الكبد مقابل مستويات التعبير الكلوي ، بعد تعديل العدد الإجمالي للقراءات في كل عينة. يُظهر الخط الأخضر التوزيع السلس لتغييرات طي السجل لجينات التدبير المنزلي. (ج) تظهر مؤامرة M مقابل A التي تقارن بين الكبد والكلى إزاحة واضحة من الصفر. تشير النقاط الخضراء إلى 545 جينًا للتدبير المنزلي ، بينما يشير الخط الأخضر إلى متوسط ​​نسبة السجل لجينات التدبير المنزلي. يُظهر الخط الأحمر عامل التطبيع المقدر لـ TMM. تسلط مسحة النقاط البرتقالية الضوء على الجينات التي لوحظت في أنسجة واحدة فقط من الكبد أو الكلى. يسلط السهم الأسود الضوء على مجموعة الجينات البارزة التي تُعزى إلى حد كبير إلى التحيز العام في تغييرات طي السجل.

ينتج عن تطبيق تطبيع TMM على هذا الزوج من العينات عامل تطبيع قدره 0.68 (-0.56 على مقياس السجل 2 الموضح بالخط الأحمر في الشكل 1 ب ، ج) ، مما يعكس نقص أخذ العينات لغالبية جينات الكبد. يعتبر عامل TMM قويًا لبيانات التغطية المنخفضة حيث يمكن توقع المزيد من الجينات مع عدم وجود عدد من الجينات (الشكل S1a في الملف الإضافي 1) ومستقر للقيم المعقولة لمعلمات القطع (الشكل S1b في الملف الإضافي 1). يؤدي استخدام تطبيع TMM في اختبار إحصائي لـ DE (انظر المواد والطرق) إلى عدد مماثل من الجينات أعلى بشكل ملحوظ في الكبد (47٪) والكلى (53٪). على النقيض من ذلك ، فإن التطبيع القياسي (إلى العدد الإجمالي للقراءات كما هو مستخدم أصلاً في [6]) ينتج عن غالبية جينات DE أعلى بشكل ملحوظ في الكلى (77٪). بشكل ملحوظ ، لا يزال يتم اكتشاف أقل من 70 ٪ من الجينات التي تم تحديدها على أنها DE باستخدام التطبيع القياسي بعد تطبيع TMM (الجدول 1). بالإضافة إلى ذلك ، نجد أن التغييرات في طي اللوغاريتمات لمجموعة كبيرة من جينات التدبير المنزلي (من [16]) ، في المتوسط ​​، يتم تعويضها من الصفر قريبة جدًا من عامل TMM المقدر ، مما يعطي مصداقية لإجراء التقدير القوي لدينا. علاوة على ذلك ، باستخدام إجراء الاختبار غير المعدل ، يتم تنظيم 8٪ و 70٪ من جينات التدبير المنزلي بشكل كبير في الكبد والكلى ، على التوالي. بعد تعديل TMM ، تتغير نسبة جينات التدبير المنزلي DE إلى 26٪ و 41٪ على التوالي ، وهو رقم إجمالي أقل وأكثر تناسقًا بين الأنسجة. بالطبع ، لم يتم ملاحظة التحيز في نسب السجل التي لوحظت في بيانات RNA-seq في بيانات ميكروأري (من نفس مصادر الحمض النووي الريبي) ، بافتراض أن بيانات ميكروأري قد تم تطبيعها بشكل مناسب (الشكل S2 في ملف إضافي 1). مجتمعة ، تشير هذه النتائج إلى دور حاسم في تطبيع بيانات RNA-seq.

مجموعات البيانات الأخرى

يحدث التحول العالمي في تغيير أضعاف السجل الناجم عن اختلافات تكوين الحمض النووي الريبي بدرجات متفاوتة في مجموعات بيانات RNA-seq الأخرى. على سبيل المثال ، مؤامرة M مقابل A لـ Cloonan وآخرون. [12] مجموعة البيانات (الشكل S3 في ملف إضافي 1) تعطي عامل تحجيم TMM يقدر بـ 1.04 بين العينتين (الأجسام الجنينية مقابل الخلايا الجذعية الجنينية) ، متسلسلة على نظام SOLiD ™. تسلط مؤامرة M مقابل A لمجموعة البيانات هذه الضوء أيضًا على مجموعة مثيرة للاهتمام من الجينات التي لها تعبير عام أقل ، ولكنها أعلى في الأجسام الجنينية. يفسر هذا التحول الإيجابي في تغييرات طي السجل للجينات المتبقية. يظهر عامل التدرج TMM قريبًا من متوسط ​​تغييرات طيات السجل بين مجموعة من حوالي 500 جين من جينات التدبير المنزلي للفأر (من [17]). كمثال آخر ، فإن Li وآخرون. [18] مجموعة البيانات ، باستخدام محلل الجينوم llumina 1G ، تُظهر تحولًا في التوزيع العام لتغييرات طي السجل وتعطي عامل قياس TMM يبلغ 0.904 (الشكل S4 في ملف إضافي 1). ومع ذلك ، هناك مجموعات بيانات قائمة على التسلسل لها مخرجات RNA متشابهة تمامًا وقد لا تحتاج إلى تعديل كبير. على سبيل المثال ، بيانات تسلسل الحمض النووي الريبي الصغير من Kuchenbauer وآخرون. [19] يظهر فقط تحيزًا متواضعًا في تغييرات طي السجل (الشكل S5 في ملف إضافي 1).

الضوابط المسننة لديها القدرة على استخدامها للتطبيع. في هذا السيناريو ، يتم إضافة كميات صغيرة ولكن معروفة من الحمض النووي الريبي من كائن غريب إلى كل عينة بتركيز محدد. من أجل استخدام أدوات التحكم في الارتفاع للتطبيع ، يجب أن تظل نسبة تركيز السنبلة إلى العينة ثابتة طوال التجربة. من الناحية العملية ، يصعب تحقيق ذلك وستؤدي الاختلافات الصغيرة إلى تقدير متحيز لعامل التطبيع. على سبيل المثال ، استخدام الحمض النووي المسنن من مرتضوي وآخرون. قد تؤدي مجموعة البيانات [11] إلى تقديرات غير واقعية لعامل التطبيع (الشكل S6 في ملف إضافي 1). كما هو الحال مع المصفوفات الدقيقة ، من الأكثر قوة بشكل عام تقدير عوامل التطبيع بعناية باستخدام البيانات التجريبية (على سبيل المثال ، [20]).

دراسات المحاكاة

لاستكشاف مدى فائدة طريقة تطبيع TMM ، قمنا بتطوير إطار محاكاة لدراسة آثار تكوين RNA على تحليل DE لبيانات RNA-seq. للبدء ، نقوم بمحاكاة البيانات من مكتبتين فقط. نقوم بتضمين معلمات لعدد الجينات المعبر عنها بشكل فريد لكل عينة ، ومعلمات لنسبة وحجم واتجاه الجينات المعبر عنها تفاضليًا بين العينات (انظر المواد والطرق). يوضح الشكل 2 أ مؤامرة M مقابل A لمحاكاة نموذجية بما في ذلك الجينات الفريدة وجينات DE. من خلال محاكاة مخرجات RNA الإجمالية المختلفة ، فإن غالبية الجينات غير DE لها تغييرات في طي اللوغاريتمات يتم تعويضها من الصفر. في هذه الحالة ، يؤدي استخدام تطبيع TMM لحساب تكوين الحمض النووي الريبي الأساسي إلى عدد أقل من الاكتشافات الخاطئة باستخدام اختبار فيشر الدقيق (الشكل 2 ب). بتكرار المحاكاة عددًا كبيرًا من المرات عبر مجموعة واسعة من معلمات المحاكاة ، نجد اتفاقًا جيدًا عند مقارنة عوامل التطبيع الحقيقية من المحاكاة مع تلك المقدرة باستخدام تطبيع TMM (الشكل S7 في ملف إضافي 1).

تظهر عمليات المحاكاة أن تطبيع TMM قوي ويتفوق على تطبيع حجم المكتبة. (أ) مثال على نتائج المحاكاة يوضح الحاجة إلى التطبيع بسبب الجينات المعبر عنها بشكل فريد في عينة واحدة (النقاط البرتقالية) و DE غير المتماثل (النقاط الزرقاء). (ب) لوحظ معدل إيجابي كاذب أقل باستخدام تطبيع TMM مقارنة بالتطبيع القياسي.

لمزيد من مقارنة أداء تطبيع TMM مع الأساليب المستخدمة سابقًا في سياق تحليل DE لبيانات RNA-seq ، نقوم بتوسيع المحاكاة أعلاه لتشمل عمليات تكرار التسلسل. على وجه التحديد ، نقارن ثلاث طرق منشورة: بيانات العد المطوية الطول التي تم تحويل السجل وتوحيدها الكمي ، كما تم تنفيذه بواسطة Cloonan وآخرون. [12] ، انحدار بواسون [6] مع حجم المكتبة وتطبيع TMM واختبار بواسون الدقيق [8] مع حجم المكتبة وتطبيع TMM. نحن لا نقارن مباشرة مع التطبيع المقترح في Balwierz وآخرون. [13] نظرًا لأن مجموعة بيانات الكبد والكلى لا يبدو أنها تتبع توزيع قانون الطاقة ولديها توزيعات تعداد متميزة تمامًا (الشكل S8 في ملف إضافي 1). علاوة على ذلك ، في ضوء تحيز تكوين الحمض النووي الريبي الذي نلاحظه ، ليس من الواضح ما إذا كانت مساواة توزيعات العد عبر العينات هي الإجراء الأكثر منطقية. بالإضافة إلى ذلك ، نحن لا نقارن مباشرة التطبيع مع الطول الافتراضي [2] أو تطبيع RPKM [11] ، حيث لم يتم ذكر التحليل الإحصائي للبيانات المحولة. ومع ذلك ، نوضح بمؤامرات M مقابل A أن تطبيعها لا يزيل تمامًا تحيز تكوين الحمض النووي الريبي (الشكلان S9 و S10 في ملف إضافي 1).

من أجل المحاكاة ، استخدمنا التوزيع المشترك التجريبي لأطوال الجينات وعددها ، منذ كلونان وآخرون. الإجراء يتطلب كليهما. لقد صنعنا بيانات المحاكاة الموزعة بواسون لتقليد التكرارات التقنية (الشكل S11 في ملف إضافي 1). يوضح الشكل 3 أ مخططات اكتشاف خاطئة بين الجينات الشائعة في كلتا الحالتين ، حيث قدمنا ​​10٪ تعبير فريد للمجموعة للشرط الأول ، و 5٪ DE بمستوى 2 أضعاف ، و 80٪ منها أعلى في الشرط الأول. النهج الذي يستخدم المنهجية التي تم تطويرها لبيانات المصفوفات الدقيقة يعمل بشكل أسوأ بشكل موحد ، كما قد يتوقع المرء لأن افتراضات التوزيع لهذه الطرق مختلفة تمامًا. من بين الطرق المتبقية (إحصائية نسبة احتمالية بواسون ، إحصائية بواسون الدقيقة) ، الأداء مشابه جدًا مرة أخرى ، تطبيع TMM يجعل تحسينًا كبيرًا لكليهما.

مخططات اكتشاف خاطئة تقارن بين عدة طرق منشورة. يصور الخط الأحمر تحليل إحصائي t متوسط ​​الطول. تُظهر الخطوط الصلبة والمتقطعة حجم المكتبة الذي تم تطبيعه وتحليل نموذج Poisson المعياري لـ TMM ، على التوالي. يمثل الخطان الأزرق والأسود اختبار LR والاختبار الدقيق ، على التوالي. يمكن ملاحظة أن استخدام تطبيع TMM ينتج عنه معدل اكتشاف خاطئ أقل بكثير.


الاستنتاجات

يوفر تسلسل الجينوم الكامل وإدخال تقنيات قادرة على قياس التعبير عن آلاف الجينات في وقت واحد البحوث البيولوجية بمنظور عالمي يعارض الاتجاه السائد على مدى العقود القليلة الماضية للتضييق في مجالات البحث عالية التخصص. لكن الاستغلال الأمثل لهذه الموارد التي لا تقدر بثمن من قبل الباحثين يستلزم تطوير أدوات التعدين لاستكشاف وتفسير البيانات في إطار زمني متوافق مع المعدل المثير للإعجاب الذي يتم إنتاجها به. تُبنى المعرفة الفردية على الارتباطات بين المعلومات التي نحصل عليها من الأدبيات. الطريقة التي نصفها هنا تحاكي عملية التعلم هذه من خلال ربط المصطلحات ذات المغزى الموجودة في المنشورات العلمية لإنشاء صورة متماسكة للعلاقات الموجودة داخل مجموعات معقدة من الجينات. نظرًا لأن هذا التحليل يتم إجراؤه بشكل مستقل عن معرفة وظيفة الجينات ، فإنه يوفر وسيلة للتحقيق بسرعة في الأهمية البيولوجية لبيانات التعبير المعقد بطريقة غير منحازة.


الاتجاهات المستقبلية

تتغير ممارسة دراسة الاضطرابات الوراثية من استقصاء الجينات المنفردة بمعزل عن اكتشاف الشبكات الخلوية للجينات ، وفهم تفاعلاتها المعقدة ، وتحديد دورها في المرض. 19 نتيجة لذلك ، سيظهر عصر جديد تمامًا من الطب المصمم بشكل فردي. Bioinformatics will guide and help molecular biologists and clinical researchers to capitalise on the advantages brought by computational biology. 20 The clinical research teams that will be most successful in the coming decades will be those that can switch effortlessly between the laboratory bench, clinical practice, and the use of these sophisticated computational tools.


شاهد الفيديو: What Did NASA Photograph On Jupiter? Real Pictures (سبتمبر 2022).