معلومة

ما هو تحليل الجينوم على نطاق واسع وتحليل محدد الموقع

ما هو تحليل الجينوم على نطاق واسع وتحليل محدد الموقع


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أقرأ بعض المقالات حول الاختلافات الجينية وأرى أن هناك نوعين من التحليل أحدهما هو تحليل التباين الجيني الواسع للجينوم والثاني هو تحليل التباين الجيني الخاص بالموقع. لا أفهم ما يعنيه هذان التحليلان الواسع للجينوم والموقع المحدد وما هو الفرق بين هذين التحليلين أو لماذا نحتاج إلى كلا النوعين من التحليل؟


مرحبا بكم في علم الأحياء.

الموضع (plur. loci) هو منطقة ذات حجم عشوائي على كروموسوم. يمكن أن يكون الموضع نيوكليوتيد واحد أو يمكن أن يكون أكبر بكثير (مثل مواقع $ 10 ^ 7 $).

لذلك فإن التحليل على مستوى الجينوم هو تحليل يستخدم الجينوم بأكمله مرة واحدة بينما التحليل الخاص بالموقع هو نفس التحليل الذي يتم إجراؤه على مستوى المواقع الفردية.

لإجراء تشبيه ، إذا كان التحليل على مستوى الجينوم يشبه التحليل على مستوى الدولة ، فإن التحليل الخاص بالموقع يشبه التحليل الخاص بالمدينة.

بدون المزيد من السياق ، لن يكون من الممكن قول أكثر من ذلك!


تحليل المسار البيولوجي

Ramakanth Chirravuri Venkata ، Dario Ghersi ، في موسوعة المعلوماتية الحيوية والبيولوجيا الحاسوبية ، 2019

تحليل المسار في دراسات الارتباط على مستوى الجينوم

تستخدم دراسات الارتباط الواسع للجينوم (GWAS) نماذج إحصائية للتحقيق في الارتباط بين المتغيرات (أشكال النوكليوتيدات المفردة) والأنماط الظاهرية. على الرغم من الجدل حول الأهمية الإحصائية مقابل الأهمية البيولوجية في المجتمع العلمي ، فقد كانت GWAS مصدرًا مهمًا لتوليد فرضيات جديدة في مجال علم الوراثة. تميل GWAS إلى أن تكون مناسبة للكشف عن المتغيرات الشائعة المرتبطة بأنماط ظاهرية معينة (Teslovich وآخرون. ، 2010 فيشر وآخرون. ، 2012). ومع ذلك ، في حالة الأمراض المعقدة التي تربط المتغيرات الفردية بنمط ظاهري معين يمكن أن يكون تحديًا بسبب أحجام تأثيرها الصغيرة. هناك مشكلة كبيرة أخرى مع GWAS وهي أنها تستخدم عتبات قيمة p صارمة يتم تصحيحها لاختبار فرضيات متعددة ، من أجل التحكم في الإيجابيات الخاطئة. قد تتخلص هذه العتبة أحيانًا من الجينات المعتدلة الأهمية التي قد تمثل مرشحين مقبولين بيولوجيًا لرابطات النمط الوراثي (Jia). وآخرون., 2011 ).

قد يخفف تحليل المسار هذه المشكلات إلى حد كبير من خلال دراسة التأثيرات المجمعة للمتغيرات الفردية ذات الصلة ، وأيضًا عن طريق المساعدة في تحديد المتغيرات الجديدة ذات الصلة المرتبطة بالأنماط الظاهرية. يفحص تحليل المسار الارتباط بالنمط الظاهري ذي الأهمية باستخدام مجموعات الجينات بدلاً من الجينات الفردية (Kao وآخرون. ، 2016 تشونغ وآخرون، 2010). يتكون تحليل مسار دراسات GWAS عمومًا من ثلاث خطوات: (1) تحديد مجموعات الجينات المناسبة لتحليل المسار (على سبيل المثال ، علم الوجود الجيني (Ashburner وآخرون. ، 2000) أو KEGG (Ogata وآخرون. ، 1999)) (2) تعيين المتغيرات للجينات الخاصة بكل منها و (3) استخدام النماذج الإحصائية لفحص الجمعيات.


الأساس الجزيئي للقصور الوريدي

جيرت دبليو شميد-شونبين ، في كتاب الوريد ، 2007

الآليات الجينية

كشف تحليل الارتباط الجيني أن هناك مرضى يعانون من عوامل الخطر العائلية. تم العثور على عدم توازن بين الكولاجين 1 والكولاجين 3 في الأجزاء القريبة من الدوالي الصافنة البشرية بالإضافة إلى تفتت ألياف الإيلاستين. 144 نسبة الكولاجين من النوع الثالث انخفضت بشكل ملحوظ في خلايا العضلات الملساء المزروعة والأرومات الليفية الجلدية المشتقة من مرضى الدوالي التي تشير إلى وجود نقص في الكولاجين من النوع الثالث. 145 تم اقتراح هذا النوع من إعادة تشكيل المصفوفة خارج الخلية بسبب تنشيط البروتينات المعدنية للمصفوفة (MMPs). تم اقتراح التعبير عن MMP-1 و MMP-2 و MMP-9 ومثبط الأنسجة للبروتينات المعدنية -1 146،147 مع وجود اختلال محتمل بين هذه الإنزيمات ومثبطاتها.


فى الموقع زيادة التحكم في كل عينة

البيانات عالية الجودة مضمونة حتى في الكائنات غير التقليدية

ارتباط نسبة الميثيل

ترتبط مستويات المثيلة المرصودة لعنصر تحكم سريع مكون من 6 أمبليونات اصطناعية فريدة مزدوجة الشريطة ذات مستويات مثيلة DNA محددة تتراوح من 0 إلى 100٪ ارتباطًا وثيقًا بمستوى المثيلة المتوقع باستخدام WGBS التقليدي. يضمن تحليل التحكم في الارتفاع باستخدام خدمة المعلومات الحيوية الخاصة بنا إنتاج بيانات عالية الجودة في كل عينة على حدة.

كفاءة تحويل بيسلفيت

تُظهر كفاءة تحويل بيسلفيت من مختلف الأنواع المحسوبة باستخدام كل من سياق غير CpG من gDNA والتحكم في الارتفاع في الموقع أن التحكم في الارتفاع هو قياس أفضل لكفاءة تحويل بيسلفيت عند العمل مع الكائنات غير التقليدية التي تحتوي على مثيلة في غير سياق CpG


المواد والأساليب

السلالات والجينوم

تم تضمين سلالة K-10 (Li et al. ، 2005 ، 2019) ، Telford (Brauning et al. ، 2019) و S397 (Bannantine et al. ، 2012) في هذه الدراسة كمراجع للسلالات الرئيسية التي ظهرت خلال تطور خريطة. تم نشر العزلات على منحدرات Middlebrook 7H11 المعدلة مع 20٪ (حجم / حجم) مصل عجول حديث الولادة معطل بالحرارة ، 2.5٪ (حجم / حجم) جلسرين ، 2 ملي مول أسباراجين ، 10٪ (حجم / مجلد) ميدلبروك حمض الأوليك- ألبومين- وسيط إثراء ديكستروز كاتلاز (OADC) (بكتون ديكنسون ، أكسفورد ، أوكسفوردشاير ، المملكة المتحدة) ، سيليكتاتابس (كود MS 24 MAST Laboratories Ltd. ، Merseyside ، المملكة المتحدة) ، و 2 & # x03BCg ml-1 mycobactin J (Allied Monitor ، فاييت ، ميزوري ، الولايات المتحدة). تم تنزيل تسلسل الجينوم الكامل لـ K-10 (النوع C ، NC_002944.2) ، Telford (النوع الفرعي من النوع S I ، NZ_CP033688.1) و S397 (النوع الفرعي من النوع S III ، NZ_CP053749.1) من NCBI RefSeq ( O & # x2019Leary وآخرون ، 2016 الجدول 1). تم شرح S397 باستخدام PGAP (Tatusova et al. ، 2016).

الجدول 1. تفاصيل السلالات والجينومات المستخدمة ومعلومات عن عدد نسخ IS900.

في المختبر يكون900-RFLP

المتفطرة الطيرية subsp. نظير السل سلالات تم كتابتها بواسطة BstEII IS900-RFLP كما هو موضح سابقًا (Thibault et al. ، 2007). تم تعيين ملفات التعريف وفقًا للتسميات الموصوفة سابقًا (Collins et al. ، 1997 Pavlik et al. ، 1999 Mobius et al. ، 2009). تم تحليل الملفات الشخصية باستخدام الإصدار 7.6.3 من برنامج Bionumerics TM (Applied Maths ، بلجيكا).

تحليل المعلومات الحيوية

يكون900 تحديد التسلسل و في السيليكو يكون900 سير عمل RFLP

قمنا بتطوير ملف في السيليكو خط أنابيب تحليل ل IS900 التنميط RFLP باستخدام تسلسل الجينوم الكامل كمدخل (الشكل 1). كخطوة أولى ، كل شيء Bstتم تحديد مواقع تقييد EII في الجينوم باستخدام برنامج نصي داخلي (متاح على: https://forgemia.inra.fr/public-pgba/is900-rflp-in-silico) تم تطويره باستخدام Biopython (v1.76) (Cock et آل ، 2009). يكون900 تم تحديد النسخ في تسلسل الجينوم باستخدام نسخة الانفجار 2.9.0 (Altschul et al. ، 1990) للبحث عن IS900 تسلسل تم استرداده من قاعدة بيانات NCBI (رقم الانضمام X16293) بهوية في المئة 99٪ و ه- قيمة 1e-100 لاستبعاد جميع النتائج الإيجابية الخاطئة. لكل نتيجة ، تسلسل المنبع والمصب الأقرب إلى Bstتم استرداد مواقع تقييد EII من Bstخريطة تقييد EII وطول ملف Bstتم حساب جزء EII. تم تحديد معادلة ترحيل الهلام مسبقًا باستخدام GelAnalyzer 19.1 1 واستخدامها لتحويل طول الجزء إلى مسافة ترحيل لمزيد من التصور لملف تعريف RFLP. بيانات الهجرة وإحداثيات IS900 تم حفظ نسخ في ملفات .tsv و .rflp ، على التوالي ، لتصور ملف التعريف والمزيد من التحقيق في توزيع الموقع. تم إجراء تصور لملفات RFLP باستخدام مكتبة python matplotlib (v3.3.0) 2.

شكل 1. خط أنابيب تحليل المعلومات الحيوية. تفاصيل الخطوات التي يقوم بها IS900 RFLP في السيليكو خط انابيب. من تسلسل الجينوم الكامل ، Bstموقع تقييد EII و IS900 تم تحديد مواقع التسلسل. يتم دمج مجموعتي البيانات معًا لاستخراج ملف Bstأحجام أجزاء EII من تسلسل الجينوم. المناصب السابقة هي900 ويتم تخزين اتجاه التسلسل في ملف a.rflp لمزيد من التحليل. Bstيتم تحويل أحجام أجزاء EII إلى مسافة ترحيل بناءً على الحساب من ملف في المختبر ترحيل هلام (راجع القسم & # x201CMaterials and Methods & # x201D) وحفظها في ملف .tsv لمزيد من التصور لملف تعريف RFLP.

يكون900 تسلسل تعدد الأشكال

من أجل تأكيد IS900 تعدد الأشكال المتسلسل الموصوف سابقًا (Semret et al. ، 2006 Castellanos et al. ، 2009) ، IS900 تم استخراج نسخ من الجينومات الثلاثة ومواءمتها باستخدام Multalin (Corpet ، 1988) مع جدول مقارنة الرموز & # x201CDNA & # x201D. أقصر هو900 تم فحص النسخ الموجودة في المحاذاة يدويًا باستخدام إصدار برنامج Artemis 18.1.0 (Carver et al. ، 2008) لتأكيد نتائج الانفجار.

البنفسجي المحاذاة

تم تحديد المحاذاة التركيبية باستخدام Mauve (snapshot_2015-02-13 build 0) (Darling et al. ، 2004). من أجل تجنب المؤشرات الخاطئة للانعكاسات أو عمليات إعادة الترتيب الأخرى ، تم نقل هذه الجينومات أولاً لتبدأ في الحمض النووي قبل تحليل موف. باستخدام تسلسل الجينوم الكامل لكل سلالة ، أجرينا محاذاة جينوم 1 مقابل 1 باستخدام Mauve التدريجي (Darling et al. ، 2010) وأيضًا محاذاة تسلسل الجينوم الثلاثة من أجل تصور الاختلافات في التنظيم الجينومي.

تحليل تقويم العظام

لتحديد IS900 نُسخ تم إدخالها في مواقع الجينوم المتعامدة بين جينومات K-10 و Telford و S397 ، أجرينا عمليات بحث مذهلة باستخدام استعلامات ، 2000 نقطة أساس من المناطق الجينومية المنبع والمصب التي تحيط بكل IS900 ينسخ. تم محاذاة هذه المناطق المرافقة المتعامدة من جينوم واحد مع الجينومين الآخرين ومقارنتها لتحديد المواقع المتعامدة. لذلك ، تم تحليل نتائج الانفجار من أجل تحديد أفضل تطابق. تم تحديد أفضل تطابق بالمعايير التالية: (1) أ ه-قيمة 0 و (2) حد أدنى للتغطية 80٪. بالنسبة للعديد من المناطق المحيطة ، أسفر الانفجار عن نتيجة واحدة فقط. لكن بالنسبة لعدد قليل من الآخرين ، تم إرجاع أكثر من نتيجة واحدة. في الحالات التي تكون فيها تغطية أفضل نتيجة أقل من 80٪ ، بحثنا عن نتائج أخرى حول 4000 نقطة أساس من النتيجة الأولى لتحديد إعادة ترتيب الجينوم / الاختلافات ودمجها. أخيرًا ، تم اعتبار المواقع المتعامدة مرتبطة بداعش900 loci إذا وقع مركز الضربة بلاست ضمن منطقة 2000 نقطة أساس التي تحيط بـ IS900 عنصر في الجينوم المستهدف.

يكون900 تحليل إثراء علم الوجود الجيني للمواقع

يهدف هذا النهج إلى تحديد ما إذا كانت الجينات القريبة من مواقع الإدخال قد تم تخصيبها لأي وظيفة معينة. تسلسل البروتين في المنبع والمصب من IS900 تم استخراجه ، إذا كان متاحًا ، من التعليق التوضيحي لـ RefSeq. تم إجراء شرح وظيفي باستخدام eggNOG-mapper-2.0.1 (Huerta-Cepas et al. ، 2017) استنادًا إلى بيانات تقويم eggNOG (Huerta-Cepas et al. ، 2019). تم إجراء عمليات بحث التسلسل باستخدام DIAMOND الإصدار 2.0.5 (Buchfink et al. ، 2015).

تحديد مواقع الإدراج المرشح

من أجل تحديد الزخارف المستهدفة لموقع الإدراج في جينومات خريطة، 10 نقاط أساس من تسلسل المنبع والمصب لكل IS900 تم استخراجه. تم النظر في كل خيط من عنصر IS وتم عكس التتابعات المستخرجة إذا لزم الأمر. تم استبعاد تسلسلات الإدراج التي تحتوي على عمليات حذف أو ازدواجية من التحليل. تم استخدام Multalin (Corpet ، 1988) لمحاذاة تسلسل المنبع والمصب باستخدام جدول مقارنة الرموز & # x201CDNA & # x201D. تم إجراء محاذاة التسلسل الأولي مع & # x201Cgap عقوبة عند الفتح & # x201D مضبوطة على 1 و & # x201Cgap عند الامتداد & # x201D مضبوطة على 0. تم إجراء محاذاة تسلسل المصب باستخدام المعلمات الافتراضية. المنبع والمصب هو900 تم محاذاة المناطق المرافقة من كل جينوم إلى M. avium subsp. hominissuis (ماه) 104 جينوم باستخدام blastn من أجل العثور على مناطق تقويم العظام. تم الاحتفاظ بالمناطق المجاورة فقط. تم استخراج تسلسلات الهدف المفترضة ، التي تم تحديدها مسبقًا في الجينومات الثلاثة ، يدويًا من ماه 104 جينوم باستخدام إصدار برنامج Artemis 18.1.0 (Carver et al. ، 2008) بناءً على نتائج الانفجار. تم استخدام الإصدار 5.3.1 من MEME (Bailey and Elkan، 1994) لتحديد نموذج الموقع المستهدف المفترض.


مقدمة

البواسير هي الوسائد الوعائية الشرجية الطبيعية المليئة بالدم عند تقاطع المستقيم والشرج. من المفترض أن دورهم الرئيسي في البشر هو الحفاظ على سلس البول 1 ولكن تم اقتراح وظائف أخرى مثل الشعور بالامتلاء والضغط وإدراك محتويات الشرج نظرًا للتعصيب الحسي. أعراض (تترافق أحيانًا مع نزيف في المستقيم وحكة / تلوث) بسبب تدهور أو تدلي النسيج الضام الراسخ ، أو تمدد الضفيرة الباسورية أو تكوين جلطات دموية. غالبًا ما تتطلب الأشكال الشديدة من HEM علاجًا جراحيًا وإزالة البواسير المتضخمة و / أو المخثرة بشكل غير طبيعي. يزيد انتشار HEM مع تقدم العمر وتظهر أرقام مذهلة في جميع أنحاء العالم (تصل إلى 86 ٪ انتشار في بعض التقارير) ، 3 حيث تبقى نسبة كبيرة من الحالات لم يتم اكتشافه على أنه بدون أعراض أو خفيف بدرجة كافية ليتم معالجته ذاتيًا بالعلاج بدون وصفة طبية. يمثل HEM عبئًا طبيًا واجتماعيًا واقتصاديًا كبيرًا بتكلفة سنوية تقدر بـ 800 مليون دولار أمريكي في الولايات المتحدة الأمريكية وحدها ، ويرتبط ذلك أساسًا بالعدد الكبير من عمليات استئصال البواسير التي يتم إجراؤها كل عام.

تم اقتراح عدد من عوامل خطر HEM ، بما في ذلك وضع الإنسان المنتصب. قد يكون الختم الشرجي المحكم الذي توفره الضفيرة البواسير المفصّلة قد تطور أثناء التطور البشري المتزامن مع المشي الدائم على قدمين ، كما يتضح من مقارنة الأنسجة لدينا لأربعة ثدييات مختلفة (الإنسان ، الغوريلا ، البابون ، الماوس على الإنترنت الشكل التكميلي 1 ، المواد التكميلية عبر الإنترنت 1 ). عوامل الخطر الأخرى المقترحة هي نمط الحياة المستقرة ، والسمنة ، وانخفاض تناول الألياف الغذائية ، وقضاء الوقت الزائد في المرحاض ، والإجهاد أثناء التغوط ، ورفع الشد ، والإمساك ، والإسهال ، والخلل الوظيفي في قاع الحوض ، والحمل والولادة الطبيعية ، وقد تم الإبلاغ عن العديد منها بشكل مثير للجدل. يلخص النموذج الافتراضي الموضح في الشكل التكميلي 2 عبر الإنترنت المفاهيم المعاصرة المتعلقة بالفيزيولوجيا المرضية لتطور HEM .5 حتى اليوم ، يتم التحقيق بشكل سيئ في التسبب في مسببات HEM ، ولا تُعرف الآليات الجزيئية الدقيقة ولا السبب (الأسباب) التي تجعل بعض الأشخاص فقط يطورون HEM. . قد تلعب القابلية الجينية دورًا في تطوير HEM ، ولكن لم يتم إجراء دراسة ارتباط واسعة النطاق على نطاق الجينوم (GWAS) لـ HEM. لتقييم مساهمة التباين الجيني في البنية الجينية لـ HEM ، أجرينا تحليلًا تلويًا لـ GWAS في 218920 فردًا مصابًا و 725213 عنصر تحكم سكاني من أصل أوروبي.

مواد تكميلية


10.5: تحليل تركيز السمات الكمية (QTL)

  • بمساهمة تود نيكل وإيزابيل باريت نج
  • أساتذة (علم الأحياء) في جامعة ماونت رويال وجامعة كالجاري

معظم الصفات المظهرية شائعة الاستخدام في علم الوراثة التمهيدية هي صفات نوعية ، مما يعني أن النمط الظاهري موجود فقط في شكلين بديلين منفصلين (أو ربما أكثر) ، مثل الزهور الأرجوانية أو البيضاء ، أو العيون الحمراء أو البيضاء. لذلك يقال أن هذه الصفات النوعية تظهر الاختلاف المنفصل. من ناحية أخرى ، تظهر العديد من السمات المهمة والمثيرة للاهتمام الاختلاف المستمر تُظهر هذه مجموعة مستمرة من الأنماط الظاهرية التي يتم قياسها عادةً كميًا ، مثل الذكاء ، وكتلة الجسم ، وضغط الدم في الحيوانات (بما في ذلك البشر) ، والمحصول ، واستخدام المياه ، أو محتوى الفيتامينات في المحاصيل. غالبًا ما تكون السمات ذات التباين المستمر معقدة ، ولا تُظهر نسب الفصل المندلية البسيطة (على سبيل المثال 3: 1) التي لوحظت مع بعض الصفات النوعية. تتأثر أيضًا العديد من السمات المعقدة بشدة بالبيئة. ومع ذلك ، يمكن في كثير من الأحيان إثبات أن السمات المعقدة لها مكون قابل للتوريث ، وبالتالي يجب أن يتضمن جينًا واحدًا أو أكثر.

كيف يمكن للجينات الموروثة (في حالة ثنائية الصبغيات) كحد أقصى متغيرين ، أن تشرح النطاق الواسع للتباين المستمر الذي لوحظ للعديد من السمات؟ كان عدم وجود تفسير واضح على الفور لهذا السؤال أحد الاعتراضات المبكرة على تفسير مندل لآليات الوراثة. ومع ذلك ، بعد مزيد من الدراسة ، يتضح أنه كلما زاد عدد المواقع التي تساهم في السمة ، يمكن ملاحظة المزيد من فئات النمط الظاهري لتلك السمة (الشكل ( فهرس الصفحة <1> )).

إذا كان عدد فئات النمط الظاهري كبيرًا بدرجة كافية (كما هو الحال مع ثلاثة مواضع أو أكثر) ، فقد يتعذر تمييز الفئات الفردية عن بعضها البعض (خاصة عندما يتم تضمين التأثيرات البيئية) ، ويظهر النمط الظاهري كتغير مستمر (الشكل ( PageIndex < 2> )). وبالتالي ، تسمى السمات الكمية أحيانًا الصفات متعددة الجينات، لأنه من المفترض أن يتم التحكم في أنماطها الظاهرية من خلال النشاط المشترك للعديد من الجينات. لاحظ أن هذا لا يعني أن كل من الجينات الفردية لها تأثير متساوٍ على سمة متعددة الجينات - وقد يكون لبعضها تأثير كبير ، بينما البعض الآخر ضئيل فقط. علاوة على ذلك ، قد يؤثر أي جين منفرد على أكثر من سمة واحدة ، سواء كانت هذه الصفات صفات كمية أو نوعية.

الشكل ( PageIndex <2> ): كلما زاد عدد المواقع التي تؤثر على سمة ، زاد عدد فئات النمط الظاهري التي يمكن توقعها. بالنسبة لبعض السمات ، يكون عدد المواقع المساهمة كبيرًا جدًا بحيث تمتزج فئات النمط الظاهري معًا في تباين مستمر ظاهريًا. (الأصل- Deyholos-CC: AN)

يمكننا استخدام الواسمات الجزيئية لتحديد على الأقل بعض الجينات (تلك التي لها تأثير كبير) التي تؤثر على سمة كمية معينة. هذا في الأساس امتداد لتقنيات رسم الخرائط التي درسناها بالفعل للسمات المنفصلة. ستبدأ تجربة رسم خرائط QTL بشكل مثالي بخطين تربية نقية يختلفان اختلافًا كبيرًا عن بعضهما البعض فيما يتعلق بواحدة أو أكثر من السمات الكمية (الشكل ( فهرس الصفحة <3> )). يجب تربية الوالدين وجميع ذريتهم تحت نفس الظروف البيئية قدر الإمكان ، للتأكد من أن الاختلاف الملحوظ يرجع إلى عوامل بيئية وراثية وليست خارجية. يجب أيضًا أن تكون هذه الخطوط الأبوية متعددة الأشكال لعدد كبير من المواقع الجزيئية ، مما يعني أنه يجب أن يكون لها أليلات مختلفة عن بعضها البعض في مئات المواقع. يتم تجاوز الخطوط الأبوية ، ثم هذا الحرف F.1 الفرد ، الذي حدث فيه إعادة التركيب بين الكروموسومات الأبوية يكون مخصبًا ذاتيًا (أو متصالبًا خلفيًا). بسبب إعادة التركيب (كلا من العبور والتشكيلة المستقلة) ، فإن كل من F2 سيحتوي الأفراد على مجموعة مختلفة من الواسمات الجزيئية ، وأيضًا مجموعة مختلفة من الأليلات للجينات التي تتحكم في السمة الكمية ذات الأهمية (الجدول ( فهرس الصفحة <1> )).

الشكل ( PageIndex <3> ): إستراتيجية لتجربة نموذجية لرسم خرائط QTL. يتم عبور والدين يختلفان في سمة كمية (مثل كتلة الفاكهة) ، ويتم تقاطع F1 مخصب ذاتيًا (كما هو موضح بالرمز المتقاطع في الدائرة). يقع طراز F2 سيُظهر النسل مجموعة من القيم الكمية للسمة. تتمثل المهمة بعد ذلك في تحديد أليلات العلامات من أحد الوالدين والتي ترتبط ارتباطًا وثيقًا بالسمة الكمية. على سبيل المثال ، علامات من والد كبير الفاكهة موجودة دائمًا في فاكهة كبيرة الحجم2 من المحتمل أن يكون الأفراد (ولكن ليس لدى أفراد الفاكهة الصغيرة) مرتبطين بالمواقع التي تتحكم في كتلة الفاكهة.

الجدول ( فهرس الصفحة <1> ) الأنماط الجينية والبيانات الكمية لبعض الأفراد من التقاطعات الموضحة في الشكل ( فهرس الصفحة <8> )

الشكل ( PageIndex <4> ): قطع من كتلة الفاكهة والنمط الجيني للمواقع المحددة من الجدول ( فهرس الصفحة <1> ). بالنسبة لمعظم المواقع (على سبيل المثال H) ، لا يظهر النمط الجيني أي ارتباط كبير مع وزن الفاكهة. ومع ذلك ، بالنسبة لبعض الواسمات الجزيئية ، سيكون التركيب الوراثي مرتبطًا بشكل كبير بوزن الفاكهة. يؤثر كل من D و K على وزن الفاكهة ، لكن تأثير التركيب الوراثي في ​​الموضع D أكبر منه في الموضع K. (Original-Deyholos-CC: AN)

صعود CRISPR السريع يهز الفحص على مستوى الجينوم

تقنية مدمرة حقًا ، فحص CRISPR يزيح أسلافها تقريبًا ثم ينقح نفسه ، كما يتضح من تطبيقات الجينوميات الوظيفية وقدرتها على تكملة النسخ أحادية الخلية

باستخدام مقياس الجينوم ، وفقدان الوظيفة شاشة CRISPR ، حدد علماء من جامعة نيويورك ، ومركز نيويورك للجينوم ، وكلية Icahn للطب في Mount Sinai الجينات البشرية وشبكات تنظيم الجينات المطلوبة من قبل SARS-CoV- 2. أظهر العلماء أيضًا أن قمع هذه الجينات والشبكات يمنح مقاومة للعدوى الفيروسية. على سبيل المثال ، يؤدي فقدان RAB7A إلى عزل مستقبلات ACE2 داخل الخلايا بشكل فعال ، مما يمنعه من العمل كنقطة دخول للفيروس. [فينس ديتمير / مدينة نيويورك]

تصدرت تقنية كريسبر عناوين الصحف بسبب قدرتها على اعتبارها شكلاً من أشكال العلاج الجيني. لكن CRISPR تستحق الاهتمام أيضًا بسبب مساهماتها في الفحص على مستوى الجينوم. على الرغم من أن هذه المساهمات عادة ما تفلت من الملاحظة العامة ، إلا أنها ليست أقل من ثورية.

بعد وقت قصير من طرح تقنية تحرير الجينات بتقنية CRISPR في العالم في عام 2012 ، بدأ الباحثون بقيادة Feng Zhang ، الحاصل على درجة الدكتوراه ، وعضو المعهد الأساسي في معهد برود في معهد ماساتشوستس للتكنولوجيا وجامعة هارفارد ، بالعمل على بناء شاشة فقدان الوظيفة على نطاق الجينوم والتي تعتمد على نوكلياز CRISPR-Cas9 بدلاً من الحمض النووي الريبي الصغير المتداخل (سيرنا). 1 ثم بدأ فحص CRISPR سريعًا في الحصول على تحسينات مختلفة. (للحصول على التفاصيل ، راجع الشريط الجانبي أدناه ، "إنشاء أساسيات فحص CRISPR.")

حتى الآن ، أصبح فحص كريسبر تقنية مألوفة. لكنها تستمر في أن تصبح أكثر قوة وتعقيدًا. في هذه المقالة ، سنرى كيف يمكّن فحص CRISPR من إحراز تقدم في تطوير الأدوية ، وعلم الجينوم البشري الوظيفي ، والعلوم الأساسية. أيضًا ، سننظر في تطورات السماء الزرقاء التي ستسمح بفحص CRISPR لفعل المزيد.

توصيف العناصر المشفرة وغير المشفرة

يقول الدكتور نيفيل سانجانا ، الذي عمل مع مختبر Zhang على شاشات CRISPR المبكرة ، إن مجموعته في مركز الجينوم في نيويورك (NYGC) وجامعة نيويورك (NYU) تعمل الآن على تطوير تقنيات تحرير الجينات لتطبيقات الجينوم الوظيفي ، بهدف طموح لفهم وظيفة جميع عناصر الجينوم البشري - المشفرة وغير المشفرة.

يعمل مختبر سانجانا على تطوير شاشات تقوم بأكثر من مجرد جينات مستهدفة. يقول سانجانا: "[كنا] نبحث في المناطق غير المشفرة مثل مواقع ارتباط عامل النسخ [أو] الحمض النووي الريبي غير المشفر ، أو [في] المناطق العميقة في الفضاء بين الجينات والمرتبطة بأمراض شائعة أو نادرة". "[بعض هذا العمل] أدى إلى ترجمة سريرية مذهلة."

كان المثال الرئيسي لهذه الترجمة السريرية هو شاشة CRISPR غير المشفرة التي حددت منطقة من الجينوم تشارك في قمع الهيموجلوبين الجنيني. أظهرت الشاشة أنه عندما تكون تلك المنطقة غير المشفرة مضطربة ، يمكن إلغاء ضغط الهيموجلوبين الجنيني. أدت هذه النتيجة إلى هدف علاجي جديد لمرض الخلايا المنجلية (SCD) والثلاسيميا بيتا ، وهما مرضان يصيبان الهيموجلوبين عند البالغين. 2

تشير سانجانا إلى أن "الدليل الدقيق للحمض النووي الريبي من شاشة كريسبر لدينا هو ما يتم استخدامه في الواقع لأول علاج كريسبر في الإنسان". يستخدم هذا العلاج المذهل التحرير الجيني CRISPR-Cas9 لقمع BCL11A على وجه التحديد في خلايا الدم الجذعية ، مما يؤدي إلى إعادة تنشيط جين الهيموجلوبين الجنيني. ثم تم استخدام الخلايا المهندسة بنجاح في علاج مريضين - أحدهما مصاب بداء الكريّات المنجلية (فيكتوريا جراي) والآخر مصاب بالثلاسيميا بيتا. (قاد العمل محققون من CRISPR Therapeutics و Vertex Pharmaceuticals.)

يتمثل التحدي الرئيسي في علاجات تحرير الجينات في إجراء التعديلات في أنواع الخلايا الصحيحة. في هذه الحالة ، فإن خصوصية نوع الخلية هي نتاج تحرير الجينوم غير المشفر ، لأن هذه المنطقة المعينة غير المشفرة تعمل فقط في خلايا الدم ، وفقًا لسانجانا. 3

تحديد العوامل المضيفة لعدوى SARS-CoV-2

في الآونة الأخيرة ، عالج سانجانا وزملاؤه COVID-19 من خلال نشر شاشة CRISPR لإخراج كل جين في الجينوم البشري في خلايا الرئة للعثور على الجينات والمسارات اللازمة لعدوى SARS-CoV-2. توضح سانجانا أن الهدف كان العثور على نقاط هجوم متعددة لمنع فيروس SARS-CoV-2.

كان هذا النهج مستوحى من التطوير الناجح لمضادات الفيروسات القهقرية لفيروس نقص المناعة البشرية التي تمنع طفرات الهروب الفيروسي. تحدث هذه الطفرات بخلاف ذلك عندما يتم تحدي الفيروس بعقار واحد مضاد للفيروسات. بالنسبة لبعض الجينات المرشحة الرئيسية المشاركة في الدخول الفيروسي ، فإن البحث عن الأدوية الموجودة التي تثبط المنتجات البروتينية لهذه الجينات جاء فارغًا.

تتذكر سانجانا "فكرنا ، دعونا نرى ما إذا كان هناك آلية مشتركة أخرى أو مسار متقارب يمكننا استهدافه". لإجراء هذا العمل ، اختارت Sanjana وزملاؤها أداة فحص CRISPR جديدة أخرى. تسمى الأداة "الفهرسة المحسّنة المتوافقة مع CRISPR للنصوص والحلقات مع التسلسل" أو ECCITE-seq. يستغرق فحص CRISPR إلى مستوى الخلية المفردة أثناء اكتشاف البروتينات والنصوص على التوازي.

وأشار هذا التحليل إلى مسار التخليق الحيوي للكوليسترول وزيادة الكوليسترول داخل الخلايا كعائق محتمل للعدوى الفيروسية. فتح هذا الاكتشاف الرئيسي ثروة من أدوية أمراض القلب لإعادة توظيفها. بمساعدة أعضاء الفريق الآخرين ، ركزت سانجانا على عقار أملوبيدين مانع قنوات الكالسيوم ، وهو دواء معتمد من إدارة الغذاء والدواء ، ووجد أن له تأثيرًا مثبطًا قويًا على الفيروس.

تسويق فحص كريسبر

تستفيد الشركات المتخصصة في فحص كريسبر لاكتشاف الأدوية وتطويرها من إمكانات تحليل الخلية الواحدة. على سبيل المثال ، يعد تحليل CRISPR أحادي الخلية خدمة رئيسية لشركة Cellecta ، والتي توفر مكتبات lentiviral مجمعة مع أشرطة تعبير RNA (gRNA) المرشد بها ، لتمكين التحليلات المعروفة باسم Perturb-seq و CROP-seq (تسلسل قطرات CRISPR).

طورت Cellecta تقنية تجمع بين الفحص الجيني المجمع وتحليل التعبير أحادي الخلية. باستخدام هذه التقنية ، يتم تمييز الخلايا الفردية بأكواد شريطية فريدة بحيث يمكن تحديد المجموعات السكانية الفرعية من الخلايا ذات الأنماط الظاهرية المتميزة. نظرًا لأن الرموز الشريطية مصممة للتعبير عن نسخ RNA في الخلايا ، فمن الممكن تقييم كيفية استجابة الخلايا المتغيرة للظروف التجريبية. يمكن أن يتم الكشف عن الرمز الشريطي RNA المعبر عنه بأساليب مختلفة لتنميط التعبير.

في هذه التحليلات ، يتم تطبيق الاضطرابات الوراثية (الضربات الجينية أو الضربات القاضية) ، ويتم دراسة الأنماط الظاهرية الناتجة على مستوى الترنسكربيتوم لاستنتاج الوظيفة الجينية. يسمح الترميز الشريطي لـ gRNAs بالتخلص من الاضطرابات المجمعة وربطها بأنماط ظاهرية محددة.

يقول دوناتو تيديسكو ، دكتوراه ، مدير البحث والتطوير في سيليكتا: "الاستخدام النموذجي هو تجربة في مجموعة خلايا غير متجانسة". "إذا كنت تريد تحديد مجموعة فرعية من الخلايا ضمن عموم السكان التي لها استجابات مختلفة للضربات القاضية ، فإن الطريقة الوحيدة للقيام بذلك هي تحليل الخلية الواحدة."

ويشير إلى أن عملاء Cellecta غالبًا ما يستخدمون شاشات CRISPR بحثًا عن الضربات القاضية التي إما تتعارض مع عقار تجريبي أو تتآزر معه ، في تجارب تهدف إلى توضيح آلية عمل الدواء.

هناك شركة أخرى تقدم خدمات فحص CRISPR وهي Synthego ، والتي تعمل مع شركات الأدوية والتكنولوجيا الحيوية. بالنسبة لروبرت دينز ، دكتوراه ، كبير المسؤولين العلميين في Synthego ، فإن ركوب اتجاه تحليل الخلية الواحدة في فحص CRISPR يعود إلى الأتمتة والروبوتات - والكثير منها.

تقوم Synthego بتطبيق التعلم الآلي والأتمتة للتعامل مع إخراج البيانات الهائل من هذه الأنواع من التجارب. هذا التحليل القوي يغذي عملية الفرز. يمكن للشركة تعزيز الكفاءة من خلال تعديل جوانب تصميم الدليل وتحسين مجمع البروتين النووي.

يقول دينز: "اسم اللعبة ، سواء في تحديد الهدف أو في التحرير لـ GMP ، هو الدقة". "أنت تقلل من تعقيد الشاشة. مع مزيد من الدقة والدقة ، يتم تبسيط استجوابك في المراحل النهائية ".

أفاد أنه في العام الماضي ، استخدمت الشركة طرقًا قوية للبيانات ومنصة تخليق ذات مراحل صلبة فعالة لمساعدة التعاون البحثي الذي تقوده جامعة كاليفورنيا ، سان فرانسيسكو ، لتسريع دراسة أهداف العلاج المحتملة لفيروسات كورونا. صنعت Synthego أكثر من 1000 gRNAs في يومين فقط ، واستخدمت gRNAs لهندسة الخلايا التي تضم أكثر من 300 ضربة قاضية لفحص تفاعلات بروتين المضيف والفيروس التاجي. كانت هناك حاجة إلى شخص واحد فقط للكتابة في الأتمتة وسير العمل.

توسع التعاون بمساعدة Synthego في دراسة سابقة ، واحدة حيث تم تحديد 332 تفاعل عالي الثقة من بروتين SARS-CoV-2 بين البروتين البشري لتحديد فرص إعادة توظيف الأدوية. 4 في الدراسة السابقة ، تم ذكر العديد من الأدوية ، بما في ذلك plitidepsin ، وهو دواء للسرطان يتم تسويقه بواسطة PharmaMar.

للتوسع في الدراسة السابقة ، سعى التعاون الذي شاركت فيه Synthego إلى تحديد أي تفاعلات بروتينية - بشرية لفيروس كورونا (ليس فقط تلك التي تتضمن SARS-CoV-2 ، ولكن فيروسات كورونا الأخرى) قد تكون أهدافًا جيدة للأدوية التي تهدف إلى منع تكاثر الفيروس. 5 اشتملت الجهود على توليفة من فحوصات العدوى بالفيروسات المختبرية ونمذجة السيليكو.

في بيان صحفي حول الدراسة الشاملة للفيروسات التاجية ، تضمن Synthego اقتباسًا منسوبًا إلى Nevan J. يؤثر CoV-2 على المسارات الخلوية ويسبب المرض في النهاية ، مما يعزز التحقق من صحة الأهداف العلاجية الواعدة التي قد توفر حماية واسعة ضد العدوى من فيروسات كورونا ".

أبلغت كل من دراسات SARS-CoV-2 والتفاعلية الشاملة للفيروسات التاجية دراسة لاحقة ركزت على plitidepsin. أشارت هذه الدراسة ، التي شملت كروغان من بين مؤلفيها المقابلين ، إلى أن العقار فعال ضد SARS-CoV-2 لأنه يستهدف البروتين المضيف eEF1A. 6 Plitidepsin هو الآن موضوع دراسة المرحلة الثالثة التي تم تعيينها لتسجيل المرضى الذين يحتاجون إلى دخول المستشفى لإدارة عدوى COVID-19 المعتدلة.

تحسين تحليل شاشات الاضطراب متعدد الوسائط

طور باحثو جامعة نيويورك ومدينة نيويورك نهجًا حسابيًا جديدًا لتحليل البيانات من فحص كريسبر. يمكن لهذا النهج ، الذي يسمى mixscape ، تحسين نسبة الإشارة إلى الضوضاء في الدراسات التي تجمع بين استخدام شاشة CRISPR المجمعة لإزعاج الجينات ، واستخدام تقنيات تسلسل الخلية المفردة متعددة الوسائط لتجميع mRNA وملامح البروتين السطحي. بشكل أساسي ، يحدد mixscape مصادر التباين المربكة ويزيلها.

وفقًا لدراسة حديثة ، طور الباحثون mixscape لمساعدتهم على فهم كيفية تغيير الخلايا السرطانية لتنظيم الجينات الرئيسية ، مثل الجين الذي يشفر جزيء نقطة التفتيش المناعي PD-L1 ، لتجنب اكتشاف الجهاز المناعي للجسم والتهرب منه. 7 قبل mixscape ، واجه الباحثون صعوبة في تفسير البيانات من شاشة ECCITE-seq متعددة الوسائط ، ويرجع ذلك أساسًا إلى أن مجموعة فرعية من الخلايا "هربت" من اضطراب gRNAs بالشاشة ، مما أدى إلى حدوث الكثير من الضوضاء في البيانات.

تقول المؤلفة الرئيسية للدراسة ، Efthymia Papalexi ، إن فكرة mixscape مستعارة من مجال التعرف على الصور. يقوم Mixscape بنماذج كل اضطراب على شكل خليط من استجابات الخلية المختلفة. من خلال القيام بذلك ، يمكنه تحديد وإزالة الخلايا التي نجت من اضطراب CRISPR ، مما يسمح للباحثين بالتركيز على الإشارات البيولوجية الحقيقية.

“With this approach, we can knock out a gene, discover the molecular pathways it controls, and then associate these pathways to cellular behaviors,” Papalexi explains. For example, when applying this method in cancer cell lines, the researchers discovered that two genes frequently mutated in lung cancers—the gene for the kelch-like protein KEAP1, and the gene for the transcriptional activator NRF2—regulate the expression levels of PD-L1. This finding suggests that the genes are important in tumor development and progression.

Looking into the future of CRISPR screening

The horizon beyond these foundational CRISPR-Cas9 screening components and conditions is already being explored. The Broad Institute’s John Doench, PhD, is blazing a trail in the area of alternate Cas enzymes. The standard CRISPR-Cas9 system originates from الأبراج العقدية. But CRISPR systems are abundant in nature, and there are plenty of other Cas nucleases that can be exploited, says Doench, who is focusing on a protein called Cas12a from Acidaminococcus.

“It has a particularly useful property: if you want to express multiple gRNAs, you can do so from just one small transcript,” Doench points out. “Because of that, the Cas12a enzyme is particularly useful for studying combinations.”

Combinations are key to exploring synthetic lethality, where a combination of genes contribute to cell death, rather than one alone. In cancer drug discovery, synthetic lethality can link two or more genes that, individually, might not be effective targets, but when combined are lethal to cancer cells. BRCA1 و PARP are the most famous synthetic lethal pair. Doench asserts that with Cas12a, it’s now possible to screen for synthetic lethal pairs to potentially identify new cancer targets.

In addition, blue-sky variations on CRISPR screening are emerging to build upon or even replace current technologies. Those include techniques like CRISPR activation, where an enzymatically inactive Cas9 is tailored to activate gene expression, and base editor screening, where individual mutations or variants are targeted instead of genes. With that kind of fine-grained targeting, researchers could pin down the effect of a single amino acid change on a drug’s activity.

Tanaz Abid, a research associate at the Broad Institute of MIT and Harvard, readies cells for a large-scale lentiviral production run to generate a library of guide RNAs. Her work helps to maintain and enhance the Broad’s Genetic Perturbation Platform, which supports functional investigations of the mammalian genome that can reveal how genetic alterations lead to changes in phenotype.

Base editor screens could finally crack the so-called V-to-F (variants to function) challenge for the human genome, enabling a map of every possible variant of every human gene with a function. A database containing all variants with their functions could unlock the vast potential for personalized medicine.

Realizing all of these possibilities with CRISPR screening will require upgrades in other technologies. “We still need lots of good systems, and lots of good assays to read out,” Doench states. “[CRISPR screening] is one of the tools in the toolbox, but it’s by no means the only one.”

مراجع
1. Shalem O, Sanjana NE, Hartenian E, et al. Genome-scale CRISPR-Cas9 knockout screening in human cells. علم 2014 343(6166): 84–87. DOI: 10.1126/science.1247005.
2. Canver MC, Smith EC, Sher F, et al. BCL11A enhancer dissection by Cas9-mediated in situ saturating mutagenesis.طبيعة سجية 2015 527(7577): 192–197. DOI: 10.1038/nature15521.
3. Frangoul H, Altshuler D, Cappellini MD, et al. CRISPR-Cas9 Gene Editing for Sickle Cell Disease and β-Thalassemia.إنجل. جيه ميد. 2021 384(3): 252–260. DOI: 10.1056/NEJMoa2031054.
4. Gordon DE, Jang GM, Bouhaddou M, et al. A SARS-CoV-2 protein interaction map reveals targets for drug repurposing.طبيعة سجية 2020 583: 459–468. DOI: 10.1038/s41586-020-2286-9.
5. Gordon DE, Hiatt J, Bouhaddou M, et al. Comparative host-coronavirus protein interaction networks reveal pan-viral disease mechanisms.علم 2020 370(6521): eabe9403. DOI: 10.1126/science.abe9403.
6. White KM, Rosales R, Yildiz S, et al. Plitidepsin has potent preclinical efficacy against SARS-CoV-2 by targeting the host protein eEF1A.علم 2021 371: 926–931. DOI: 10.1126/science.abf4058.
7. Papalexi E, Mimitou EP, Butler AW, et al. Characterizing the molecular regulation of inhibitory immune checkpoints with multimodal single-cell screens.نات. جينيه. 2021 53(3): 322–331. DOI: 10.1038/s41588-021-00778-2.

Establishing the Basics of CRISPR Screening

Originally, CRISPR screening gained popularity as a way of avoiding some of the difficulties associated with small interfering RNA screening, such as off-target effects and incomplete protein depletion. In CRISPR screening, highly specific, permanent genetic modifications can be made that are effective at precluding the function of targeted genes.

The CRISPR-Cas9 nuclease characteristically engineers a double-strand break, which occurs at a specific target locus dictated by a single-guide RNA (sgRNA). The deployment of sgRNAs leads to frameshift mutations and, ultimately, loss-of-function mutations at targeted genes.

In many CRISPR screening experiments, lentiviral vectors are used to deliver plasmids encoding Cas9 and sgRNA, with different plasmids encoding different sgRNAs from a library of sgRNAs. Some libraries consist of sgRNAs that correspond to defined sets of targeted genes other libraries are more comprehensive.

Besides a choice of libraries, CRISPR screening presents a choice of formats: pooled or arrayed. In the pooled format, cells are transduced in bulk, and the entire sgRNA library is deployed. In the arrayed format, cells deposited in the wells of a multiwell plate are transduced individually, and individual sgRNAs are deployed.

The pooled format may be preferred when large libraries are deployed. However, care must be taken to ensure a low multiplicity of infection, or a low ratio of lentiviruses to cells, to minimize coinfection by multiple lentiviruses. Then, after transduced cells are selected, whether by viability-based positive or negative selection, next-generation sequencing is used to assess sgRNA representation, that is, whether DNA sequences encoding for different sgRNAs are depleted or enriched.

With a negative selection screen, that is, a traditional knockout screen, the point is to identify genes that are essential for survival or proliferation under certain conditions or selection pressures. If survival genes sustain a lethal mutation because they were targeted by an sgRNA, that sgRNA will not be represented in sequencing results, simply because cells with lethal mutations in sgRNA-targeted survival genes will have been unable to survive and reproduce. Typically, the degree to which an sgRNA has been “depleted” will be detected by comparing the sgRNA’s representation in a cell population spared the selection pressure, and that in a cell population subjected to the selection pressure.

With a positive selection screen, the point is to identify genes whose mutation or silencing gives cells a survival advantage over a selection pressure. For example, an sgRNA-targeted gene may be found to confer resistance to a cancer drug. In this case, the sgRNA will be represented, or “enriched,” among the cancer cells that survive drug treatment.


شكر وتقدير

We thank Dr. Peter Gregersen for generously sharing with us GWAS data from the NARAC study, providing us with meta-analysis results and comments on our findings and manuscript. AVA, CFA, and AS were supported in part by the grant 1UL1RR029893 from the National Center for Research Resources, National Institutes of Health. CFA was also supported in part by the grant R56 LM007948-04A1 from the National Library of Medicine, National Institute of Health. LP was supported by The Swedish Research Council and by The Swedish State agency VINNOVA.


أساليب

The resources of peanut AhRLKs

All RLK full-length amino acid sequences in Arabidopsis were downloaded from UniProt (https://www.uniprot.org/) and these sequences were used as queries to perform a BLASTP search against A. duranensis RLKs by NCBI (https://www.ncbi.nlm.nih.gov/). These resulting sequences were then used as new queries to conduct a BLASTP search again in PEANUT GENOME RESOURSE (http://peanutgr.fafu.edu.cn/), to avoid missing potential members. The redundant entries were removed manually. Then the resulting unique sequences were analysed with both SMART (http://smart.embl-heidelberg.de) [65] and NCBI’s Conserved Domains Database (CDD http://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi) to ensure the presence of the RLK domains in newly identified members. Only proteins containing at least one kinase domain were considered putative AhRLKs, and 1311 AhRLKs were finally obtained. The amino acid residue base, and molecular weight were predicted with ExPaSy ProtParam tool (https://web.expasy.org/protparam/). The genome sequence, protein sequences and genome annotation of the peanut were performed according to PEANUT GENOME RESOURSE (http://peanutgr.fafu.edu.cn/).

Multiple sequence alignments and phylogenetic tree construction of AhRLKس

The full-length amino acid sequences of LRR-AhRLKs, LecRLKs and 90 Al-responsive AhRLKs defined in the previous section were aligned using ClustalX in MEGA 7 with default parameters [66]. The phylogenetic tree based on the multiple sequence alignments of peanut LRR-RLKs (Fig. 1), LecRLKs (Fig. 2) and 90 AhRLKs in response to Al stress (Fig. 6) was generated by MEGA 7. A Poisson correction model was used to account for multiple substitutions, while alignment gaps were removed with partial deletion. The statistical strength was estimated by bootstrap resampling using 1000 replicates. Based on the multiple sequence alignment and the previously reported classification of نبات الأرابيدوبسيس thaliana, the peanut RLKs were assigned to different subfamilies and subgroups [24, 67].

Chromosomal locations and duplication analysis for peanut RLKس

The physical location of AhRLKs on the chromosomes was obtained from the PEANUT GENOME RESOURSE database (http://peanutgr.fafu.edu.cn/). All members of AhRLKs were mapped onto peanut chromosomes based on their physical positions, and chromosomal location images were produced with the online software Map Gene 2 Chromosome v2 (MG2C:http://mg2c.iask.in/mg2c_v2.0/). The chromosome location information of the peanut was extracted from GFF files that contain the information of peanut genome annotation. BLASTP was performed to search for potential homologous gene pairs (E-value < 1e −5 ) across genomes. Information on homologous pairs was used as input to identify syntenic chains by MCScanX [68]. In addition, MCScanX was also used to identify tandem and segmental duplications in the AhRLK gene family. RLKs clustered together within 100 kb were regarded as tandem duplicated genes based on the criteria of other plants. The diagram was generated by TBtools [69]. The nonsynonymous (Ka) and synonymous (Ks) substitution ratios were calculated by Simple Ka/Ks Caculator in TBtools. The divergence time was calculated with the formula T = Ks/2r, and the r of dicotyledonous plants was 1.5*10^-8 synonymous substitutions per site per year [70]. We used the Geneconv program with default parameters to search evidence for tandem duplication cluster gene conversion (http://www.math.wustl.edu/

sawyer/geneconv/) [71]. Since GENECONV required at least three sequences for detecting gene conversion events, tandem duplication clusters that contained at least 3 genes were detected. For this program, the clustalW (CDS) alignment was used as the input. Geneconv can detect candidate fragments of directed gene conversion between gene pairs (allowing mismatch). Gene conversion events were considered as statistically significant when ص & lt 0.05.


شاهد الفيديو: دور التحليل الجيني في الكشف عن الأمراض (شهر فبراير 2023).