معلومة

كيف يتم ربط انقسام الانقسام؟

كيف يتم ربط انقسام الانقسام؟



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

هل يشكلون رابطة الببتيد؟ أم أنه مجرد تفاعل تقارب / فان دير فالس؟

هل يتم تحفيز آلية الإنزيم؟

هل البقايا / الشقوق في موقع الوصلة معروفة؟ هل يمكن تعريفهم على شظايا الببتيد المركبة لتحقيق شيء مثل الربط الكيميائي الأصلي؟


تزيين البروتينات بتعديلات كيميائية باستخدام الانقسام الانقسام

مرة أخرى في علم الأحياء 101 ، تعلمنا أن بنية ووظيفة كل بروتين يتم تحديدهما بشكل أساسي من خلال تسلسل الأحماض الأمينية ، والذي يتم ترميزه بدوره بواسطة الشفرة الجينية العامة داخل الحمض النووي. التلاعب في تسلسل الحمض النووي ، ويمكننا جعل الخلية تولد أي بروتين نريده. حسنًا ، ليس تمامًا ، لأننا سنقتصر على 20 لبنة من الأحماض الأمينية التي يوفرها الكود الجيني. من ناحية أخرى ، يفضل الكيميائيون تصنيع الببتيدات والبروتينات من نقطة الصفر ، مما يسمح لهم بإدخال الأحماض الأمينية غير المتعارف عليها (ncAAs) مع الخصائص والوظائف المرغوبة. ومع ذلك ، لا يزال حجم ونوع البروتين الذي يمكننا تصنيعه بهذه الطريقة محدودًا.

في السنوات الأخيرة ، حاول العلماء بنجاح إعادة برمجة الشفرة الجينية ، مما أتاح إدخال موقع محدد لـ ncAAs الأكثر غرابة في البروتينات 1. ومع ذلك ، فإن عدد ونوع المخلفات التي يمكن تقديمها بكفاءة لا تزال غير محدودة ، وعدة مرات ، خلال مشاريع أخرى في المختبر ، انتهى بنا الأمر إلى مواجهة بعض هذه المشكلات 2،3. عند النظر في السبل شبه الاصطناعية لمعالجة البروتينات ، وجدنا أن الانقسام المنشط يوفر إمكانات لا حصر لها على ما يبدو لهندسة البروتين 4.

إن الانقسام inteins هي مجالات بروتينية تحدث بشكل طبيعي وتتصرف بشكل أساسي كموصلات لربط أجزاء بروتينية معينة معًا بطريقة لا يمكن تتبعها تقريبًا (الشكل 1) 4.

الشكل 1. ربط بروتينين باستخدام انقسام inteins.

اعتقدنا أنه ينبغي أن يكون من الممكن إعادة تكوين بروتين غشائي كامل الطول من ثلاث شظايا مميزة باستخدام اثنين من inteins متعامدة (Int-A و Int-B) - وهو نهج يُطلق عليه اسم (tandem trans splicing (tPTS. سيسمح لنا هذا باستبدال جزء كامل من البروتين بشكل فعال بببتيد اصطناعي ، من خلال ربطه تساهميًا مع بقية أجزاء بروتين الغشاء المعبر عنها في الخلية باستخدام inteins المنقسمة (الشكل 2). من الناحية النظرية ، هذا يعني أن أي شيء يمكن تصنيعه كيميائيًا في سياق الببتيد يمكن دمجه في البروتين.

الشكل 2. إدخال الببتيد الاصطناعي (الببتيد X) في رابط داخل الخلايا لبروتين غشائي.

لعرض بعض التطبيقات الممكنة ، استخدمنا نهجنا في أ) إدخال تعديلات على GFP لمعالجة خصائصه الملونة ، ب) إدراج تعديلات متعددة لما بعد الترجمة (PTMs) في روابط داخل الخلايا لقناة الصوديوم القلبية Nav1.5 و c) إدخال غير مشتقات ليسين - الكنسي في موقع ربط ATP خارج الخلية لمستقبلات P2X2 (الشكل 3) 5.

عملنا هو المثال الأول لإعادة تكوين البروتينات كاملة الطول بواسطة tPTS في الخلايا حقيقية النواة. النهج لديه القدرة على تقديم أي ncAAs ، PTMs ، مقابض كيميائية ، فلوروفورز ومزيج منها في موقع مختار في بروتين ، وبالتالي يمثل أداة جديدة في مجال هندسة البروتين. ومع ذلك ، من المهم أن تضع في اعتبارك أن عوائد tPTS التي شهدناها في تجاربنا كانت عادةً أقل من 5٪ ، وهي قيمة من المحتمل أن تكون منخفضة للغاية بالنسبة لبعض المقايسات. ومع ذلك ، فهو كافٍ لفحص البروتينات التي يمكن دراستها بطرق شديدة الحساسية ، مثل الفيزيولوجيا الكهربية أو التصوير.

الشكل 3. تم إدخال بعض محاكيات PTM و ncAAs بنجاح باستخدام tPTS.

على الرغم من أنها أداة قوية ، إلا أنه من الواضح أن هناك مجالًا لتحسين التقنية في المستقبل. سيؤدي استخدام inteins أكثر كفاءة واختلاطًا إلى زيادة كبيرة في عدد البروتينات ومواقع إدخال الببتيد القابلة لهذا النهج.

في الواقع ، مع معرفتنا بالبيولوجيا والكيمياء معًا ، وقليلًا من المساعدة من الانقسام الداخلي ، يبدو أنه من الممكن بناء وهندسة بعض البروتينات الجديدة حقًا في المستقبل.

1 تشين ، جيه دبليو توسيع وإعادة برمجة الشفرة الجينية. طبيعة سجية 550، 53-60 ، دوى: 10.1038 / nature24031 (2017).

2 Lynagh، T.، Mikhaleva، Y.، Colding، J.M، Glover، J.C & amp Pless، S. A. ظهرت القنوات الأيونية لاستشعار الحمض على أكثر من 600 ميا ويتم حفظها في جميع أنحاء deuterostomes. بروك. ناتل. أكاد. علوم. الولايات المتحدة الأمريكية. 115، 8430-8435 ، دوى: 10.1073 / pnas.1806614115 (2018).

3 بورغ ، سي. وآخرون. آلية وموقع عمل الدينورفين الكبير على ASIC1a. بروك. ناتل. أكاد. علوم. الولايات المتحدة الأمريكية. 117، 7447-7454، doi: 10.1073 / pnas.1919323117 (2020).

4 Thompson، R.E & amp Muir، T.W W.Chemoenzymatic semisynthesis of Proteins. تشيم. القس.، دوى: 10.1021 / acs.chemrev.9b00450 (2019).

5 خو ، ك. وآخرون. التعديل الكيميائي للبروتينات عن طريق إدخال الببتيدات الاصطناعية باستخدام البروتين الترادفي عبر الربط. نات. كومون. 11، 2284 ، دوى: 10.1038 / s41467-020-16208-6 (2020).


الملخص

تعد البروتينات المعدلة كيميائيًا أدوات لا تقدر بثمن لدراسة التفاصيل الجزيئية للعمليات البيولوجية ، كما أنها تتمتع بإمكانيات كبيرة كعوامل علاجية جديدة. تم تطوير العديد من الطرق لتعديل البروتينات الخاصة بالموقع ، وهي واحدة من أكثر الطرق استخدامًا وهي ربط البروتين المعبر (EPL) حيث يتم ربط α-thioester المؤتلف بببتيد يحتوي على N- محطة Cys. على الرغم من الاستخدام الواسع النطاق لـ EPL ، إلا أن توليد وعزل البروتين المؤتلف المطلوب α-thioesters لا يزال يمثل تحديًا. نصف هنا طريقة جديدة لإعداد وتنقية بروتين α-thioesters المؤتلف باستخدام إصدارات هندسية من inteins DnaE المنقسمة بشكل طبيعي. ترتبط هذه العائلة من إنزيمات المعالجة التلقائية ارتباطًا وثيقًا بالإنتينات المستخدمة حاليًا لتوليد بروتين α-thioester ، ولكنها تتميز بحركية أسرع وتنقسم إلى نوعين من عديد الببتيدات غير النشطة التي تحتاج إلى الارتباط لتصبح نشطة. من خلال الاستفادة من التقارب القوي بين شظايا intein المنقسمة ، ابتكرنا إجراءً مبسطًا لتنقية وتوليد بروتين α-thioesters من محللات الخلية وطبقنا هذه الإستراتيجية على نصف تخليق مجموعة متنوعة من البروتينات بما في ذلك هيستون الأسيتيل والموقع. - جسم مضاد أحادي النسيلة معدل بشكل خاص.


النتائج

تصميم SpCas9 بوساطة Intein

يمكن تفسير Inteins بسهولة كإنترونات بروتينية: فهي تخرج نفسها من تسلسل وتنضم إلى المناطق المرافقة المتبقية (exteins) برابطة الببتيد دون ترك ندبة (24). مناطق الترميز للوحدة التحفيزية لبوليميراز DNA III DnaE من البكتيريا الزرقاء Nostoc Punctiforme (Npu) في جينين ، الحمض النووي- n و الحمض النووي- ج. ال الحمض النووي- n يتكون البروتين المشفر من جزء N-terminal DnaE بالإضافة إلى N-intein ، بينما الحمض النووي- ج يشفر بروتينًا يتكون من جزء DnaE الطرفي C مسبوقًا بكيان C-Intein. يتعرف كل من N-intein و C-Intein على بعضهما البعض ، ويقومان بربط نفسيهما وربطهما في نفس الوقت الملحقين N- و C- النهايتين مما يؤدي إلى استعادة DnaE كامل الطول (24).

نحن نستخدم هذه الظاهرة التي تحدث بشكل طبيعي من خلال تبادل المناطق الخارجية مع النصفين المعنيين من SpCas9 (الشكل 1 أ). تم اختيار مواقع الانقسام في SpCas9 بعناية بين Glu573 و Cys574 للإصدار الأول (v1) أو بين Lys637 و Thr638 للإصدار الثاني (v2) ، نظرًا لأن الحمض الأميني N-terminal الخاص بـ C-Cas9 في C-Intein_C -يجب أن يكون اندماج Cas9 Cys أو Ser أو Thr لضمان كفاءة الربط العالية (7 ، 25) (الشكل 1 أ). علاوة على ذلك ، تم إيلاء اهتمام خاص بحيث تكون المواقع المنقسمة معرضة للسطح بسبب الحاجة المعقمة لربط البروتين (26).

استخدام الانقسام الانشائي لإعادة تشكيل كاس 9. (أ) عند إعادة تكوين الانقسام الداخلي ، تقوم شقوق الانقسام الداخلي بتقسيم نفسها وتربط نصفي N- و C-terminal SpCas9 (exteins) مما يؤدي إلى استعادة SpCas النشطة كاملة الطول. (ب) الإصدار 1 من Split-SpCas9: يتم دمج DnaE N-intein (برتقالي) مع الطرف C لـ SpCas9 1-573 (N-Cas9 ، أحمر) ، بينما يتم دمج DnaE C-intein (الأخضر) مع N-terminus لـ SpCas9 574-1368 (C-Cas9 ، أزرق). الإصدار 2 من Split-SpCas9: يتم دمج DnaE N-intein في الطرف C لـ SpCas9 1-637 ، بينما يتم دمج DnaE C-intein مع N- الطرف لـ SpCas9 638-1368. (ج) لقياس نشاط نوكلياز ، ولتمييز بين أحداث HDR و NHEJ ، تم استخدام نظام مراسل إشارات المرور. غالبًا ما تؤدي أحداث NHEJ التي قدمتها SpCas9 إلى إنشاء indels التي تؤدي إلى طفرات تغيير الإطارات ، مما يؤدي إلى التعبير عن TagRFP. ستؤدي أحداث HDR إلى إصلاح الزهرة المقتطعة من خلال نموذج الإصلاح المعطى (ذراع التماثل الأيسر للحمض النووي المتبرع: 0.4 كيلو بايت ، ذراع التماثل الأيمن: 1.4 كيلو بايت) وإزالة كودون التوقف في مركز كوكب الزهرة مما يؤدي إلى التعبير عن كوكب الزهرة كامل الطول. يتم الإشارة إلى المناطق المترجمة كخطوط تحت الحمض النووي التخطيطي مع موقع بدء الترجمة وإيقاف الكود. يُظهر المربع الداخلي تفاصيل التسلسل المستهدف الذي تم التعرف عليه بواسطة gRNAs crTLR # 1 و crTLR # 3. CAG: محفز الثدييات الاصطناعية CAG bGH: موقع هرمون النمو البقري متعدد الأدينيل.

استخدام الانقسام الانشائي لإعادة تشكيل كاس 9. (أ) عند إعادة تكوين الانقسام الداخلي ، تقوم شقوق الانقسام الداخلي بتقسيم نفسها وتربط نصفي N- و C-terminal SpCas9 (exteins) مما يؤدي إلى استعادة SpCas النشطة كاملة الطول. (ب) الإصدار 1 من Split-SpCas9: يتم دمج DnaE N-intein (برتقالي) في الطرف C لـ SpCas9 1-573 (N-Cas9 ، أحمر) ، بينما يتم دمج DnaE C-intein (الأخضر) مع N-terminus لـ SpCas9 574-1368 (C-Cas9 ، أزرق). الإصدار 2 من Split-SpCas9: يتم دمج DnaE N-intein في الطرف C لـ SpCas9 1-637 ، بينما يتم دمج DnaE C-intein مع N- الطرف لـ SpCas9 638-1368. (ج) لقياس نشاط نوكلياز ، ولتمييز بين أحداث HDR و NHEJ ، تم استخدام نظام مراسل إشارات المرور. غالبًا ما تؤدي أحداث NHEJ التي قدمتها SpCas9 إلى إنشاء indels التي تؤدي إلى طفرات تغيير الإطارات ، مما يؤدي إلى التعبير عن TagRFP. ستؤدي أحداث HDR إلى إصلاح الزهرة المقتطعة من خلال نموذج الإصلاح المعطى (ذراع التماثل الأيسر للحمض النووي المتبرع: 0.4 كيلو بايت ، ذراع التماثل الأيمن: 1.4 كيلو بايت) وإزالة كودون التوقف في مركز كوكب الزهرة مما يؤدي إلى التعبير عن كوكب الزهرة كامل الطول. يتم الإشارة إلى المناطق المترجمة كخطوط تحت الحمض النووي التخطيطي مع موقع بدء الترجمة وإيقاف الكود. يُظهر المربع الداخلي تفاصيل التسلسل المستهدف الذي تم التعرف عليه بواسطة gRNAs crTLR # 1 و crTLR # 3. CAG: محفز الثدييات الاصطناعية CAG bGH: موقع هرمون النمو البقري متعدد الأدينيل.

تم إنشاء أنظمة Split-intein-Cas9 عن طريق دمج نصفي طرفي N أو C من SpCas9 إلى نصفي intein المقابل: يستخدم الإصدار 1 SpCas9 1-573 و SpCas9 574-1368 كشقوق منفصلة - Cas9 ، مما أدى إلى تكوينين اندماج يسمى يستخدم N-Cas9_N-Intein_v1 و C-Intein_C-Cas9_v1 v2 SpCas9 1 - 637 و SpCas9 638 - 1368 كشقوق منفصلة - Cas9 ، مما أدى إلى بناءين اندماج يسمى N-Cas9_N-Intein_v2 و C-Intein_C-Cas9_v2 (الشكل 1 ب).

SpCas9 بوساطة Intein نشط مثل النوع البري SpCas9 في أنظمة المراسلات البديلة

لاختبار ما إذا كان تقسيم Cas9 المعاد تشكيله نشطًا ، استخدمنا خط خلية Neuro-2a يحمل نسخة واحدة من مراسل إشارات المرور البديلة (TLR). يمكّن هذا المراسل من التمييز بين مسارين رئيسيين للإصلاح بعد حدوث كسر مزدوج ، بوساطة آلية إصلاح الخلية. هذا هو (1) الربط النهائي غير المتماثل المعرض للخطأ (NHEJ) و (2) الإصلاح الموجه بالتماثل عالي الدقة (HDR) (الشكل 1 ج). يسبب NHEJ indels في منطقة المراسل التي ستضع TagRFP في إطار في ثلث إجمالي الأحداث ، مما يسمح بالتعبير عنها واكتشافها (التألق الأحمر) بينما ينتج HDR عن التعبير عن mVenus الذي تم إصلاحه (مضان أخضر) (الشكل 1 ج). بعد 48 ساعة من ترنسفكأيشن عابر مع كلا المتغيرين لنظام الانقسام الداخلي (N-Cas9_N-Intein و C-Intein_C-Cas9 لـ v1 و v2) و U6 المعبر عن gRNA (الشكل 2 أ) ، العدد الناتج من الخلايا الفلورية ، المقابلة إلى مجموع الأحداث من الانضمام إلى النهاية غير المتجانسة (NHEJ) والإصلاح الموجه للتماثل (HDR) ، يتطابق مع قيم النوع البري SpCas9 ، باستخدام SpCas9 و gRNA كامل الطول (الشكل 2 أ و ب). على النقيض من ذلك ، لم يتم اكتشاف أي إشارة مضان في عناصر التحكم السلبية التي تم فيها التعبير عن SpCas9 بدون جرنا (الشكل 2 ب) أو عندما تم التعبير عن نصفي intein واحد من SpCas9 وحده مع جرنا (الشكل 2 ب).

اختبار كفاءة Split-Cas9 في خطوط خلايا Neuro-2a TLR. (أ) نظرة عامة على بلازميدات التعبير WT و Split-Cas9 المستخدمة (Cas9 ، N-Cas9_N-Intein_v1 ، C-Intein_C-Cas9_v1 ، N-Cas9_N-Intein_v2 ، C-Intein_C-Cas9_v2 ، gRNA crTLR # 1 / # 2). لضمان التعبير العالي ، تم استخدام محفز قوي للثدييات الاصطناعية (CAG ، أخضر) وهرمون نمو بقري (bGH ، أحمر). يظهر Cas9 (كدنا) باللون البرتقالي ، و N-intein باللون البني الداكن و C-Intein باللون البني الفاتح. NLS (أحمر غامق): إشارة توطين نووية. يتم عرض علامتي FLAG و HA باللون الرمادي الفاتح والداكن على التوالي. لتعبير جرنا (فيروزي) ، تم اختيار مروج U6 (أخضر غامق). (ب) النتائج بعد FACS: ترنسفكأيشن فقط مع كل من الأجزاء الطرفية N و C من نظام Split-intein-Cas9 للإصدار 1 (v1) والإصدار 2 (v2) أدى إلى نشاط نوكلياز مشابه لـ SpCas9 من النوع البري ، ممثلة في HDR أو أحداث NHEJ تعداء مع جزء واحد فقط لم تظهر أي أحداث HDR أو NHEJ يمكن ملاحظتها. الموضح يعني ± SD لثلاث تجارب مستقلة. (ج) تم استخدام نظام Split-intein-Cas9 v1 لاستهداف ثاني آخر إكسون من الجين المندمج في ساركوما (Fus). تم تضخيم الجزء المعني من PCR باستخدام الاشعال المشروح لمزيد من التحليل. تم إجراء اختبار T7 endonuclease I بعد PCR على العينات للتحقيق في حدوث أحداث NHEJ. بعد الفحص ، تم تحليل العينات باستخدام محلل بيولوجي. يشير ظهور الفرقة الثانية إلى وجود indels الناتج عن أحداث NHEJ. (د) استهداف موضع Rosa26 باستخدام جرنا Rosa26 # 1. تم اكتشاف indels فقط عندما تم نقل شقوق SpCas9 من النوع البري أو كليهما. (ه) استهداف موضع Rosa26 باستخدام جرنا Rosa26 # 3. تم الكشف عن Indels عن طريق تحليل RFLP. لا يمكن ملاحظة المنتج المقاوم لـ XbaI إلا عندما تم نقل العدوى من النوع البري SpCas9 أو كليهما. (F) استهداف موضع Rab38 باستخدام جرنا Rab38 # 2. تم الكشف عن Indels عن طريق تحليل RFLP. لا يمكن ملاحظة المنتج المقاوم لـ XcmI إلا عند نقل العدوى من النوع البري SpCas9 أو كليهما. (جي) التحديد الكمي لنشاط نوكلياز في كل تسلسل مستهدف. FU: وحدات الفلورة ، ث: ثانية.

اختبار كفاءة Split-Cas9 في خطوط خلايا Neuro-2a TLR. (أ) نظرة عامة على بلازميدات التعبير WT و Split-Cas9 المستخدمة (Cas9 ، N-Cas9_N-Intein_v1 ، C-Intein_C-Cas9_v1 ، N-Cas9_N-Intein_v2 ، C-Intein_C-Cas9_v2 ، gRNA crTLR # 1 / # 2). لضمان التعبير العالي ، تم استخدام محفز قوي للثدييات الاصطناعية (CAG ، أخضر) وهرمون نمو بقري (bGH ، أحمر). يظهر Cas9 (كدنا) باللون البرتقالي ، و N-intein باللون البني الداكن و C-Intein باللون البني الفاتح. NLS (أحمر غامق): إشارة توطين نووية. يتم عرض علامتي FLAG و HA باللون الرمادي الفاتح والداكن على التوالي. لتعبير جرنا (فيروزي) ، تم اختيار مروج U6 (أخضر غامق). (ب) النتائج بعد FACS: ترنسفكأيشن فقط مع كل من الأجزاء الطرفية N و C من نظام Split-intein-Cas9 للإصدار 1 (v1) والإصدار 2 (v2) أدى إلى نشاط نوكلياز مشابه لـ SpCas9 من النوع البري ، ممثلة في HDR أو أحداث NHEJ تعداء مع جزء واحد فقط لم تظهر أي أحداث HDR أو NHEJ يمكن ملاحظتها. الموضح يعني ± SD لثلاث تجارب مستقلة. (ج) تم استخدام نظام Split-intein-Cas9 v1 لاستهداف ثاني آخر إكسون من الجين المندمج في ساركوما (Fus). تم تضخيم الجزء المعني من PCR باستخدام الاشعال المشروح لمزيد من التحليل. تم إجراء فحص نوكلياز T7 الأول بعد تفاعل البوليميراز المتسلسل (PCR) على العينات للتحقيق في حدوث أحداث NHEJ. بعد الفحص ، تم تحليل العينات باستخدام محلل بيولوجي. يشير ظهور الفرقة الثانية إلى وجود indels الناتج عن أحداث NHEJ. (د) استهداف موضع Rosa26 باستخدام جرنا Rosa26 # 1. تم اكتشاف indels فقط عندما تم نقل شقوق SpCas9 من النوع البري أو كليهما. (ه) استهداف موضع Rosa26 باستخدام جرنا Rosa26 # 3. تم الكشف عن Indels من خلال تحليل RFLP. لا يمكن ملاحظة المنتج المقاوم لـ XbaI إلا عندما تم نقل العدوى من النوع البري SpCas9 أو كليهما. (F) استهداف موضع Rab38 باستخدام جرنا Rab38 # 2. تم الكشف عن Indels من خلال تحليل RFLP. لا يمكن ملاحظة المنتج المقاوم لـ XcmI إلا عندما تم نقل العدوى من النوع البري SpCas9 أو كليهما. (جي) التحديد الكمي لنشاط نوكلياز في كل تسلسل مستهدف. FU: وحدات الفلورة ، ث: ثانية.

كفاءة استهداف الجينات الذاتية باستخدام نظام Split-Cas9 بوساطة داخلية يمكن مقارنتها مع النوع البري SpCas9

في التجارب اللاحقة ، تحققنا من صحة نظام Intein-Cas9 الخاص بنا في عدة مواقع داخلية (فوس ، روزا 26 و الرب 38) في خلايا Neuro-2a. كان الجين الأول المختار فوس (تنصهر في الساركوما) لأهميتها كنموذج للتصلب الجانبي الضموري (27). تم عزل الحمض النووي لمجموعة الخلايا بأكملها بعد 48 ساعة من تعداء عابرة. تم تضخيم المنطقة التي تحتوي على الموقع المستهدف CRISPR / Cas9 بواسطة تفاعل البوليميراز المتسلسل وتم إجراء فحص نوكلياز T7. سيشكل Indels دوبلكس غير متطابق بعد خطوة تغيير الصفات وإعادة التجديد. نوكلياز T7 I يشق هذه المناطق غير المتطابقة وتم الكشف عن وجود indels من خلال وجود منتجات PCR المهضومة (الشكل 2 ج). كما هو متوقع ، فقط عينات من الخلايا المعرضة لـ SpCas9 ، أو لكلا الشقين ، قدمت منتجات الهضم المتوقعة ، والتي تُظهر نسبة مماثلة من indels (23.1 و 22.7٪ ، على التوالي) ، بينما في الضوابط السلبية لم يتم اكتشاف أي منها (الشكل 2 ج) و ز).

للتحقق من صحة النتائج التي تم الحصول عليها والتي تستهدف فوس الجين ، تم استهداف اثنين من الجينات الأخرى. استهدفنا روزا 26 كموقع جينومي ثان مع جرناسين مختلفين (الشكل 2 د و هـ). روزا 26 يستخدم على نطاق واسع كموقع آمن في الفأر لضرب الحمض النووي الغريب (28). كما في التجربة السابقة ، تم تضخيم المنطقة التي تحتوي على تسلسل الهدف المتوقع بواسطة PCR. تم الكشف عن وجود indels عند استخدام gRNA-Rosa26 # 1 بواسطة مقايسة T7 للنويدات الداخلية I ، وسمح لنا وجود موقع XbaI في موقع ربط gRNA-Rosa26 # 3 بتحليل وجود indels بواسطة RFLP. عندما تم استخدام gRNA-Rosa26 # 1 ، تم اكتشاف المنتجات المهضومة المتوقعة فقط عند إضافة SpCas9 أو اثنين من شقوق SpCas9 (64.0 و 48.1 ٪ ، على التوالي) (الشكل 2 د ، ز). تم تأكيد هذه البيانات باستخدام جرنا ثاني ، جرنا-روزا 26 # 3. في هذه الحالة ، سيعطل indels موقع XbaI ، مما ينتج عنه شظايا DNA متحولة مقاومة لـ XbaI (الشكل 2 هـ). لاحظنا مرة أخرى أن نشاط نوكلياز الذي لوحظ مع إصدار SpCas9 intein-split (42.9 ٪) كان مشابهًا للنوع البري SpCas9 (50.2 ٪) (الشكل 2e و g).

كموضع ثالث ، استهدفنا الرب 38 موضع (الشكل 2f). تم استخدام هذا الموضع من قبلنا كدليل على المنطقة الجينية الرئيسية لاختبار نشاط نوكلياز ZFN و TALEN و CRISPR / Cas9 (21 ، 29). تم تضخيم المنطقة التي تحتوي على التسلسل المستهدف لـ gRNA-Rab38 # 2 بواسطة تفاعل البوليميراز المتسلسل وتحليلها بواسطة RFLP. تم الكشف عن وجود indels بفقدان موقع XcmI ، بينما تم هضم الحمض النووي من النوع البري (الشكل 2f). كان المنتج غير المهضوم قابلاً للاكتشاف فقط عند استخدام كل من شقوق SpCas9 المنقسمة (24.9٪) أو SpCas9 (22.7٪) (الشكل 2f و g).

يمكن توصيل نظام Split-Cas9 بوساطة intein بوساطة عبر rAAV

كان الهدف من تطوير نظام انقسام - Cas9 بوساطة داخلية هو السماح بالتسليم الفعال عبر rAAVs. لإثبات ذلك ، تم إنتاج اثنين من AAV المؤتلف ، يحمل كل منهما نصفًا منقسمًا من النظام (pAAV_crTLR # 1_Nv1 و pAAV_crTLR # 1_Cv1) (الشكل 3 أ). تم استخدام خط خلية بشرية ، AAVS1 TLR / + (18) ، وخط خلية فأر ، Neuro-2a TLR ، للتحقق من صحة نظامنا. عندما تم نقل خط الخلية AAVS1 TLR / + مع كل من rAAVs ، كان نشاط نوكلياز النسبي أعلى بمرتين من التحكم السلبي أو عند استخدام rAAV واحد فقط (الشكل 3 ب). في حالة Neuro-2a TLR ، لوحظت نتيجة مماثلة. كان نشاط نوكلياز النسبي أمرًا واحدًا من حيث الحجم أعلى من التحكم السلبي وتجارب rAAV الفردية (الشكل 3 ج). في كلتا الحالتين ، كان النشاط الفعلي الذي لوحظ أعلى من ذلك لأنه ، مع نظام المراسل هذا ، تم اكتشاف ثلث إجمالي نشاط نوكلياز النظري فقط. توضح هذه النتائج أن تسليم نظام CRISPR / Cas9 الكامل ممكن باستخدام اثنين من rAAV دون أن يتم تقييده بواسطة عناصر مقطوعة.

إثبات إمكانية توصيل نظام spCas9 المنقسم إلى الداخل بواسطة rAAV. (أ) نظرة عامة على بنيات Split-Cas9 rAAV (pAAV_crTLR # 1_Nv1 ، pAAV_crTLR # 1_Cv1). لضمان التعبير العالي ، تم استخدام محفز قوي للثدييات الاصطناعية (CBh ، أخضر) وهرمون نمو الأبقار (bGH ، أحمر). يظهر Split Cas9 (كدنا) باللون البرتقالي ، N-intein باللون البني الداكن و C-Intein باللون البني الفاتح. NLS (أحمر غامق): إشارة توطين نووية. يتم عرض علامتي FLAG و HA باللون الرمادي الفاتح والداكن ، على التوالي. لتعبير جرنا (فيروزي) ، تم اختيار مروج U6 (أخضر غامق). تظهر التكرارات الطرفية المقلوبة (ITR) باللون الأزرق الفاتح والأخضر الفاتح. (ب و ج) كان نشاط نوكلياز فقط قابلاً للاكتشاف عندما تمت إضافة جهازي rAAV اللذين يحملان الشقين إلى AAVS1 TLR / + (ب) أو إلى خلايا Neuro-2a TLR (ج). في التجارب التي أجريت على شق واحد فقط ، كان نشاط نوكلياز لا يمكن تمييزه عن عنصر التحكم السلبي. الموضح يعني ± SD لثلاث تجارب مستقلة.

إثبات إمكانية توصيل نظام spCas9 المنقسم إلى الداخل بواسطة rAAV. (أ) نظرة عامة على بنيات Split-Cas9 rAAV (pAAV_crTLR # 1_Nv1 ، pAAV_crTLR # 1_Cv1). لضمان التعبير العالي ، تم استخدام محفز قوي للثدييات الاصطناعية (CBh ، أخضر) وهرمون نمو الأبقار (bGH ، أحمر). يظهر Split Cas9 (كدنا) باللون البرتقالي ، N-intein باللون البني الداكن و C-Intein باللون البني الفاتح. NLS (أحمر غامق): إشارة توطين نووية. يتم عرض علامتي FLAG و HA باللون الرمادي الفاتح والداكن ، على التوالي. لتعبير جرنا (فيروزي) ، تم اختيار مروج U6 (أخضر غامق). تظهر التكرارات الطرفية المقلوبة (ITR) باللون الأزرق الفاتح والأخضر الفاتح. (ب و ج) كان نشاط نوكلياز فقط قابلاً للاكتشاف عندما تمت إضافة جهازي rAAV اللذين يحملان الشقين إلى AAVS1 TLR / + (ب) أو إلى خلايا Neuro-2a TLR (ج). في التجارب التي أجريت على شق واحد فقط ، كان نشاط نوكلياز لا يمكن تمييزه عن عنصر التحكم السلبي. الموضح يعني ± SD لثلاث تجارب مستقلة.

يعتبر نيكاز Cas9 D10A بوساطة intein وظيفي ويمكن مقارنته بـ SpCas9 D10A

تم الإبلاغ عن نيكازات SpCas9 D10A لتقليل الأهداف الجينية غير المستهدفة بشكل كبير في المختبر، وهو أمر ذو أهمية كبيرة لاستخدام كريسبر-كاس 9 في العلاج الجيني (30). لذلك ، قمنا بتصميم نظام انقسام - Cas9 بوساطة (الشكل 4 أ) لمقارنة كفاءته في نسبة HDR-NHEJ إلى نيكاز SpCas9D10A غير المعدل باستخدام خط خلية مراسل إشارة المرور واثنين من جرنا (crTLR # 1 و crTLR # 3) (الشكل 1 ج) وإلى النوع البري SpCas9. ومن المثير للاهتمام ، أن النيكات أظهرت تفضيلًا أعلى لـ HDR من النوع البري SpCas9 (الشكل 4 ج) مع قيم NHEJ منخفضة. تشترك النيكاز المقسم أيضًا في نفس نسبة HDR مقابل NHEJ من نيكاز SpCas9D10A ، ولكن مع نشاط إجمالي منخفض بشكل طفيف مقارنة بالنوع البري. كانت كفاءتها HDR مع ذلك فعالة مثل النوع البري SpCas9 ولكن مع انخفاض كبير في NHEJ (الشكل 4 ج).

تجربة ترنسفكأيشن البلازميد لمقارنة النوع البري SpCas9 والنيكاز مع النسخ المنقسمة الخاصة بهما ، والحمض النووي المتبرع كبلازميد منفصل أو ملائم مباشرة على بلازميد AAV. (أ) نظرة عامة على البلازميدات المنقسمة - Cas9 المستخدمة للتعبير عن SpCas9 و SpCas9D10A ونسختها المنقسمة (Cas9، Cas9D10A، N-Cas9_N-Intein_v1، C-Intein_C-Cas9_v1، gRNA crTLR # 1 / # 2. (ب) rAAV plasmids المستخدمة: بدون تسلسل المتبرع (pAAV_crTLR # 1_Nv1) ، تحمل الحمض النووي المتبرع المحاط بمواقع CRISPR (pAAV_crTLR # 1_CRISPR-Donor_Nv1) أو غير محاط (pAAV_crTLR # 1_Donor_Nv1) ، تعبير C -AVR. يظهر محفز CBh في هرمون النمو البقري الأخضر (bGH ، الأحمر). يظهر Split Cas9 (كدنا) باللون البرتقالي ، N-intein باللون البني الداكن و C-Intein باللون البني الفاتح. NLS (أحمر غامق): إشارة توطين نووية. يتم عرض علامتي FLAG و HA باللون الرمادي الفاتح والداكن ، على التوالي. لتعبير جرنا (فيروزي) ، تم اختيار مروج U6 (أخضر غامق). تظهر التكرارات الطرفية المقلوبة (ITR) باللون الأزرق الفاتح والأخضر الفاتح. تسلسل الحمض النووي للمتبرع (المتبرع ، أخضر داكن) (ج) استراتيجية التقطيع المزدوج ، SpCas9D10A بالاشتراك مع اثنين من جرنا ، أظهرت تفضيل HDR مقارنة بالنوع البري. وقد لوحظ هذا التأثير أيضًا مع الانقسام SpCas9D10A ولكن مع انخفاض النشاط. مع اختلاف استراتيجيات المتبرعين بالحمض النووي ، لم يلاحظ أي اختلافات ، ولكن مع وجود DNA المتبرع المحاط بمواقع كريسبر لوحظ انخفاض HDR. الموضح يعني ± SD لثلاث تجارب مستقلة.

تجربة ترنسفكأيشن البلازميد لمقارنة النوع البري SpCas9 والنيكاز مع النسخ المنقسمة الخاصة بهما ، والحمض النووي المتبرع كبلازميد منفصل أو ملائم مباشرة على بلازميد AAV. (أ) نظرة عامة على البلازميدات المنقسمة - Cas9 المستخدمة للتعبير عن SpCas9 و SpCas9D10A ونسختها المنقسمة (Cas9، Cas9D10A، N-Cas9_N-Intein_v1، C-Intein_C-Cas9_v1، gRNA crTLR # 1 / # 2. (ب) rAAV plasmids المستخدمة: بدون تسلسل المتبرع (pAAV_crTLR # 1_Nv1) ، تحمل الحمض النووي المتبرع المحاط بمواقع CRISPR (pAAV_crTLR # 1_CRISPR-Donor_Nv1) أو غير محاط (pAAV_crTLR # 1_Donor_Nv1) ، تعبير C -AVR. يظهر محفز CBh في هرمون النمو البقري الأخضر (bGH ، الأحمر). يظهر Split Cas9 (كدنا) باللون البرتقالي ، N-intein باللون البني الداكن و C-Intein باللون البني الفاتح. NLS (أحمر غامق): إشارة توطين نووية. يتم عرض علامتي FLAG و HA باللون الرمادي الفاتح والداكن ، على التوالي. لتعبير جرنا (فيروزي) ، تم اختيار مروج U6 (أخضر غامق). تظهر التكرارات الطرفية المقلوبة (ITR) باللون الأزرق الفاتح والأخضر الفاتح. تسلسل الحمض النووي للمتبرع (المتبرع ، أخضر داكن) (ج) استراتيجية التقطيع المزدوج ، SpCas9D10A بالاشتراك مع اثنين من جرنا ، أظهرت تفضيل HDR مقارنة بالنوع البري. وقد لوحظ هذا التأثير أيضًا مع الانقسام SpCas9D10A ولكن مع انخفاض النشاط. مع اختلاف استراتيجيات المتبرعين بالحمض النووي ، لم يلاحظ أي اختلافات ، ولكن مع وجود DNA المتبرع المحاط بمواقع كريسبر ، لوحظ انخفاض HDR. الموضح يعني ± SD لثلاث تجارب مستقلة.

يمكن استيعاب الحمض النووي المتبرع على نفس البلازميد الذي يشفر نظام الانقسام- CRISPR / Cas9

العديد من الأمراض الموروثة أحادية الجينات ، تنشأ من طفرة نقطية في الجين المقابل ، والتي يمكن ، من الناحية النظرية ، تصحيحها إذا تم توفير منطقة قالب بعد حدث DSB. يتبقى حوالي 0.9 كيلو بايت على نظام المتجه المزدوج قبل الوصول إلى 5 كيلو بايت ، لدمج متواليات إضافية. وهكذا ، قمنا بتضمين تسلسل المتبرع في أحد بلازميدات الانقسام- Cas9 (الشكل 4 ب) ، واختبرنا كفاءتها باستخدام نظام مراسل TLR ، مقارنةً بإضافة المتبرع كبلازميد مستقل. بالإضافة إلى ذلك ، تم إنشاء نسختين من نموذج الإصلاح المشفر rAAV: النسخة الأولى احتوت على منطقة المانحين ، بينما في الإصدار الثاني ، كانت المنطقة المانحة محاطة أيضًا بمواقع التعرف على CRISPR (pAAV_crTLR # 1_CRISPR-Donor_Nv1 ، pAAV_crTLR # 1_Donor_Nv1 ، الشكل 4 ب). عندما تم اختبار هذا النظام عن طريق ترنسفكأيشن البلازميد ، كانت قيم HDR التي لوحظت مع المتبرع غير المُحاور مماثلة لمتغيرات SpCas9 من النوع البري والمقسمة في وجود بلازميد إضافي من المانحين (الشكل 4 ج). في حالة المتبرع المحاط ، كان نشاط نوكلياز أقل. من المحتمل أن يكون هذا بسبب عدم استقرار الحمض النووي بعد قطعه بواسطة SpCas9 (الشكل 4 ج). يمكن أن تكون هذه النتائج مفيدة في تصميم نظام ناقل لهندسة الجينوم مع عدد أقل من البلازميدات ، مما يجعل تعداءهم جميعًا أسهل.


إنتينز

في معظم الحالات ، يقوم كل جين بتشفير بروتين واحد ، لكن الخلايا وجدت طرقًا للتغلب على هذا القيد. غالبًا ما تحتوي الفيروسات ، بجينوماتها الصغيرة ، على جينات تقوم بتشفير البروتينات الطويلة ، والتي يتم بعد ذلك تقطيعها إلى مجموعة من القطع الوظيفية بواسطة الإنزيمات. Inteins هي طريقة أخرى تجعل الخلايا تصنع عدة بروتينات من جين واحد. تم اكتشاف أول مثال على intein في خميرة ATPase (كما هو موضح هنا من إدخال PDB 1jva). يقوم الجين بتشفير بروتين ATPase مع بروتين إضافي مضمن في الوسط. يسمى هذا البروتين المضمن بـ إينتين (يظهر هنا باللون الأخضر) ، ويطلق على نصفي ATPase exteins (موضح هنا باللونين الأحمر والأزرق - لاحظ أن هذا الهيكل يتضمن جزءًا صغيرًا فقط من الامتدادات). عندما يتم تصنيع البروتين ، ينفصل intein عن السلسلة ويربط بين الاثنين الملحقين ، مما يخلق قاعدة ATPase الوظيفية.

نوكليازات داخلية

تشتمل العديد من inteins على جزأين: جزء يفصل الأمعاء خارج سلسلة البروتين الكلية ، وجزء يعمل بمثابة إنزيم لقطع الحمض النووي. غالبًا ما يُطلق على هذا الإنزيم a نوكلياز داخلي موجه لأنه يحتوي على الحمض النووي الذي لا يشفر intein. تعمل نوكليازات الزرع كعناصر وراثية أنانية ، مع طريقة خبيثة لتكاثر نفسها بين نسخ مختلفة من الجينات. إنهم لا يهاجمون الجينات التي تقوم بالفعل بتشفير inteins ، لكنهم يشقون الجينات بدونها. بعد ذلك ، ستعمل آلية الإصلاح الطبيعية للخلية على إصلاح الكسر ، ولكن باستخدام الجين الذي يشمل الجين كقالب. لذلك ، عندما يتم تصحيح الضرر ، يتم ترك الجين مع الوريد. ومع ذلك ، فهذه ليست مشكلة ، لأن intein سوف تنفصل من البروتين عندما يتم تصنيعها.

إنتينز في المختبر

Inteins هي آلات ربط بروتين معيارية ، وبالتالي فهي مفيدة للتكنولوجيا الحيوية. تم عزل inteins العاملة من الخلايا ، ثم تم هندستها في بروتينات جديدة لتكوين بروتينات ذاتية التضفير لوظائف محددة. على سبيل المثال ، تم استخدام inteins المهندسة لربط الببتيدات معًا بأنواع مختلفة من الملصقات للمساعدة في تجارب NMR ، أو لإضافة أحماض أمينية غير طبيعية إلى البروتين ، أو حتى لربط البروتينات بنقاط الكم. تم استخدام Inteins أيضًا لربط طرفي السلسلة ، مما يؤدي إلى تكوين بروتين دوري.

الكبيرة والصغيرة

لا تحتوي جميع inteins على نوكلياز موجه. تتضمن بعض الأشكال ، التي تسمى mini-inteins ، جزء الربط فقط. يتم عرض أمثلة على كل منها هنا. على اليسار يوجد intein كبير نموذجي يشتمل على نوكلياز داخلي موجه ، يظهر هنا مقسم من بروتينه ومرتبط بالحمض النووي (إدخال PDB 1lws). على اليمين يوجد intein صغير موجود في الجين الخاص بـ mycobacterial gyrase (إدخال PDB 1am2). يحتوي على ما يكفي من البروتين فقط لأداء تفاعل التضفير.

استكشاف الهيكل

يُظهر تركيبان من فجوة ATPase intein البروتين قبل تفاعل التضفير وبعده. في كلتا الحالتين ، تم تحور عدد قليل من الأحماض الأمينية المحفزة لإبطاء التفاعل ، بحيث يمكن حل الهيكل. يُظهر إدخال PDB 1jva (على اليسار) intein (الأخضر) قبل التفاعل ، مع إرفاق أجزاء صغيرة من exteins (الأحمر والأزرق). يكون إدخال PDB 1um2 (يمين) بعد التفاعل ، وقد تم توصيل الاثنين الملحقين معًا. In the actual protein, the exteins are much larger, and when joined they form part of a large proton pump. To compare these two structures in more detail, click on the image for an interactive Jmol.

Topics for Further Discussion

  1. Structures are available for many different inteins. Can you find them in the PDB? Do the structures include the homing endonuclease, or are they mini-inteins?
  2. Do the structures include portions of the exteins? Why is it difficult to determine structures that include exteins?

Related PDB-101 Resources

مراجع

  1. S. Elleuche and S. Poggeler (2010) Inteins, valuable genetic elements in molecular biology and biotechnology. Applied Microbiology and Biotechnology 87, 479-489.
  2. Y. Anraku and Y. Satow (2009) Reflections on protein splicing: structures, functions and mechanisms. Proceedings of the Japan Academy, Series B, 85, 409-421.
  3. Y. Anraku, R. Mizutani and Y. Satow (2005) Protein splicing: its discovery and structural insight into novel chemical mechanisms. IUBMB Life 57, 563-574.

November 2010, David Goodsell

About PDB-101

PDB-101 helps teachers, students, and the general public explore the 3D world of proteins and nucleic acids. Learning about their diverse shapes and functions helps to understand all aspects of biomedicine and agriculture, from protein synthesis to health and disease to biological energy.

Why PDB-101? Researchers around the globe make these 3D structures freely available at the Protein Data Bank (PDB) archive. PDB-101 builds introductory materials to help beginners get started in the subject ("101", as in an entry level course) as well as resources for extended learning.


BRIEF SUMMARY OF THE INVENTION

The present invention provides robust split inteins and methods of using the same. The split inteins are active over a large temperature range, over a wide pH range, and in the presence of chaotropic salts. They also show high tolerance to sequence variability in fused heterologous polypeptides. These features make the split inteins especially useful in protein purification and engineering techniques.

In particular, fusion proteins comprising (i) an intein domain at least 75% identical to a sequence selected from the group consisting of SEQ ID NOs: 7, 16, 24, 38 and 65 and (ii) a heterologous polypeptide, wherein the heterologous polypeptide is C-terminal to the intein domain are provided. In some embodiments, the last amino acid of the intein domain is asparagine or glutamine. In some embodiments, the last amino acid of the intein domain is an amino acid other than asparagine or glutamine, e.g., an alanine In some embodiments, the penultimate amino acid of the intein domain is an amino acid other than histidine. In some embodiments, the heterologous polypeptide is directly linked to the intein domain via a peptide bond. In some embodiments, the first amino acid of the heterologous polypeptide is serine, cysteine, or threonine. In some embodiments, the last amino acid of the intein domain is an amino acid other than asparagine or glutamine, e.g., an alanine and the first amino acid of the heterologous polypeptide is other than serine, threonine or cysteine, e.g. alanine In some embodiments, the fusion protein further comprises a linker between the heterologous polypeptide and the intein domain. In some embodiments, the first amino acid of the linker is serine, cysteine, or threonine. In some embodiments, the first amino acid of the linker is an amino acid other than serine, cysteine, or threonine, i.e an alanine In some embodiments, the last amino acid of the intein domain is an amino acid other than asparagine or glutamine, e.g., an alanine and the first amino acid of the linker is an amino acid other than serine, threonine or cysteine. e.g an alanine In some embodiments, the linker comprises 1-5 amino acids of a native extein sequence. Fusion proteins comprising an intein domain having a sequence selected from the group consisting of SEQ ID NOs: 7, 16, 24, 38 and 65 and (ii) a heterologous polypeptide, wherein the heterologous polypeptide is C-terminal to the intein domain are also provided.

In addition, fusion proteins comprising (i) an intein domain at least 75% identical to a sequence selected from the group consisting of SEQ ID NOs: 3, 12, 20, 34 and 64 and (ii) a heterologous polypeptide, wherein the heterologous polypeptide is N-terminal to the intein domain are provided. In some embodiments, the first amino acid of the intein domain is a cysteine. In some embodiments, the first amino acid of the intein domain is an amino acid other than serine or cysteine, e.g., an alanine In some embodiments, the heterologous polypeptide is directly linked to the intein domain via a peptide bond. In some embodiments, the fusion protein further comprises a linker between the heterologous polypeptide and the intein domain. In some embodiments, the linker comprises 1-5 amino acids of a native extein sequence. Fusion proteins comprising an intein domain having a sequence selected from the group consisting of SEQ ID NOs: 3, 12, 20, 34 and 64 and a heterologous polypeptide, wherein the heterologous polypeptide is N-terminal to the intein domain are also provided.

Furthermore, fusion proteins comprising a first intein domain, a second intein domain, and a heterologous polypeptide are provided. Furthermore, fusion proteins comprising a first intein domain, a second intein domain, and a heterologous polypeptide are provided wherein the heterologous polypeptide is N-terminal to the first intein domain, and the heterologous polypeptide is

C-terminal to the second intein domain. Furthermore, fusion proteins comprising a first intein domain, a second intein domain, and a heterologous polypeptide are provided wherein the heterologous polypeptide is N-terminal to the first intein domain (N-terminal splicing domain), and the heterologous polypeptide is C-terminal to the second intein domain (C-terminal splicing domain). In some embodiments, (a) the first intein domain is at least 75% identical to SEQ ID NO:3 and the second intein domain is at least 75% identical to SEQ ID NO:7 (b) the first intein domain is at least 75% identical to SEQ ID NO:12 and the second intein domain is at least 75% identical to SEQ ID NO:16 (c) the first intein domain is at least 75% identical to SEQ ID

NO:20 and the second intein domain is at least 75% identical to SEQ ID NO:24 (d) the first intein domain is at least 75% identical to SEQ ID NO:34 and the second intein domain is at least 75% identical to SEQ ID NO:38 or (d) the first intein domain is at least 75% identical to SEQ ID NO:64 and the second intein domain is at least 75% identical to SEQ ID NO:65. In some embodiments, the first amino acid of the heterologous polypeptide is serine, cysteine, or threonine. In some embodiments, the fusion protein further comprises a linker between the heterologous polypeptide and the second intein domain, wherein the first amino acid of the linker is serine, cysteine, or threonine. In some embodiments, the first amino acid of the linker is serine.

Polynucleotides encoding the fusion proteins according to the invention are also provided herein.

Compositions comprising fusion proteins are also provided. Such compositions are useful, for example, for C-terminal cleavage reactions, N-terminal cleavage reactions, trans-splicing reactions, and protein-cyclization methods.

Host cells comprising the proteins, fusion proteins, polynucleotides, or compositions are also provided.

Methods of using polypeptides and fusion proteins provided herein in, for example, C-terminal cleavage reactions, N-terminal cleavage reactions, trans-splicing reactions, and protein-cyclization are provided. Such methods can occur at temperatures of about 0° C. to about 60° C. at a pH of about 6 to about 10 , and/or in the presence of about 0.5 M to about 6 M urea.

In some embodiments, the reaction rate constant of the reactions provided herein is at least about 1×10 −1 s− 1 , or at least about 2×10 −1 s− 1 . In some embodiments, the reaction rate half-life is less than about 100 seconds, less than about 50 seconds, or less than about 25 seconds or less than about 15 seconds.

The reactions can be initiated, for example, by a shift in temperature or pH or mixing proteins.

The invention also provides a vector which comprises a polynucleotide encoding an intein domain at least 75% identical to a sequence selected from the group consisting of SEQ ID NOs: 7, 16, 24, 38 and 65 and at least a cloning site downstream of said polynucleotide which allows the cloning of a polynucleotide of interest such that a polynucleotide is formed which encodes a fusion protein comprising the intein domain and the polypeptide encoded by the polynucleotide of interest.

The invention also provides a vector which comprises a polynucleotide encoding an intein domain at least 75% identical to a sequence selected from the group consisting of SEQ ID NOs: 3, 12, 20, 34 and 64 and at least a cloning site upstream of said polynucleotide which allows the cloning of a polynucleotide of interest such that a polynucleotide is formed which encodes a fusion protein comprising the polypeptide encoded by the polynucleotide of interest and the intein domain.

    • أ. if the first intein domain is at least 75% identical to SEQ ID NO:7, then the second intein domain is at least 75% identical to SEQ ID NO:3
    • ب. if the first intein domain is at least 75% identical to SEQ ID NO:16 then the second intein domain is at least 75% identical to SEQ ID NO:12
    • ج. if the first intein domain is at least 75% identical to SEQ ID NO:24, then the second intein domain is at least 75% identical to SEQ ID NO:20
    • د. if the first intein domain is at least 75% identical to SEQ ID NO:38, then the second intein domain is at least 75% identical to SEQ ID NO:34.
      • أ. if the first intein domain is at least 75% identical to SEQ ID NO:7, then the second intein domain is at least 75% identical to SEQ ID NO:3
      • ب. if the first intein domain is at least 75% identical to SEQ ID NO:16 then the second intein domain is at least 75% identical to SEQ ID NO:12
      • ج. if the first intein domain is at least 75% identical to SEQ ID NO:24, then the second intein domain is at least 75% identical to SEQ ID NO:20
      • د. if the first intein domain is at least 75% identical to SEQ ID NO:38, then the second intein domain is at least 75% identical to SEQ ID NO:34 or
      • ه. if the first intein domain is at least 75% identical to SEQ ID NO:65, then the second intein domain is at least 75% identical to SEQ ID NO:64.

      From the Back Cover

      This volume focuses on applications of split inteins, and the progress that has been made in the past 5 years on discovery and engineering of fast and more efficient split inteins. The first few chapters in Split Inteins: Methods and Protocols explore new techniques on how to use split inteins for affinity purification of overproduced proteins, and split-intein based technologies to prepare cyclic peptides and proteins. The next few chapters discuss semisynthetic protein trans-splicing using one synthetic intein piece, synthetic intein-extein pieces used to deliver other cargos for chemical modification both of purified proteins and of proteins in living cells, as well as isotopic labeling of proteins for NMR studies, and a discussion on how protein block copolymers can be generated by protein trans-splicing to form protein hydrogels. The last few chapters deal with intein applications in transgenic plants and conditional inteins that can be regulated in artificial ways by small molecules or light, a cassette-based approach to quickly test many intein insertion positions, and a computational approach to predict new intein split sites (the approach also works for other proteins). Written in the highly successful Methods in Molecular Biology series format, chapters include introduction to their respective topics, lists of the necessary materials and reagents, step-by-step, readily reproducible laboratory protocols, and tips on troubleshooting and avoiding known pitfalls.

      Cutting-edge and thorough, Split Inteins: Methods and Protocols is a valuable resource that will provide guidance toward possibilities of split intein applications, explore proven and detailed protocols adaptable to various research projects, and inspire new method developments.


      Group I Introns and Inteins: Disparate Origins but Convergent Parasitic Strategies

      FIG. 1. (A) Predicted secondary structure of a group I intron (Cbu.L1951) (93). Paired, conserved helices common to group I introns are designated P1 to P10. The 5′- and 3′-terminal intron bases are encircled. The intron sequence is in uppercase 5′ and 3′ exons are in lowercase and colored red and blue, respectively. P1 and P10 together form the IGS. The site of HE insertion in P8 is indicated in green. (B) Mechanism of group I intron splicing (110). 5′ and 3′ exons are in red and blue, respectively. ΩG, terminal intron guanine. G*, exogenous guanosine. (Step 1) Nucleophilic attack on the 5′ splice site by the 3′-OH of G* in GBS. (Step 2) Nucleophilic attack on the 3′ splice site by the free 3′-OH of the 5′ exon. (Step 3) Free intron and spliced exons. FIG. 2. (A) Intein modular structure (87, 90). An intein with flanking exteins is shown. The N- and C-terminal splicing domains and the optional HE domain with their conserved motifs are shown. Conserved amino acids Cys or Ser at the 5′ end of the intein, Asn at the 3′ end of the intein, and Cys, Ser, or Thr at the first position on the 3′ extein are also indicated. (B) Intein splicing chemistry (39, 87). N and C exteins are in red and blue, respectively. FIG. 3. (A) Intein or group I intron homing through HE-mediated DNA double-strand-break repair and recombination. (B) Cycle model of HE gain, degeneration, and loss within host populations (37, 38, 39). FIG. 4. Convergence of evolutionary paths of group I introns, inteins, and HEs.

      Supporting information

      S1 Fig

      (A) A phylogenetic tree of Prp8 inteins was reconstructed based on an amino acid multiple sequence alignment of the splicing blocks (A, B, F, G) using the NJ algorithm and an interior-branch test with 1,000 replicates. Fifty representatives covering Prp8 intein diversity were selected, and the full name of each intein-containing organism is listed. Colored symbols represent the insertion site and correspond to colors in Fig 1A . Letters (a1, a2, b, c, d, e, f, g) represent each of the 7 unique insertion sites. (B) A phylogenetic tree of Prp8 inteins was reconstructed based on an amino acid multiple sequence alignment of the splicing blocks (A, B, F, G) using the ML method and evaluated with SH-aLRT. The substitution model, WAG+G+I, was selected using ProtTest 3 (https://github.com/ddarriba/prottest3). ML tree follows the same formatting as in panel A and shows similar architecture as NJ tree. Amoebo, Amoebozoa Asco, Ascomycota Basidio, Basidiomycota Blasto, Blastocladiomycota Choano, Choanoflagellida Chloro Viridipl, Chlorophyta Viridiplantae Chytridio, Chytridiomycota ML, maximum likelihood Mucoro, Mucoromycota NJ, neighbor-joining Opistho, Opisthokonta Prp8, pre-mRNA processing factor 8 SH-aLRT, Shimodaira–Hasegawa nonparametric approximate likelihood-ratio test

      S2 Fig

      Comparative analysis of amino acid residues found in Blocks A, B, F, and G from the selected 50 representative Prp8 inteins, shown with abbreviated species names (full names in S1 Fig). Letters (a1, a2, b, c, d, e, f, g) represent each of the 7 unique insertion sites. Shading is as follows: black, identical amino acid dark gray, conserved amino acid light gray, similar amino acid substitution. Prp8, pre-mRNA processing factor 8

      S3 Fig

      In the amoeba Asu, an intein was identified at a new site in Prp8, here termed g. This is the seventh site in which a Prp8 intein has been found. The full site g intein sequence is shown, plus 10 flanking N-extein (blue) and C-extein (green) amino acids. ال Asu C1 (yellow) and terminal asparagine (red) are highlighted. Residue numbering corresponds to the Asu Prp8 exteins. Accession number: XP_0127532. Asu, Acytostelium subglobosum Prp8, pre-mRNA processing factor 8

      S4 Fig

      (A) A phylogenetic tree of Prp8 exteins corresponding to inteins (see S1 Fig) was reconstructed based on an amino acid multiple sequence alignment using the NJ algorithm and an interior-branch test with 1,000 replicates. Extreme conservation among Prp8 exteins is observed along with grouping by host organism phylogeny. Colored symbols represent the intein insertion site of the exteins and correspond to colors in Fig 1A . Letters (a1, a2, b, c, d, e, f, and g) represent each of the 7 unique insertion sites. Phylum abbreviations are listed in the S1 Fig legend. (B) A phylogenetic tree of Prp8 exteins was reconstructed based on an amino acid multiple sequence alignment of the splicing blocks (A, B, F, G) using the ML method and evaluated with SH-aLRT. The substitution model, LG+G, was selected using ProtTest 3 (https://github.com/ddarriba/prottest3). Tree follows the same formatting as in panel A. ML, maximum likelihood NJ, neighbor-joining Prp8, pre-mRNA processing factor 8 SH-aLRT, Shimodaira–Hasegawa nonparametric approximate likelihood-ratio test.

      S5 Fig

      (A) Overlay of the Sce VMA1 intein and Cne Prp8 intein active sites. ال Sce VMA1 intein (cyan, PDB 1GPP) was overlaid with the Cne Prp8 intein (red). The active site residues, crucial to protein splicing, are shown as sticks and labeled. A majority of these conserved residues overlap exactly, such as the catalytic C1, and the Block B TxxH motif. ال Sce VMA1 intein uses an asparagine (N76) rather than threonine in the TxxH motif, but the positioning is similar to the threonine (T62) of the Cne Prp8 intein. The penultimate histidines (H170 and H453) are in comparable positions except for the side chains, whose chi angles are different by 45°. ال Sce VMA1 intein was not solved with the terminal asparagine. (B) Structural comparison of bacterial Mtu RecA intein and fungal Cne Prp8 intein. Overlay of the Mtu RecA intein (brown, PDB 2IMZ), and the Cne Prp8 intein (red) reveals structural similarities in major intein features, such as the anti-parallel β-sheet folding, that contribute to the horseshoe shape. The Hint domain, comprised of splicing Blocks A, B, F, and G, are generally aligned between the 2 inteins. The structures deviate at sequences between Blocks B and F, where the Cne Prp8 intein encoded a linker or endonuclease domain. The 2 structures have an RMSD value of 2.22 Å. Cne, ج. neoformans Mtu, السل الفطري PDB, Protein Data Bank Prp8, pre-mRNA processing factor 8 RMSD, Root-mean-square deviation Sce, خميرة الخميرة

      S6 Fig

      (A) Diverse Prp8 intein splicing patterns. Several Prp8 inteins from other fungal pathogens Afu, Bde، و Hca were cloned into MIG. Splicing was observed over time by the loss of precursor (P) and increase in LE, or simply by the presence of ligated exteins (for Afu). The gel shows that not all Prp8 inteins splice similarly, despite being placed in an identical extein context. (B) Precursor amounts vary greatly. A quantitation of precursor (P) at each time point shows that these Prp8 inteins are active but splice at variable rates. ال Afu Prp8 intein is almost entirely spliced at the start of the assay (0 h), whereas Bde has 31% precursor at 0 h and Hca has 14% precursor at 0 h. Initial splicing rates were determined by calculating the loss of precursor over time (Pt0−Pt1/60 min) with standard error for MIG Bde Prp8 and MIG Hca Prp8, and are (5.9 ± 0.4) × 10 𢄢 % per min and (2.7 ± 0.9) × 10 𢄢 % per min, respectively. This suggests intein-mediated control of protein splicing. Data are representative of 3 biological replicates and mean standard deviations are shown. Trend lines are fit to show the decay curve. Data available in S1 Data. Afu, Aspergillus fumigatus Bde, Batrachochytrium dendrobatidis Hca, كبسولات الهستوبلازما LE, ligated exteins MIG, MBP-Intein-GFP Prp8, pre-mRNA processing factor 8

      S7 Fig

      (A) Copper treatment causes inhibition. Induced MIG Prp8 A-1V cells were lysed and treated with 0 or 1 mM CuSO4. The lysates were incubated for the indicated time at 30ଌ and then frozen. Samples were separated on SDS-PAGE and scanned for GFP fluorescence. In the absence of copper, MIG Prp8 A-1V spliced well over 30 h, converting P into LE. There was little to no conversion of P to LE over time with copper addition. Quantitation is shown below in a stacked plot. Data are representative of 3 biological replicates and mean standard deviations are shown. Data available in S1 Data. (B) Relative position of 2 cysteines. There are only 2 cysteines present in the Cne Prp8 intein. Using the solved structure, a measurement of the distance between C1 and C61 (shown as sticks) was calculated to be 8.9 Å. (C) Valine is the preferred residue at position 61. A sequence logo was constructed of Block B from the 50 representative Prp8 inteins (S1 Fig). This shows absolute conservation of the histidine (position 10) and a strong preference for threonine (position 7) in the TxxH motif. However, the Block B cysteine (position 6, red box) is not highly conserved across Prp8 inteins, and most encode valine at this site. Cne, ج. neoformans GFP, green fluorescent protein LE, ligated exteins MIG, MBP-Intein-GFP P, precursor Prp8, pre-mRNA processing factor 8

      S8 Fig

      (A) Mutations to C61 in MIG Prp8 A-1V slow down splicing. The B block C61 was mutated to valine (C61V), alanine (C61A), and serine (C61S), and splicing was observed over time in MIG. Initial splicing rates were determined by calculating the loss of precursor over time (Pt0−Pt1/60 min) with standard error and are as follows: WT, (1.01 ± 0.07) × 10 𢄡 % per min C61V, (1.07 ± 0.08) × 10 𢄡 % per min C61A, (6.22 ± 0.50) × 10 𢄢 % per min, and C61S, (2.92 ± 1.04) × 10 𢄢 % per min. The C61V mutant splices similarly to WT, whereas C61A and C61S are slower. A quantitation is shown to the right with the amount of precursor (P) at each time point. Data are representative of 3 biological replicates and mean standard deviations are shown. Trend lines are fit to show the decay curve. Data available in S1 Data. (B) MIG Prp8 A-1V B block cysteine mutants are inhibited by copper. To test whether copper inhibition was caused by C1 oxidation, C61 mutants were treated with CuSO4. After induction of MIG, the cells were lysed, and 1 mM CuSO4 was added. The lysates were incubated at 30ଌ, and aliquots were collected at the indicated time. Samples were run on SDS-PAGE and scanned for GFP fluorescence. None of the C61 mutants show an increase in LE over time, with little loss of precursor (P). This indicates that at least C1 oxidation by copper is sufficient to cause the observed splicing inhibition and that disulfide bonds are not involved. Quantitation is shown below in a stacked plot. Data are representative of 3 biological replicates, and mean standard deviations are shown. Data available in S1 Data. GFP, green fluorescent protein LE, ligated exteins MIG, MBP-Intein-GFP Prp8, pre-mRNA processing factor 8 WT, wild type.

      S9 Fig

      (A) Intact Cne Prp8 intein shows small mass shift. Purified Cne Prp8 intein was untreated or treated with 10× excess copper and separated and analyzed using LC-MS. The peaks were deconvoluted, and the expected mass of the Prp8 intein, 19,588 Da, is seen as the largest peak. A small, 32 Da shift (19,620 Da) was visible with both no treatment and copper treatment only (arrow). This suggests that highly reactive cysteines are modified by atmospheric oxygen alone. (B) C1 and C61 are oxidized with copper treatment. Trypsin-digested fragments of copper-treated Cne Prp8 intein were separated and sprayed using LC-MS/MS (insets). Peptides (red peaks) containing C1 or C61 were detected and further analyzed using multiple reaction MIDAS to confirm the identity and location of oxidation. The chromatogram shows elution time for both cysteines consistent with a single additional oxygen or a sulfenic acid modification. Cne, ج. neoformans LC-MS, liquid chromatography-mass spectrometry LC-MS/MS, liquid chromatography-mass spectrometry/mass spectrometry MIDAS, monitoring-initiated detection and sequencing Prp8, pre-mRNA processing factor 8

      S10 Fig

      The 7 unique insertion sites (a–g) were mapped to a solved structure of Prp8 from a س. cerevisiae C complex spliceosome (PDB 5GMK, chain A from Wan and colleagues, 2016) by locating the +1 residue. This Prp8 structure was used because the insertion sites are all resolved. The +1 residues are shown as red spheres and labeled a through g. Most Prp8 inteins localize close to the active center of Prp8. Some insertions are in the N-terminal domain, which provides structural integrity to the spliceosome. A corresponding line diagram of Prp8 exteins shows the domains of the host protein from amino acid residues 127 to 2084 with arrows indicating the site of intein insertion with the residue number and insertion site letter. The domains are as follows: N-terminal domain, gray RT Palm/Finger, dark blue Thumb/X, light blue linker, green endonuclease, yellow and RNase H-like, orange. PDB, Protein Data Bank Prp8, pre-mRNA processing factor 8

      S11 Fig

      The Prp8 intein-containing Prp8 precursor model was docked into a cryo-EM tri-snRNP structure from Sce (PDB 5GAN) to look for intein-spliceosome disruptions. Prp8 is shown as lavender, and the Prp8 intein is shown as red, and the rest of the tri-snRP components are colored by chain. This reveals that the Prp8 intein would occupy a relatively crowded, centralized location of the tri-snRNP (circled). The intein clashes are shown here (with labels) and noted in Fig 7B . Cne, ج. neoformans cryo-EM, cryogenic electron microscopy PDB, Protein Data Bank Prp8, pre-mRNA processing factor 8 Sce, س. cerevisiae tri-snRNP, triple small nuclear ribonucleoprotein.

      S1 Table

      A list of bacterial strains used for various cloning, overexpression, and purification studies is provided. Strains of fungi and yeast used for in vivo studies are also listed.

      S2 Table

      A list of MIG constructs and purification vectors with corresponding backbones are provided. MIG, MBP-Intein-GFP.

      S3 Table

      Primers used for the construction of various vectors or for the mutation of plasmids are provided.

      S4 Table

      Data collection, refinement statistics, and model details for (A) the unbound and (B) the Zn 2+ -bound Cne Prp8 intein crystal structures. Cne, ج. neoformans Prp8, pre-mRNA processing factor 8

      S1 Data

      Individual numerical values that underlie any graphs (Figs ​ (Figs4B, 4B , ​ ,4C, 4C , ​ ,5A, 5A , ​ ,5B, 5B , and S6B, S7A, S8A and S8B Figs) are provided in separate sheets. Values were calculated from biological triplicate gel images using ImageJ software. Levels of precursor (P), LE, and OPC products are given out of a total of 100. Some graphs use percent precursor as a proxy for splicing. Time points are indicated. LE, ligated exteins MIG, MBP-Intein-GFP OPC, off-pathway cleavage Prp8, pre-mRNA processing factor 8


      Suffix: -dactyl

      Adactyly (a - dactyl - y) - a condition characterized by the absence of fingers or toes at birth.

      Anisodactyly (aniso - dactyl - y) - describes a condition in which corresponding fingers or toes are unequal in length.

      Artiodactyl (artio - dactyl) - even-toed hoofed mammals which include animals such as sheep, giraffes, and pigs.

      Brachydactyly (brachy - dactyl - y) - a condition in which fingers or toes are unusually short.

      Camptodactyly (campto - dactyl - y) - describes the abnormal bending of one or more fingers or toes. Camptodactyly is usually congenital and most often occurs in the little finger.

      Clinodactyly (clino - dactyl - y) - of or relating to the curvature of a digit, whether a finger or a toe. In humans, the most common form is the smallest finger curving toward the adjacent finger.

      Didactyl (di - dactyl) - an organism that only has two fingers per hand or two toes per foot.

      Ectrodactyly (ectro - dactyl - y) - a congenital condition in which all or part of a finger (fingers) or toe (toes) is missing. Ectrodactyly is also known as a split hand or split foot deformity.

      Hexadactylism (hexa - dactyl - ism) - an organism that has six toes per foot or six fingers per hand.

      Macrodactyly (macro - dactyly) - possessing overlay large fingers or toes. It is typically due to an overgroth of bone tissue.

      Monodactyl (mono - dactyl) - an organism with only one digit per foot. A horse is an example of a monodactyl.

      Oligodactyly (oligo - dactyl - y) - having fewer than five fingers on the hand or five toes on the foot.

      Pentadactyl (penta - dactyl) - an organism with five fingers per hand and five toes per foot.

      Perissodactyl (perisso - dactyl) - odd-toed hoofed mammals such as horses, zebras, and rhinoceroses.

      كثرة الأصابع (poly - dactyl - y) - the development of extra fingers or toes.

      Pterodactyl (ptero - dactyl) - an extinct flying reptile that had wings covering an elongated digit.

      Syndactyly (syn - dactyl - y) - a condition in which some or all of the fingers or toes are fused together at the skin and not bone. It is commonly referred to as webbing.

      Zygodactyly (zygo - dactyl - y) - a type of syndactyly in which all the fingers or toes are fused together.


      شاهد الفيديو: الإنقسام الاختزالي (أغسطس 2022).