معلومة

ما هو ملف تعريف رقم نسخة مجزأة

ما هو ملف تعريف رقم نسخة مجزأة


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أنا أدرس تباين رقم النسخ. انا اقرأ

CH Mermel و SE Schumacher و B. Hill و ML Meyerson و R. Beroukhim و G. Getz ، "يسهل GISTIC2.0 التوطين الحساس والواثق لأهداف تغيير رقم النسخ الجسدي البؤري في السرطانات البشرية" ، جينوم بيول.، المجلد. 12 ، لا. 4 ، ص. R41 ، 2011.

هنا ، هو مكتوب أن

تمثل ملفات تعريف أرقام النسخ المجزأة النتيجة المجمعة لجميع SCNAs [تعديلات رقم النسخة الجسدية] التي حدثت أثناء تطور السرطان. تتطلب النمذجة الدقيقة لمعدل الخلفية لتغيير رقم النسخ تحليل SCNAs الفردية. ومع ذلك ، نظرًا لأن SCNAs قد تتداخل ، فمن المستحيل الاستنتاج المباشر للأحداث الأساسية من ملف تعريف رقم النسخة المجزأ النهائي وحده.

ليس من الواضح بالنسبة لي كيف يمثل ملف تعريف رقم النسخة المجزأة النتيجة المجمعة لجميع SCNAs. هل يرجع ذلك إلى إمكانية وجود تعديلات مختلفة في نفس العينة ، أو يمكن تغيير رقم النسخة في لحظات مختلفة ، أو كليهما؟

وهل تتداخلان مكانيًا أم زمنيًا أم كلاهما؟


نعم ، يمكن أن تحتوي عينة واحدة على تعديلات مختلفة. لكل مريض ، عادة ما يتم إزالة عينة ورم واحدة. يمكن تقسيم هذه العينة إلى عدة عينات (على سبيل المثال ، واحدة لتسلسل الحمض النووي ، وأخرى لتسلسل الحمض النووي الريبي ، وواحدة للميثيلة الدقيقة الدقيقة ، والأخرى للمصفوفة الدقيقة لتغير رقم النسخ) ، ومع ذلك تحتوي كل عينة على آلاف الخلايا الفردية وقد تحتوي خليتان متجاورتان CNVs المختلفة (اعتمادًا على أسلافهم النسيلي ، وما إلى ذلك). بمعنى آخر ، الورم عبارة عن مجموعة غير متجانسة من الخلايا. بالنسبة لبعض أنواع الأورام ، يمكن أن يكون هناك خلايا صحية مختلطة.

المصطلح في الأدب تطور نسيلي، هناك صورة جميلة في هذا المقال: عدم تجانس الورم


للرد مباشرة على الاقتباس المقدم ،

تمثل ملفات تعريف أرقام النسخ المجزأة النتيجة المجمعة لجميع SCNAs [تعديلات رقم النسخة الجسدية] التي حدثت أثناء تطور السرطان.

مع تقدم الورم ، يمكن أن يزداد عدم الاستقرار الجيني في كثير من الأحيان. وهذا يعني أن المزيد والمزيد من SCNAs تحدث. وبسبب هذا ، يمكن أن يتداخل أحد SCNA مع الآخر.

على سبيل المثال ، انظر إلى تطور الورم في الكروموسوم أعلاه. لنفترض أن لديك خسارة في هذا الكروموسوم (حدث 1 كروموسوم الأم). يمكن أن تحدث هذه الخسارة من خلال العديد من الآليات التي لن أخوض فيها. يتكاثر الورم وينقسم عدة مرات وتتراكم الطفرات. يمكن أن تتسبب هذه الطفرات في حدوث المزيد من الأحداث ، وربما على ذراع الكروموسوم نفسه ، يتم تكرار الجزء البعيد من النسخة المتبقية (الحدث 2 الكروموسوم الأبوي).

في ملف تعريف رقم النسخ ، سيبدو الأمر كما لو كان لديك خسارة في جزء خلالي فقط من الكروموسوم. لكن بالنظر إلى البيانات عن كثب ، يمكنك أن ترى أنك فقدت تغاير الزيجوت على الجزء البعيد من الكروموسوم أيضًا (لدينا الآن نسختان من الكروموسوم الأبوي ، ونسخ 0 من المادة). هذا مثال مبسط ، ويمكن أن تحدث العديد من الأحداث على طول ذراع الكروموسوم نفسه. إذا كان كروموسوم الأب يحمل طفرة ، فقد يعني ذلك ميزة انتقائية للورم أو مقاومة للعلاجات الدوائية.

لذلك ، يمثل ملف تعريف CN أ لقطة في الوقت المناسب ما كانت حالة رقم النسخة في تلك اللحظة ، مع عدم وجود معلومات صريحة حول كيفية الحصول على حالة رقم النسخة هذه.


تقدير عدد النسخ من نسب السجل

ومع ذلك ، من الناحية العملية ، يصعب تقدير عدد النسخ من قيم نسبة السجل 2 للقطعة لأسباب مختلفة على سبيل المثال ، القضايا القائمة على العينة مثل تعدد الصبغيات ، والفسيفساء ، والتلوث بالعينات العادية ، ونخر الورم ، وما إلى ذلك. القضايا القائمة على أساس مثل النطاق الديناميكي للمسبار ، وجودة التهجين ، والتجميع ، وما إلى ذلك.

تتمتع المصفوفات Agilent بنطاق ديناميكي جيد بينما تتمتع مصفوفات SNP مثل Illumina بنطاق أصغر. يمكنك رؤية ذلك في الإعدادات الافتراضية الخاصة بنا للحصول على / خسارة نسخة واحدة لهذه الأنظمة الأساسية (راجع إعدادات ملف & gt والمنسدلة إلى Illumina). يمكن لمنصة Affymetrix OSCHP الجديدة تقدير عدد النسخ مباشرة.

بالنظر إلى هذه التحذيرات ، يمكنك تقدير رقم النسخة باستخدام قيمة التحقيق المتوسطة لكل مكالمة. في Nexus ، يمكنك الحصول على القيم المتوسطة للتحقيق من جدول البيانات في نافذة Sample Drill Down (نافذة عينة فردية). لذلك ، إذا كانت بياناتك في مساحة log2 ، فإن المكالمة لها متوسط ​​مسبار يبلغ حوالي 0.5-0.57 (= log2 (3/2)) ، وكانت المنصة Agilent ، وهذه ليست عينة ورم ، يمكنك القول إنها اكتساب نسخة واحدة (3 نسخ / 2) وإذا كانت القيمة تقريبية. 1.0 (= log2 (4/2)) يمكنك القول أن هذا هو كسب نسخ 2 (4 نسخ / 2) وهكذا 3 نسخ كسب = log2 (5/2). بالنسبة إلى مصفوفات SNP ذات النطاق الديناميكي الأصغر ، يمكنك إجراء المكالمات بنسب تسجيل أقل قليلاً.


الملخص

تتيح تقنيات تسلسل الحمض النووي أحادية الخلية دراسة الطفرات ومساراتها التطورية في السرطان. وقد تورطت انحرافات رقم النسخة الجسدية (CNAs) في تطور وتطور أنواع مختلفة من السرطان. تم تطوير مجموعة واسعة من طرق اكتشاف CNA خصيصًا لبيانات تسلسل الحمض النووي أحادية الخلية أو تكييفها. يعد فهم نقاط القوة والقيود التي تنفرد بها كل طريقة من هذه الطرق أمرًا مهمًا للغاية للحصول على ملفات تعريف دقيقة لأرقام النسخ من بيانات تسلسل الحمض النووي أحادية الخلية. قمنا بقياس ثلاث طرق مستخدمة على نطاق واسع - Ginkgo و HMMcopy و CopyNumber - على مجموعات بيانات محاكاة وكذلك حقيقية. لتسهيل ذلك ، قمنا بتطوير جهاز محاكاة جديد لتطور جينوم الخلية الواحدة في وجود CNAs. علاوة على ذلك ، لتقييم الأداء على البيانات التجريبية حيث تكون الحقيقة الأساسية غير معروفة ، نقدم مقياسًا قائمًا على التطور لتحديد الاستدلالات التي قد تكون خاطئة. في حين أن تسلسل الحمض النووي أحادي الخلية يعد واعدًا جدًا لتوضيح وفهم CNAs ، تظهر النتائج التي توصلنا إليها أنه حتى أفضل طريقة موجودة لا تتجاوز دقة 80 ٪. هناك حاجة إلى طرق جديدة تعمل على تحسين دقة هذه الطرق الثلاث بشكل كبير. علاوة على ذلك ، مع إنشاء مجموعات البيانات الكبيرة ، يجب أن تكون الأساليب فعالة من الناحية الحسابية.


من وماذا وأين ومتى ولماذا وكيف يتم استخدام بيانات قطاع الحمض النووي

هل أنت مستعد لخوض مغامرة مليئة بالمغامرات في بيانات مقطع الحمض النووي ومستعد لاستخدام بعض البرامج لفهمها وتحليلها واستخدامها في أبحاث تاريخ العائلة؟ لنذهب & # 8217s!

ربما تكون قد قرأت بالفعل بعض منشورات مدونة Family Locket حول استخدام بيانات شريحة الحمض النووي. متصفح الكروموسوم: أداة لتصور بيانات المقطع بواسطة نيكول ، يشرح كيفية استخدام متصفحات الكروموسوم لتصور الحمض النووي الذي تشاركه مع تطابقات الحمض النووي الخاص بك وتثليث مقاطع الحمض النووي الجسدية المشتركة. تثليث القطاعات: إثبات خط الأسلاف ، بقلم ديانا ، يوضح كيفية استخدام مقاطع MyHeritage لتأكيد مجموعة من أجداد الأجداد الثاني. رسم خرائط الكروموسوم - تصور الحمض النووي الخاص بك وحدد الأسلاف الذين نقلوه إليك ، والذي كتبته سابقًا بواسطتي ، يعطي نظرة عامة على استخدام بيانات مقطع الحمض النووي لإنشاء خرائط كروموسوم والقيام بالتدريج البصري.

للبدء ، دع & # 8217s نلقي نظرة على من وماذا وأين ومتى ولماذا وكيف يتم استخدام بيانات مقطع الحمض النووي.

عندما تستكشف نتائج الحمض النووي الخاص بك وتستخدمها في أبحاث تاريخ العائلة ، من يشارك؟

& # 8211 يتطابق مع الحمض النووي & # 8211 الأقارب بعلاقات معروفة وغير معروفة

& # 8211 سلفك المشترك (أسلافك) المشترك & # 8211 السلف المباشر (الأسلاف) الذي ترتبط به أنت والمطابقة في الحمض النووي

توضح الصور أدناه مسارات العلاقة بينك وبين تطابقات الحمض النووي الخاصة بك. إذا كنت من أبناء العمومة الثالثة ، فأنت تشارك أجداد الأجداد.

إذا كان جدك هو تطابق الحمض النووي الخاص بك & # 8217s ، فإن علاقتك هي ابن العم الثاني بمجرد إزالته والذي غالبًا ما يتم اختصاره إلى 2C1R.

الهدف هو تحديد أجزاء الحمض النووي التي ورثتها من أسلاف محددين. تساعدك معلومات مقطع الحمض النووي على تحديد / العثور على / تحديد روابط أسلاف جديدة أو التحقق من العلاقات المعروفة.

تذكر أن لديك نسختين من كل كروموسوم. لقد ورثت نسخة واحدة من كل كروموسوم من والدك ونسخة واحدة من والدتك. يجب أن تكون الأجزاء المتداخلة على نفس الكروموسوم لتقديم معلومات عن الأسلاف.

إذا قمت بفحص أجزاء الحمض النووي التي تشاركها مع تطابقات الحمض النووي الخاصة بك وعرفت كيف ترتبط ببعضك البعض وأي سلف مشترك (أسلاف) مشترك تشاركه ، يمكنك تعيين هذه الأجزاء إلى ذلك السلف. بعد أن يتم "تخصيص" المقطع أو تحديده على أنه ينتمي إلى سلف (أسلاف) معين ، يمكنك مقارنة بيانات المقطع من تطابقات الحمض النووي الإضافية. إذا كانت مطابقة (تطابقات) الحمض النووي الجديدة تشترك أيضًا في نفس المقطع على نفس الكروموسوم ، فهذا يشير إلى خط الأسلاف الذي تشترك فيه ويساعدك على معرفة كيفية ارتباطك وتطابق (تطابقات) الحمض النووي الجديدة.

مع مرور الوقت والمزيد من الأشخاص يختبرون الحمض النووي الخاص بهم ، هناك احتمال بالنسبة لك لتحديد المزيد والمزيد من الأسلاف. لذا ، إذا لم يكن لديك & # 8217t العديد من تطابقات الحمض النووي اليوم ، فلا تشعر بالإهمال. بمرور الوقت ، ستزداد احتمالية وجود المزيد من تطابقات الحمض النووي. من الجيد إعادة التحقق دوريًا والبحث عن مباريات جديدة.

المكان الذي ستتمكن فيه & # 8217ll من مقارنة بيانات الحمض النووي هو & # 8220Where. & # 8221 ولكن أولاً ، قم بتنزيل أو نسخ بيانات المقطع من 23andMe و FTDNA و MyHeritage و GEDmatch. تساعد بعض مواقع الويب والأدوات التابعة لجهات خارجية في جعل بيانات الشريحة ذات مغزى ومفيدة لأبحاث تاريخ عائلتك. بعض مواقع الويب والأدوات هي أداة القسم التلقائي للشؤون الجينية وخرائط كروموسوم رسام الحمض النووي و DNA Gedcom وجداول البيانات والمزيد.

تم توريث الأجزاء المشتركة مع مباريات الحمض النووي من أسلاف مشتركة.

& # 8211 قد يكون لدى بعض أبناء العمومة معلومات عن تاريخ العائلة حول أسلافك المشتركين أكثر مما لديك. قد يعرفون حتى عن أسلاف خارج "جدار من الطوب" بالنسبة لك.

& # 8211 يمكن أن يساعد تحديد الشرائح في التمييز بين أسلاف مفترضة أو تأكيدها ، أو تأكيد الأسلاف المعروفين.

تنزيل ملفات CSV لبيانات المقطع. بمجرد حصولك على بيانات الحمض النووي ، يمكنك تحليلها. يمكنك استخدام البيانات لإنشاء خرائط كروموسوم ، وتثليث ، والتحقق من العلاقات. يمكنك استيراد ملفات CSV إلى أداة القسم التلقائي للشؤون الجينية وأداة خريطة كروموسوم رسام الحمض النووي. تتمثل الخيارات الأخرى في استخدام DNA Gedcom Client لاستخراج البيانات من شركات اختبار الحمض النووي ، ثم استخدام البيانات في JWorks و KWorks ، أو إلقاء نظرة على البيانات في جدول بيانات.

لقد جربت أداة AutoSegment الجديدة في Genetic Affairs ، وأنا متحمس للإمكانيات! أولاً ، اخترت أداة AutoSegment على https://members.geneticaffairs.com/autosegment. في الصورة الموضحة أدناه ، يوجد رابط للإرشادات (https://members.geneticaffairs.com/img/AutoSegmentTutorial.pdf) حول كيفية جمع بيانات المقطع المطلوبة لتحليل AutoSegment. الشركات التي يمكن الحصول على بيانات القطاع منها هي MyHeritage و Family Tree DNA و 23andMe و GEDmatch.

لقد اخترت MyHeritage منذ أن قمت مؤخرًا بتحميل بيانات الحمض النووي الخام ، وأردت رؤية النتائج.

بعد اختيار MyHeritage ، تم فتح هذه الصفحة التي أعطتني تعليمات حول تصدير ملف تطابقات DNA وملف مقطع DNA المشترك. استغرق الأمر حوالي 15 دقيقة لاستلام كلا الملفين من MyHeritage عبر البريد الإلكتروني. قمت باستخراج الملفات المضغوطة ، ثم استخدمت المربع & # 8220Choose File & # 8221 لتحميل ملف المطابقة ، ثم ملف المقطع.

بعد تحديد & # 8220PERFORM AUTOSEGMENT ANALYSIS ، & # 8221 ، فتحت هذه الشاشة ، واخترت & # 8220 نعم ، قم بإجراء تحليل المقطع التلقائي. & # 8221

بعد بضع دقائق فقط ، تلقيت بريدًا إلكترونيًا من الشؤون الجينية مرفق به ملف مضغوط. بعد تنزيل ملف AutoSegment وفك ضغطه ، فتحت ملف HTML واخترت ترتيب تطابقات الحمض النووي بواسطة المجموعة. تم فتح هذه الصورة ، وهي عبارة عن تحليل كتلة مقطع يشبه تحليل AutoCluster الذي عرفناه ونحبه.

& # 8220 شرح تحليل المقطع التلقائي
ينظم AutoSegment مبارياتك في مجموعات تمثل على الأرجح فروعًا لعائلتك. تمثل كل خلية ملونة تقاطعًا بين اثنتين من التطابقات ، مما يعني أنهما يتطابقان معك ويتطابقان معًا بناءً على مقطع متداخل. يتم تجميع هذه الخلايا ، بدورها ، معًا ماديًا ولونًا لإنشاء مخطط مرئي قوي لمجموعاتك.

كل لون يمثل مجموعة واحدة. يتطابق أعضاء الكتلة مع معظم أو جميع أعضاء الكتلة الآخرين. من المحتمل أن يكون كل شخص في المجموعة على نفس خط الأجداد ، على الرغم من أن MRCA قد تختلف بين أي من المباريات وبينك وبين أي تطابق. قد يختلف مستوى الأجيال من المجموعات أيضًا. قد يكون أحدهم جدتك من أبيك & # 8217s فرع آخر ربما جدك & # 8217s & # 8217s فرع الأب & # 8217s.

يرجى العلم أن تحليل AutoSegment مختلف مقارنة بتحليل AutoCluster العادي. يستخدم تحليل AutoCluster المطابقات المشتركة لتشكيل مجموعات من التطابقات. ستشارك بعض هذه التطابقات المشتركة أيضًا في نفس مقطع الحمض النووي معك. يعتمد الجزء التلقائي على شرائح متداخلة من تطابقات الحمض النووي. بناءً على قطعة متداخلة من تطابقات الحمض النووي الخاصة بك ، يتم إنشاء رابط بين تطابقات الحمض النووي هذه. ومع ذلك ، يرجى مراعاة ما يلي:

المقطع المتداخل ، كما تم حسابه ، ليس دليلاً على مقطع مثلثي! & # 8221

متصفح AutoCluster كروموسوم

يوجد مستعرض كروموسوم أسفل المجموعات يظهر مع من تشارك قطعة معينة من الحمض النووي على كروموسوم معين. إذا قمت بالتمرير فوق شريط ملون على الكروموسوم ، فسيتم فتح مربع يحتوي على تفاصيل حول هذا المقطع. تقدم المربعات معلومات مثل: & # 8220segment من المجموعة 52 التي تشترك 21.4 سم مع [DNA match] chr 22: 32،950،104 & # 8211 45،651،045، & # 8221 مما يعني أن مقطع الكروموسوم 22 مشترك مع تطابق معين للحمض النووي والذي يشارك أيضًا ذلك نفس المقطع 21.4 سم مع الأشخاص في المجموعة 52 ، ونقطة البداية هي 32،950،104 مع نقطة النهاية 45،651،045. & # 8221

إذا نقرت على كروموسوم ، فإنه يتأرجح في وضع عمودي. ثم يمكنك التمرير فوق صورة الكروموسوم الأكبر وتحريك الماوس لأسفل لرؤية الأشخاص الآخرين الذين يشاركونك شرائح مختلفة من الكروموسوم.

معلومات الكتلة AutoSegment

بعد ذلك ، يوجد جدول تفاعلي لسرد رقم الكتلة ، والأجزاء ، والكروموسومات ، ونقاط النجمة والتوقف ، وعدد النيوكلوتايد ، واسم المطابقة ، والشركة ، وكمية الحمض النووي المشترك في هذا الجزء ، والكمية الإجمالية للحمض النووي المشترك في سم. يسمح الجدول بالفرز ورابط لإرسال رسالة مطابقة الحمض النووي من خلال نظام مراسلة شركة DNA في هذه الحالة ، كانت الشركة هي MyHeritage.

مخطط مجموعات القطاعات باستخدام تصور القطاعات الفردية

يوجد أيضًا في الملف صور تفاعلية لكل مجموعة ملونة منفصلة موضحة في الصورة أعلاه. تسمح لك هذه الملفات برؤية المعلومات بتفاصيل أكثر تركيزًا. توضح الصورة أدناه أن المجموعات السبع الأولى من صورة المجموعة الكلية معروضة بمزيد من التفصيل. يسلط متصفح الكروموسوم المصاحب الضوء على الأجزاء المشتركة في مجموعة أصغر من المجموعات.

تُظهر المعلومات الواردة في تقرير المقطع التلقائي مقاطع الحمض النووي التي تشاركها مع تطابقات الحمض النووي الأخرى ، ويمكنك فحص والعمل على تمييز الأسلاف المشتركين الذين مرروا مقطع الحمض النووي هذا إليك وإلى تطابق الحمض النووي الخاص بك. إذا كان بإمكانك تحديد 2 أو أكثر من مطابقات الحمض النووي التي تشترك في نفس المقطع من نفس السلف ، [التثليث] ، فيمكنك استخدام ذلك جنبًا إلى جنب مع سجلات الأنساب التقليدية لتأكيد أنك مرتبط وراثيًا بالسلف الذي نقل هذا الجزء من الحمض النووي إليك .

مناطق التراكم

جزء رائع آخر من تقرير AutoSegment هو القسم الخاص بمناطق التراكم. في الرسم البياني الخاص بي للكروموسوم 1 ، يتشارك 14 شخصًا أعلى قمة في الرسم البياني. هذا يعني أن 14 شخصًا يتشاركون في نفس الجزء الصغير من الحمض النووي. يسمح لك القسم التلقائي للشؤون الجينية بتصفية أجزاء الحمض النووي الموجودة في مناطق التراكم المعروفة.

مناطق التراكم هي أجزاء من الحمض النووي شائعة في السكان. لقد تم تناقل هذه الشرائح عبر أجيال عديدة ولا تدل على السلالة المشتركة الحديثة. تزيل خوارزمية Timber في AncestryDNA مناطق التراكم المعروفة من حسابها للحمض النووي المشترك للمطابقات التي تشارك أقل من 90 سم من الحمض النووي.

أطلقت الشؤون الجينية أداة تحليل شريحة إضافية الأسبوع الماضي تسمى Hybrid AutoSegment. تجمع هذه الأداة البيانات من 23andMe و FTDNA و MyHeritage و GEDmatch لتجميع تقرير AutoSegment. إنه لأمر مثير للغاية أن يكون لديك الآن القدرة على مقارنة شرائح الحمض النووي من 4 شركات DNA و GEDmatch في تقرير واحد. هذا يوفر الوقت والطاقة للذهاب ذهابًا وإيابًا بين التقارير وجداول البيانات لمقارنة مقاطع الحمض النووي.

تم إعداد كل من أدوات AutoSegment و Hybrid AutoSegment للسماح & # 8220 بالتكامل السهل في موقع DNA Painter. & # 8221 واو ، لا يمكنني الانتظار لاستكشاف هذا أكثر ومشاركة النتائج معك!

جرب AutoSegment & # 8211 قد تكون أداة الاختراق التي تبحث عنها!


نتائج

المقاييس الريولوجية

في الرسم الدقيق للأمام ، تفاوت تأثير اللعاب على لزوجة النشا بين الأفراد من عدم التأثير تقريبًا إلى الانخفاض السريع في لزوجة النشا في غضون ثوانٍ. يصور الشكل 1 البيانات من أربعة موضوعات مع أعلى انخفاض عام في اللزوجة من 120 إلى 425 ثانية وأربعة مواضيع مع أقل التغييرات. لجميع المواد ، تمت إضافة 100 مايكرولتر من اللعاب الطازج إلى 100 جرام من النشا المبلل بنسبة 6٪ في الوقت "0". تتداخل منحنيات اضمحلال اللزوجة لمدة 10 ثوانٍ تقريبًا لجميع الأفراد ، مما يشير إلى أن الأميليز يتطلب خلطًا نشطًا ليصبح فعالاً. بعد الخلط ، كان نشاط amylolytic اللعابي فرديًا للغاية بين الموضوعات (انظر الجدول S1 في الملف S1). يوضح الشكل الداخلي في الشكل 1 منحنيات جميع الموضوعات لتوضيح النطاق الكامل للنشاط اللعابي.

يمثل هذا الرسم البياني الموضوعات الأربعة الأقل تغيرًا عامًا في اللزوجة (المنحنيات العلوية) والأربعة ذات أكبر تغيير إجمالي (المنحنيات السفلية). يوضح الرسم البياني الداخلي البيانات من جميع عينات اللعاب التي تم تحليلها في MVAG (العدد = 42). في كلا الرسمين البيانيين ، يتم تمثيل البيانات من كل موضوع بخط ملون مختلف. تمت إضافة 100 ميكرولتر من لعاب كل موضوع إلى 100 غرام من النشا عند 37.5 درجة مئوية. تمت إضافة اللعاب إلى النشا في وقت "0" وشكل ∼0.1٪ من محلول النشا.

مقاييس الأميليز اللعابية

تم استخدام التخمير المناعي والمقايسة الأنزيمية لتحديد كمية الأميليز / مل والنشاط / مل ، على التوالي ، في كل عينة من اللعاب. لاحظنا تباينًا كبيرًا بين الأفراد من حيث كمية ونشاط الأميليز المنتج لكل وحدة لعاب (الجدول S2 في الملف S1). كان متوسط ​​كمية (± SD) من الأميليز 2.64 مجم / مل (± 1.8) ، بنطاق من 0 إلى 7.5 مجم / مل ، بينما كان متوسط ​​التركيز في الدقيقة 5.7 مجم / دقيقة (± 7.1) (النطاق 0-42.8) ملغ / دقيقة). كان متوسط ​​النشاط لكل وحدة لعاب 93 وحدة / مل (± 62) ، تتراوح من 1 إلى 371 وحدة / مل.كان متوسط ​​النشاط في الدقيقة 177 U / min (± 166) ، مع نطاق من 2 إلى 900 U / min. لم يختلف الذكور والإناث بشكل كبير في كميات أو نشاط الأميليز.

جميع القياسات اللعابية الثلاثة (1. كمية الأميليز لكل مل من اللعاب ، 2. النشاط الأنزيمي لكل مل من اللعاب ، 3. تقليل لزوجة النشا بمقدار 100 ميكرولتر حقن اللعاب في MVAG) كانت مرتبطة بشكل كبير مع بعضها البعض. كانت العلاقة بين كمية الأميليز (ملغ / مل) وتغير اللزوجة الكلي في MVAG (الشكل 2 أ) ذات قيمة r 0.58 (P & lt0.0001) والعلاقة بين نشاط الأميليز (U / ml) والتغيير في MVAG (الشكل 2B) ) بقيمة r 0.67 (P & lt0.001). كما هو موضح في الشكل 2C ، كانت كمية ونشاط الأميليز مرتبطين بشكل كبير مع بعضهما البعض (r = 0.61 P & lt0.001) ، أيضًا.

ارتبط كل من كمية الأميليز اللعابية / مل (A) والنشاط اللعابي / مل (B) بشكل كبير بالتغير الكلي في اللزوجة المقاسة بواسطة MVAG. كما تم ربط كمية الأميليز اللعابية / مل والنشاط اللعابي / مل بشكل كبير مع بعضهما البعض (C). لاحظ أن عينات اللعاب التي تم تحليلها في MVAG (ن = 41) هي مجموعة فرعية من تلك العينات التي تم تحليلها بواسطة لطخة ويسترن والمقايسة الأنزيمية (ن = 73).

AMY1 رقم نسخة الجينات واللعاب الأميليز

تم جمع عينات الحمض النووي من 62 شخصًا وتحليلها بواسطة qPCR لتحديد عدد نسخ الجين. تم توحيد القيم لعينة DNA بشري معروف AMY1 تم التحقق من رقم نسخة الجين بواسطة Fiber FISH. متوسط ​​عدد AMY1 كانت نسخ الجينات أربع (متوسط ​​= 4.4 ± 2) ، مع نطاق من 1 إلى 11 (الجدول S2 في الملف S1). ارتبطت بشكل كبير كمية الأميليز اللعابية / مل ورقم نسخة الجين (r = 0.50 P & lt0.0001 الشكل 3). زاد نشاط الأميليز اللعابي / مل أيضًا مع زيادة عدد نسخ الجين (r = 0.52 P & lt0.0001) (غير موضح) ، بما يتوافق مع العلاقة بين تركيز الأميليز اللعابي ونشاط الإنزيم اللعابي (الشكل 2C).

كانت هناك علاقة إيجابية كبيرة بين AMY1 رقم نسخة ثنائية الصبغة وكمية الأميليز / مل (ن = 62).

تصور الفم عن اللزوجة

يتم عرض متوسط ​​وظائف اللزوجة المتصورة لشدة الوقت للمحفزات الثلاثة (النشا واللثة والماء) في الشكل 4 أ (انظر الجدول S3 في الملف S1 للحصول على البيانات). كما هو متوقع ، صنف الأشخاص الماء على أنه ذو لزوجة متصورة قريبة جدًا من الصفر ، والتي لم تتقلب خلال قياس 60 ثانية. بعد الوصول إلى الذروة ، انخفضت تصنيفات محفز صمغ الزانثان بشكل طفيف خلال الفترة التجريبية ، ويرجع ذلك على الأرجح إلى التخفيف الحجمي من الخلط اللعابي ، لكنها ظلت مستقرة بمرور الوقت. اقترح شكل منحنى تصنيف لزوجة النشا عملية من مرحلتين: مرحلة "خلط" أولية ، حيث يتلاعب الشخص بالبلعة في فمه ويخلطها مع اللعاب (في الشكل 4 أ ، حوالي 0-10 ثوانٍ) و a المرحلة الثانية من "النشاط amylolytic" التي تتميز بانخفاض متسارع سلبيًا في معدلات لزوجة النشا خلال الـ 50 ثانية المتبقية.

متوسط ​​درجات شدة الوقت للمنبهات الثلاثة (أ). كما يتضح من تصنيفات LMS من ستة أفراد (تم تصوير كل منهم بخط / شكل ملون مختلف) ، كانت الموضوعات متغيرة للغاية في استخدامهم لمقياس LMS عند تصنيف لزوجة النشا أثناء التجربة (B). تم تطبيع تصنيفات LMS إلى 100 في 5 ثوانٍ لإزالة الضوضاء الذاتية وتمكين مراقبة تأثيرات الأميليز على تصنيفات اللزوجة (C). لاحظ أن اللوحتين B و C تحتويان على بيانات تصنيف LMS من نفس الموضوعات الستة ، حيث يتم تمثيل كل فرد بنفس خط اللون في كل لوحة.

كانت هناك فروق فردية كبيرة في تصنيفات لزوجة النشا (الشكل 4 ب). لتقليل تأثير التصنيفات الذاتية ، تم تطبيع تصنيفات LMS إلى 100 ، بدءًا من 5 ثوانٍ في الوظيفة (الشكل 4C). تم تحليل البيانات على مدار الـ 55 ثانية المتبقية من خلال حساب 1) التغيير الإجمالي في التصنيفات من الذروة إلى الحضيض و 2) الوقت الذي وصل فيه المنحنى إلى تصنيف اللزوجة بعد الذروة لكل منحنى.

من أجل تقييم العلاقة بين كمية / نشاط الأميليز اللعابي خلال جلسة اختبار 60 ثانية وتصنيفات اللزوجة ، هتم تقسيم تركيز الإنزيم / دقيقة من تدفق اللعاب والنشاط / دقيقة التدفق إلى أرباع. الموضوعات التي تحتوي على تركيزات أعلى من الأميليز اللعابي (الشكل 5 أ) (F (3،69) = 2.28 ، P & lt0.05) والنشاط اللعابي (الشكل 5 ب) (F = 3.1 ، P & lt0.05) كان لها تغيرات إجمالية أكبر في لزوجة النشا المتصورة من الموضوعات مع انخفاض مستويات الانزيم. علاوة على ذلك ، أبلغت هذه الموضوعات أيضًا عن انخفاضات أسرع في اللزوجة على مدار الـ 60 ثانية التالية (الشكلان 5C و D) (F = 3.12 ، P & lt0.05 و 3.2 ، P & lt0.05 ، على التوالي). الأهم من ذلك ، لم تكن هناك علاقة ذات دلالة إحصائية بين التغير الكلي في اللزوجة التحفيز الضبط (صمغ الزانثان) ومستويات الأميليز (ملغم / دقيقة P = 0.64) أو النشاط (U / min P = 0.51) ، مما يدل على خصوصية إنزيم النشا. .

كانت الموضوعات التي تحتوي على تركيزات أعلى من الأميليز اللعابي / مل (أ) ونشاط اللعاب / مل (ب) تغيرات إجمالية أكبر في اللزوجة المتصورة. وصلت هذه الموضوعات أيضًا إلى مستويات اللزوجة المتصورة بشكل أسرع (C و D). يمثل الخط المتقطع داخل كل مربع القيمة المتوسطة ، بينما تمثل الحدود العليا والسفلى للمربع النسب المئوية 75 و 25 على التوالي. تشير أشرطة الخطأ الموجودة أعلى وأسفل المربع إلى النسب المئوية التسعين والعاشرة. تختلف النقاط ذات الأحرف المختلفة اختلافًا كبيرًا عن بعضها البعض. رباعيات مجم / دقيقة: 1 = 0-1.5 2 = 1.51-2.99 3 = 3-10 و 4 = & GT10 مجم / دقيقة. U / min الربيعية: 1 = 0–60 2 = 61–120 3 = 121–220 و 4 = & gt220 U / min.

ومن الجدير بالذكر أيضًا أن ملف في الجسم الحي كانت تصنيفات LMS لزوجة النشا عند 60 ثانية مرتبطة بشكل كبير بـ في المختبر قياسات اللزوجة من MVAG في 7 دقائق (r = 0.27 P & lt0.05). يسلط هذا الضوء على أن إدراك لزوجة النشا أثناء تكسيرها في الفم يرتبط ارتباطًا مباشرًا بنشاط الأميليز اللعابي على النشا ، نظرًا لأن هذا هو المتغير الوحيد الذي يتم قياسه بواسطة microviscoamylograph.

العلاقة بين AMY1 كما تم فحص رقم نسخة الجين وإدراك لزوجة النشا. لم يكن التغيير العام في اللزوجة المتصورة بمرور الوقت والوقت للوصول إلى اللزوجة المتصورة مرتبطين بشكل كبير بعدد نسخ الجينات في مجموعة البيانات هذه (P = 0.19 و P = 0.54 ، على التوالي) (غير معروض).


المقدمة

أنتجت جهود التسلسل الضخمة ، مثل جهود أطلس جينوم السرطان (TCGA) والاتحاد الدولي لجينوم السرطان (ICGC) ، مجموعة شاملة من الجينومات المتسلسلة لمرضى السرطان ، مما فتح حقبة جديدة لعلم الجينوم. تتطلب التحليلات المتقدمة لبيانات التسلسل الجينومي تقديرًا دقيقًا لخلوية الحمض النووي (النقاء ، 1 - خليط الحمض النووي) و ploidy الورم للسماح بإجراء حساب مقارن مناسب. يشير خليط الحمض النووي إلى كمية الخلايا غير السرطانية في عينة الورم ، بينما يمثل ploidy متوسط ​​عدد الكروموسوم الموجود في الخلية. الخلايا السليمة للإنسان ثنائية الصبغة ، في حين أن الخلايا السرطانية غالبًا ما تُظهر عددًا متغيرًا متغيرًا بشكل كبير ، اعتمادًا على نوع الورم (Chunduri & Storchova، 2019 Danielsen، Pradhan، & Novelli، 2016). لم يتضح بعد تأثير التغييرات الجذابة على تطور الورم والتشخيص ، لكن الدراسات الحديثة لعموم السرطان ألقت بعض الضوء على هذه المشكلة. في مجموعة أورام سرطانية أولية من مشروع TCGA ، تم تحرير تكاثر الخلايا والتهرب المناعي ، وهما سمتان مميزتان للسرطان ، في عينات عالية اختلال الصيغة الصبغية (Davoli، Uno، Wooten، Elledge، 2017 Taylor et al.، 2018). في مجموعة عموم السرطان المكونة من 9692 مريضًا يعانون من مرض متقدم ، ارتبط اختلال الصيغة الصبغية بضعف البقاء على قيد الحياة (بيلسكي وآخرون ، 2018).

سلطت مراجعة حديثة (Aran، Sirota، & Butte، 2015) الضوء على أهمية تقدير النقاء في تحليل بيانات التسلسل. على سبيل المثال ، تعتمد إعادة البناء الوراثي لتطور الورم من بيانات تسلسل الحمض النووي متعددة العينات من مريض واحد بشكل صارم على القياس الكمي للجزء الأليلي المتغير (VAF) لمتغيرات النوكليوتيدات المفردة (SNV) (Gundem et al. ، 2015) ، والتي تتأثر بواسطة كل من خليط الحمض النووي (الخلايا الطبيعية تضعف SNV VAFs) و ploidy (يزيد تعدد الصبغيات من العدد الإجمالي للأليلات) لكل عينة من الورم. تؤثر نفس المشكلات أيضًا على تحديد العدد المطلق لنسخ مقطع جينومي في عينة الورم (كارتر وآخرون ، 2012). تحدد العديد من الطرق الحسابية انحرافات رقم النسخ الجسدية من الكميات النسبية للحمض النووي في الورم وعينته الطبيعية المتطابقة ، لكن التقدير الدقيق للعدد الصحيح لنسخ كل أليل يتطلب نقاء وتعديلات بسيطة (باو ، بو ، وميسر ، 2014 ).

تستدعي هذه الاعتبارات تطوير أدوات حسابية لتقدير نقاء الورم وخطورته. في عصر ما قبل التسلسل ، تم تطوير العديد من الأدوات لبيانات مصفوفة تعدد الأشكال أحادية النوكليوتيدات عالية الكثافة (على سبيل المثال ، Carter et al. ، 2012 Van Loo et al. ، 2010) مع هذه ، عادةً الورم إلى- يتم تحليل نسبة تسجيل إشارة التحكم (يشار إليها فيما يلي بـ logR) ووفرة توزيعات الإشارة الخاصة بالأليل (تردد أليل B ، BAF) بشكل مشترك لاستنتاج خليط الحمض النووي والبلويد. ومع ذلك ، فإن الأدوات القائمة على المصفوفة محدودة بعدد القواعد الجينومية التي تم تقييمها (بشكل رئيسي في نطاق 0.5 مليون إلى 2 مليون موقع) وبنطاق الإشارة الديناميكي. تغلبت منصات التسلسل من الجيل التالي على هذه القيود مع الحفاظ على نفس ميزات البيانات لاستغلالها (Aran et al. ، 2015): الكسر الأليلي (AF) لمواقع SNP غير المتجانسة الموروثة (يُطلق عليها فيما بعد النيوكلوتايد بالمعلومات) وتغطية التسلسل تشبه بيانات BAF و logR لمصفوفات SNP ، على التوالي. البيانات الأكثر ثراءً من الناحية الإحصائية التي يوفرها التسلسل تجعل من الممكن إجراء تحليلات أكثر تعقيدًا مثل أرقام النسخ الخاصة بالأليل وتقديرات الاستنساخ.

بشكل عام ، الطرق المتاحة لتقدير خليط الحمض النووي والبلوي تتبنى نهجًا عالميًا ، ويتم استخدام توزيعات AFs وقيم logR معًا لاستنتاج خليط DNA و ploidy. حدسيًا ، من الواضح أن AF لـ SNPs بالمعلومات يتم توزيعها حول 0.5 في عينة الورم المختلطة بنسبة 100 ٪ (حتى التحيز المرجعي لرسم الخرائط Degner et al. ، 2009) ، و AFs المنخفضة تعني انخفاضًا في الحمض النووي. تُستخدم بيانات LogR كمتغير مشترك ، حيث يعتمد AF أيضًا على عدد الأليلات المتاحة. في حالة عدم وجود مجموعات سكانية فرعية من الخلايا السرطانية (أي ، إذا كان ملف تعريف رقم النسخ لعينة الورم متجانسة ، أي أن نسبة عمليات الحذف / التضخيم الفرعية منخفضة) ، فإن نهج الاستدلال العالمي يلتقط محتوى خليط الحمض النووي جيدًا. ومع ذلك ، في ظل وجود أحداث جينية معقدة ، مثل chromothripsis (Stephens et al. ، 2011) أو chromoplexy (Baca et al. ، 2013) ، أو بعد علاجات متعددة تنوع تعداد خلايا الورم ، فإن الأساليب العالمية هي دون المستوى الأمثل.

CLONET (CLONality Estimate in Tumor Prandi et al. ، 2014) هي أداة قائمة بذاتها مصممة خصيصًا مع نهج محلي لتقدير الاستنساخ للتعامل مع عينات الورم غير المتجانسة. باختصار ، ضع في اعتبارك عينة الورم T مع حذف hemizygous HeD ومجموعة من SNPs S بالمعلومات الموجودة داخل HeD. قيمة AF لـ SNPs في S هي التفاف AF لمجموعات الخلايا المختلفة التي تتكون منها T. إذا كان HeD فرعيًا (أي ، لا تحتوي جميع الخلايا السرطانية على هذا الحذف) ، فإن عينة الورم تتكون من ثلاث مجموعات خلايا رئيسية: (i) تساهم الخلايا غير الورمية في اختلاط الحمض النووي ، مع AFs المتوقعة لـ SNPs في S حول 0.5 (2) الخلايا السرطانية التي لا تحتوي على HeD ، بحيث لا يمكن تمييز AFs لـ SNPs في S عن تلك الموجودة في الخلايا غير الورمية و (3) الورم الخلايا التي تحتوي على HeD ، حيث يمكن أن يكون AF مساويًا لـ 1 (إذا كان الأليل المحذوف يؤوي القاعدة البديلة) أو 0 (إذا كان الأليل المحذوف يؤوي الأليل المرجعي). استنادًا إلى الملاحظة التي تشير إلى أن الاختلاط الظاهر للحمض النووي يكون أعلى في عمليات الحذف تحت النسيلي مقارنةً بالحذف النسيلي ، يقدِّر CLONET خليط الحمض النووي في كل عملية حذف دموي ثم يحدد معظم عمليات الحذف النسيلي لتعيين عينة خليط الحمض النووي أخيرًا. ينتج عن هذا تقدير أكثر دقة لمزيج الحمض النووي ، والذي كان من الممكن المبالغة في تقديره ، في الأورام التي تحتوي على جزء كبير من عمليات الحذف الفرعية.

نقدم هنا الإصدار 2 من CLONET (CLONETv2) ، حزمة R (R Core Team ، 2017) المتوفرة في شبكة أرشيف R الشاملة (https://cran.r-project.org/) والتي تتضمن تحسينات كبيرة على CLONET الأصلي تطبيق. هذا هو نتيجة تطبيقه على العديد من المجموعات السريرية ، بما في ذلك عينات الأنسجة والبلازما ، وعلى مجموعة متنوعة من منصات التسلسل ، مثل الجينوم الكامل ، والإكسوم الكامل ، ولوحات التسلسل المستهدفة. في كاريرا وآخرون. (2014) ، تم استخدام CLONET لتقدير خليط الحمض النووي من لوحة تسلسل مخصصة من 40 كيلو بايت مصممة لتحليل الحمض النووي للورم المتداول لعينات البلازما من مرضى النقائل ، وتم تعديل الخوارزمية لتحسين الحساسية في العينات مع & lt10٪ الخلايا السرطانية. في بيلتران وآخرون. (2016) ، تم تمديد CLONET لتوفير بيانات رقم النسخ الخاصة بالأليل من تجارب تسلسل exome الكامل لكل مقطع جينومي في كل ورم أترابي الدراسة ، وتشير الدراسة إلى عدد نسخ كل أليل باستخدام ploidy ، خليط الحمض النووي ، السجل ، و AF بالمعلومات SNPs. في فالتاس وآخرون. (2016) ، تم تحسين قدرة تحليل clonality لـ CLONET لحساب مجموعات معقدة خاصة بالأليل و SNVs. منذ تصوره الأولي وتطبيقه على بيانات تسلسل الجينوم الكامل (Baca et al. ، 2013 Prandi et al. ، 2014) ، تم استخدام تحسينات CLONET في العديد من الدراسات (بما في ذلك بيلتران وآخرون ، 2015 Boysen et al. ، 2015 Cancer شبكة أبحاث أطلس الجينوم ، 2015 و Mu et al. ، 2017). هنا ، نقدم نسخة موثقة من CLONETv2 لتسليط الضوء بشكل موحد على ميزات النهج واقتراحها كحزمة R لإتاحة الأداة لجمهور أوسع.

كل ما يقرأ عن تجربة تسلسل الجيل التالي للحمض النووي البشري التي ترسم خريطة داخل مقطع جيني مستمدة من أحد كروموسومات الوالدين الأصلية. يمكن تقسيم القراءات إلى مجموعتين: أ عدد النسخ محايد المجموعة التي تحتوي على أعداد متساوية من القراءات من كروموسومات الأم والأب ، و قراءات نشطة المجموعة التي تتضمن تسلسلات من والد واحد فقط. بشكل عام ، بالنظر إلى قراءتين عشوائيتين ، من المستحيل تحديد ما إذا كانت تمثل نفس الأليل أم لا ، ومع ذلك ، إذا كانت القراءةتان تمتدان على SNP بالمعلومات ، فيمكن تحديد أليل الأصل. للقراءات على تعدد الأشكال بالمعلومات ، فإن عدد القراءات (التغطية المحلية) التي تدعم المرجع أو البديل SNP يمثل عدد النسخ وأصل الأليلات الموجودة في عينة الورم. يمكن تمييز كل SNP بالمعلومات من خلال الجزء الأليلي (AF) ، والذي يعتمد على السياق الجيني. على سبيل المثال ، دعونا نفكر في تعدد الأشكال بالمعلومات ضمن حذف أحادي الموازي للجزء الجينومي المشار إليه في الشكل 1 أ. في الموضع ص1، فقط الأليل البديل موجود و AF = 1 ، بينما في الموضع pن، يتم حذف الأليل البديل و AF = 0. على النقيض من ذلك ، في المقطع الجينومي من النوع البري B ، قيم AF من SNPs بالمعلومات في المواضع pن+1 و صم يتم توزيع حوالي 0.5 ، حيث يساهم كلا الأليلين بالتساوي في التغطية المحلية. الآن ، النسبة المئوية للقراءات المحايدة (المعروفة باسم بيتا ، β) عند p1 و صن يساوي 0 ، بغض النظر عن الأليل المحذوف ، بينما في المواضع الجينومية من النوع البري ، pن+1 و صم كل 1 تقريبي ، حيث لا توجد قراءات نشطة. بشكل عام ، من الأسهل توصيف SNPs داخل المقاطع الشاذة جسديًا باستخدام قيم بيتا مقارنةً بـ AFs ، حيث أن الأول مستقل عن الأليل المحذوف. في عينة الورم غير المتجانسة ، تنتج توزيعات AF و beta عن التفاف التوزيع الذي لوحظ في المقاطع الأساسية المحذوفة من النوع البري والنوع الأحادي. كمثال ، يوضح الشكل 1 ب توزيع AF والبيتا المرتبطة بالمعلومات SNPs في الأجزاء الجينومية A و B في حالة الخلية الطبيعية ، بينما يوضح الشكلان 1C و 1 D كيف تتغير التوزيعات في الخلايا السرطانية مع الحذف أحادي الموازي للقطعة الجينومية A فقط ، أو من كل من A و B على التوالي. يمثل الشكل 1E حالة عينة الورم مع خلية طبيعية واحدة (الشكل 1 ب) وتسع خلايا سرطانية 1 (الشكل 1 ج). خليط الحمض النووي هو 1/10 ، ويمكن أن يفترض AF القيم حول 1/11 أو 10/11 ، في حين أن بيتا هي 2/11. لا يتم حذف المقطع الجينومي B ، وبالتالي فإن AF و beta هما كما في الخلية العادية. يمثل الشكل 1F حالة أكثر تعقيدًا تتضمن خلية طبيعية واحدة (الشكل 1 ب) ، وثلاث "خلايا ورمية 1" (الشكل 1 ج) ، وستة "خلايا ورمية 2" (الشكل 1 د). إن AF و beta من SNPs بالمعلومات في المقطع الجيني A كما في الشكل 1E ، لكن الخلايا السرطانية الست فقط تحمل الحذف أحادي الموازي للجزء الجينومي B. في هذه الحالة ، تتمركز أوضاع توزيع AF في 4/14 و 10 / 14 ، اعتمادًا على القاعدة المستنفدة ، في حين أن بيتا هي 8/14. وصف براندي وآخرون التوصيف الكامل للبيتا. (2014) ، وفي بيلتران وآخرون. (2016) حددنا معادلات CLONET الرئيسية التي تصف عدد النسخ الخاصة بالأليل من الأليلات الأم والأب ، cnM و cnP ، كدالة للنسبة المئوية للقراءات المحايدة بيتا ، السجل2 قيم النسبة المعدلة بواسطة ploidy logRp ، ومزيج الحمض النووي جي، كما:

(1)

حيث يتم تعيين أليل الأم والأب بشكل تعسفي. الشكل 2 يرسم تحول السجل2 مساحة النسبة التي تنطوي عليها المعادلة 1. يوضح الشكل 2A الرسم البياني للسجل2 إشارة النسبة في عينة الورم: تتوافق القمم في التوزيع مع حالات عدد النسخ المختلفة ، في حين أن الانحرافات عن موضع القمم المتوقعة (أدناه) تعتمد على قيم خليط الحمض النووي والبلوي. من الصعب تحديد الذروة التي تتوافق مع مقاطع من النوع البري باستخدام السجل فقط2 إشارة النسبة. عندما نقوم بتوسيع مساحة السجل أحادي البعد باستخدام بيتا (الشكل 2 ب) ، فإن المقاطع التي تساهم في نفس الذروة على طول بُعد logR تشكل مجموعات مختلفة في مساحة بيتا مقابل سجل آر. من الجدير بالذكر أن مؤامرة بيتا مقابل سجل R لا تزال تعكس خليط الحمض النووي والبلوي ، في حين أن مساحة cnM و cnP (انظر المعادلة 1) تسمح بتفسير مباشر لعدد النسخ وحالة الاستنساخ لكل مقطع جينومي.

  1. seg_tb: جدول ناتج عن تجزئة الحمض النووي لكل قطعة جينومية ، ويبلغ الجدول عن الكروموسوم وموضع البداية / النهاية والسجل2 نسبة الورم إلى التغطية الطبيعية ، كما هو محدد في خوارزمية التجزئة الثنائية الدائرية (Olshen، Venkatraman، Lucito، & Wigler، 2004)
  2. pileup_normal، pileup_tumor: جدولان يبلغان عن الكسر الأليلي وتغطية تعدد الأشكال في عينات الورم الطبيعية والمتطابقة ، على التوالي لكل SNP ، كل جدول يبلغ عن إحداثيات جينومية (كروموسوم وموضع) ، وكسر أليلي ، وتغطية
  3. min_af_het_snps ، max_af_het_snps: لكل SNP في الجدول pileup_normal ، قم بتعيين الحد الأدنى والحد الأقصى للكسر الأليلي للنظر في SNP كمعلومات
  4. min_required_snps: الحد الأدنى لعدد تعدد الأشكال بالمعلومات في مقطع جينومي من seg_tb للاحتفاظ بالقطاع
  5. min_coverage: الحد الأدنى لتغطية متوسط ​​تعدد الأشكال بالمعلومات للاحتفاظ بقطاع.
  1. بيتا: القيمة المقدرة لمقطع الإدخال
  2. nsnps: عدد تعدد الأشكال بالمعلومات في مقطع الإدخال
  3. cov: يعني تغطية تعدد الأشكال بالمعلومات في قطاع الإدخال
  4. n_beta: القيمة المقدرة لمقطع الإدخال مع الأخذ في الاعتبار العينة العادية المتطابقة. من المتوقع أن تكون هذه القيمة 1 ، إلا في حالة تباين رقم نسخة السلالة الجرثومية أو الأخطاء المتعلقة بالتسلسل.
  1. عدد الأجزاء المعالجة: عدد الأجزاء في جدول seg_tb الإدخال
  2. عدد المقاطع مع تقدير بيتا صالح: مقاطع إدخال الأرقام التي يتم حساب قيمة بيتا من أجلها ، تتأثر هذه القيمة بعدد تعدد الأشكال بالمعلومات وتغطيتها المتوسطة
  3. كميات أطوال جزء الإدخال: الكميات لتوزيع طول مقاطع الإدخال ، يعتمد التوزيع المتوقع على خوارزمية التجزئة المستخدمة لإنتاج جدول seg_tb ، ولكن بشكل عام تؤدي القيم الصغيرة إلى عدد قليل من تعدد الأشكال بالمعلومات ، في حين أن الشرائح الكبيرة قد يشير إلى التقسيم الناقص الذي يؤثر بدوره على تقديرات بيتا
  4. مقاييس تغطية شريحة إدخال تعدد الأشكال بالمعلومات: تعتمد مقادير توزيع التغطية المتوسطة لقطاعات الإدخال على تجربة التسلسل ، ولكن قد تشير القيمة المنخفضة إلى مشاكل في عينة الإدخال
  5. كميات عدد تعدد الأشكال بالمعلومات لكل جزء إدخال: كميات توزيع عدد تعدد الأشكال بالمعلومات في قطاعات الإدخال العدد المتوقع من تعدد الأشكال بالمعلومات لكل كيلو بايت هو 0.33 (بناءً على تعدد الأشكال المشترك) ، وبالتالي ، هذه القيمة مجتمعة مع المدخلات تعطي أطوال المقطع معلومات حول جودة البيانات المتراكمة.

الموارد اللازمة

المعدات

كمبيوتر 64 بت يعمل بنظام Linux مع 8 جيجابايت من ذاكرة الوصول العشوائي

برمجة

تم اختبار المكتبة باستخدام R الإصدار 3.5.2 ومكتبات R المتوازية 3.5.2 و ggplot2 3.1.0 والمجموعات 1.0-18 و arules 1.6-3 و ggrepel 0.8.0

1. قم بإعداد pileups الورمية والطبيعية كما هو موضح في بروتوكول الدعم 1 أو مع الأدوات الحسابية الأخرى. يتكون ناتج هذه الخطوة من ملفين ، ورم.

2. قم بإعداد بيانات مجزأة عن الورم في ملف tumor_segments.txt باستخدام أعمدة متوافقة مع المعلمة seg_tb الموضحة أعلاه.

  • & gt seg_tb & lt- read.table (system.file (“sample.seg”، package = “CLONETv2”)، header = T، as.is = T)
  • & gt pileup_tumor & lt- read.table (system.file (“sample_tumor_pileup.tsv” ، package = “CLONETv2”) ، header = T ، as.is = T)
  • & gt pileup_normal & lt- read.table (system.file (“sample_normal_pileup.tsv” ، package = “CLONETv2”) ، header = T ، as.is = T)
  • جدول تجريبي محسوب لعينة "نموذج 1"
  • عدد الشرائح المعالجة: 65
  • عدد الأجزاء التي تحتوي على نسخة تجريبية صالحة: 49 (75٪)
  • كميات أطوال جزء الإدخال:
    • 0%: 2860
    • 25%: 17504185
    • 50%: 38004799
    • 75%: 59311449
    • 100%: 147311449
    • 0%: 47.0000
    • 25%: 137.7893
    • 50%: 168.3820
    • 75%: 186.6769
    • 100%: 695.6145
    • 0%: 0
    • 25%: 12
    • 50%: 99
    • 75%: 213
    • 100%: 404

    يصف هذا البروتوكول الخطوات المستخدمة لإعداد البيانات المتراكمة من مجموعة من SNPs والأورام المتطابقة وملفات BAM (BAM) العادية (Li et al. ، 2009). تشير الجداول pileup_normal و pileup_tumor إلى الكسر الأليلي والتغطية لمجموعة من مواضع SNP. يمكن تنزيل مواقع SNP المرشحة مباشرة من خادم dbSNP FTP (ftp://ftp.ncbi.nlm.nih.gov/snp/). نقترح البدء من أكبر مجموعة ممكنة من تعدد الأشكال ، فكلما زاد عدد تعدد الأشكال بالمعلومات ، كانت تقديرات CLONETv2 أكثر موثوقية. يمكن الحصول على Pileups من ملفات BAM باستخدام أي من الأدوات المتعددة. هنا نصف كيفية تحضير pileups باستخدام ASEQ (Romanel، Lago، Prandi، Sboner، & Demichelis، 2015) ، وهي أداة متاحة مجانًا على http://demichelislab.eu/tools/ASEQ.

    الموارد اللازمة

    المعدات

    كمبيوتر 64 بت يعمل بنظام Linux مع 8 جيجابايت من ذاكرة الوصول العشوائي

    برمجة

    ملفات الإدخال

    • ملفات BAM tumor.bam و normal.bam تحتوي على قراءات متطابقة من تجارب التسلسل الجيني للورم المتطابق وعينات الحمض النووي الطبيعية ، على التوالي
    • VCF (Degner et al.، 2009) file known_snp_positions.vcf الذي يبلغ عن مواضع SNP المعروفة يتطلب ASEQ أن يسرد VCF المدخلات SNPs فقط ، أي أن الأعمدة ALT و REF يجب أن تحتوي على إحدى القيم A أو C أو G أو T. يشمل:
    1. mrq: الحد الأدنى من جودة القراءة (لا يعتبر ASEQ جزءًا من القراءات المتراكمة بجودة القراءة & lt mrq)
    2. mbq: الحد الأدنى من الجودة الأساسية (لا يعتبر ASEQ جزءًا من قواعد pileup مع الجودة & lt mbq)
    3. mdc: الحد الأدنى لعمق التغطية (يخرج ASEQ فقط من المواقع ذات التغطية ≥ mdc)
    4. الخيوط: عدد الخيوط المتاحة لحساب ASEQ.

    سيكون كود ASEQ متاحًا في ثنائيات المجلد الفرعي / linux64 /.

    ستتوفر أمثلة ASEQ في أمثلة المجلد الفرعي / VCF_samples /.

    • $. / binaries / linux64 / وضع ASEQ = PILEUP vcf = أمثلة / VCF_samples / sample1.vcf bam = أمثلة / BAM_samples / sample1.bam mbq = 20 mrq = 20 mdc = 1 خيوط = 1 خارج =.

    ينتج ASEQ الملف sample1.PILEUP.ASEQ ، والإبلاغ عن الكسر الأليلي وقراءة التغطية من ملف BAM sample1.bam ، لكل موضع في ملف VCF sample1.vcf. المعلمتان mbq = 20 و mrq = 20 تطلبان من ASEQ أن يتجاهل ، على التوالي ، القواعد والقراءات بجودة & lt20. ترشد المعلمة mdc = 1 ASEQ إلى تجاهل المواضع في ملف BAM بدون قراءات. المعلمات وتنسيق ملف الإخراج .PILEUP.ASEQ متوافقة مع البيانات pileup المطلوبة في Basic Protocol 1.

    تقوم خوارزميات التجزئة بتقسيم المساحة الجينومية المدخلة إلى أجزاء ذات تغطية متجانسة. بالنظر إلى زوج من الورم المتطابق والعينات الطبيعية ، فإن قيمة السجل الجيني للقطعة الجينية هي السجل2 من النسبة بين تغطية الورم وتغطية العينة الطبيعية داخل المقطع. لحساب متوسط ​​التغطية المختلفة في تجارب التسلسل المختلفة ، يتم تطبيع السجل على النسبة بين الورم المتوسط ​​والتغطية الطبيعية المتوسطة ، وهذا ينطبق على كل من بيانات الجينوم الكامل والإكسوم الكامل. في حالة وجود تغطية أعلى في عينة الورم ، إذا لم يكن هناك تطبيع ، فإن النسبة بين متوسط ​​الورم والتغطية الطبيعية المتوسطة هي X، سيكون مقطع من النوع البري logR = log2(X) ، في حين أن القيمة المتوقعة هي 0 (أي نفس عدد الأليلات بين عينات الورم والعينات الطبيعية). ومع ذلك ، قد يؤدي التطبيع إلى حدوث تحيز عندما يكون الاختلاف في متوسط ​​التغطية بين الورم والعينة الطبيعية ناتجًا عن وجود عدد غير طبيعي من الأليلات في جينوم الورم (اختلال الصيغة الصبغية). في هذه الحالة ، يؤدي التطبيع إلى تحول في إشارة تسجيل الدخول. يوضح الشكل 3 أ مثالًا لعينة جينوم ثنائية الصبغيات مع الورم المتوسط ​​127 × و 69 × والتغطية الطبيعية ، على التوالي. تتركز إشارة السجل على 0 ، كما هو متوقع (الخط الأخضر). يسلط الشكل 3 ب الضوء على حالة أكثر تعقيدًا: الورم والتغطية المتوسطة العادية قابلة للمقارنة (125 × و 117 × ، على التوالي) ، ولكن يتم تغيير موضع الأجزاء البرية (الخط البرتقالي) فيما يتعلق بالقيمة المتوقعة (الخط الأخضر) . يمثل التحول العدد الإجمالي للأليلات في الجينوم ، ويمكن تقدير البلاويد على النحو التالي:

    (2)

    تم الإبلاغ عن الإثبات (المعادلة 2) في الورقة التي تصف في الأصل CLONET (براندي وآخرون ، 2014). يحتوي المثال في الشكل 3 أ على تحول في السجل R بمقدار 0 و ploidy من 2 ، في حين أن المثال في الشكل 3B يحتوي على تحول في logR يبلغ -0.34 و ploidy 2.53.

    1. beta_table: جدول تم إنشاؤه باستخدام الوظيفة الموضحة في البروتوكول الأساسي 1
    2. max_homo_dels_fraction (الافتراضي 0.05): يمكن أن توفر عمليات الحذف متماثلة اللواقح عاملاً مربكًا في تحديد ploidy للعينة ، تحدد المعلمة نسبة مئوية من المقاطع الجينومية التي لن تُستخدم لحساب ploidy كحذف متماثل الزيجوت المفترض ، ولا يؤثر المبالغة في تقدير هذه القيمة على حساب ploidy
    3. beta_limit_for_neutral_reads (الافتراضي 0.90): من الناحية النظرية ، تتوافق القراءات المحايدة مع بيتا = 1 ، لكن الضوضاء التجريبية تقلل هذه القيمة ، لذلك تُستخدم فقط المقاطع التي تحتوي على بيتا أعلى من الحد لحساب ploidy
    4. min_coverage (الافتراضي 20): يتم استخدام الأجزاء الجينومية فقط ذات التغطية المتوسطة على الأقل min_coverage لحساب خليط الحمض النووي
    5. min_required_snps (الافتراضي 10): تعتبر الأجزاء الجينومية التي تغطي على الأقل min_required_snps SNPs مفيدة لحساب خليط الحمض النووي.

    ترجع الدالة ploidy لعينة الإدخال.

    الموارد اللازمة

    المعدات

    كمبيوتر 64 بت يعمل بنظام Linux مع 4 جيجابايت من ذاكرة الوصول العشوائي

    برمجة

    تم اختبار المكتبة باستخدام R الإصدار 3.5.2 و R مكتبات متوازية 3.5.2 ، ggplot2 3.1.0 ، مجموعات 1.0-18 ، arules 1.6-3 ، ggrepel 0.8.0.

    2. حساب جدول بيتا كما هو موضح في البروتوكول الأساسي 1.

    3: حساب ADMIXTURE DNA

    1. beta_table: جدول تم إنشاؤه باستخدام الوظيفة الموضحة في البروتوكول الأساسي 1
    2. ploidy_table: جدول تم إنشاؤه باستخدام الوظيفة الموضحة في البروتوكول الأساسي 2
    3. min_coverage (الافتراضي 20): يتم استخدام الأجزاء الجينومية فقط ذات التغطية المتوسطة على الأقل min_coverage لحساب خليط الحمض النووي
    4. min_required_snps (الافتراضي 10): تعتبر الأجزاء الجينومية التي تغطي على الأقل min_required_snps تعدد أشكال SNPs مفيدة لحساب خليط الحمض النووي
    5. error_tb: يؤثر عدد تعدد الأشكال بالمعلومات وتغطية المقطع المدروس على دقة تقدير بيتا للجينوم. تقارير الجدول error_tb ، لكل مجموعة من عدد النيوكلوتايد المفيد والتغطية ، الخطأ المتوقع حول تقدير بيتا. يدمج CLONETv2 خطأ محسوبًا مسبقًا (التفاصيل في Prandi وآخرون ، 2014) تم اختباره مسبقًا في العديد من الدراسات (بيلتران وآخرون ، 2015 بيلتران وآخرون ، 2016 فالتاس وآخرون ، 2016). ومع ذلك ، قد تتطلب إعدادات تجريبية محددة ، مثل التسلسل شديد العمق أو تسلسل الجينوم الكامل منخفض التمرير ، جدول خطأ مخصص.

    تقوم الوظيفة بإرجاع خليط الحمض النووي المقدّر لعينة الإدخال بالإضافة إلى الحد الأدنى والحد الأقصى لقيم خليط الحمض النووي التي تمثل أخطاء حول تقديرات بيتا.

    الموارد اللازمة

    المعدات

    كمبيوتر 64 بت يعمل بنظام Linux مع 4 جيجابايت من ذاكرة الوصول العشوائي

    برمجة

    تم اختبار المكتبة باستخدام R الإصدار 3.5.2 ومكتبات R المتوازية 3.5.2 و ggplot2 3.1.0 والمجموعات 1.0-18 و arules 1.6-3 و ggrepel 0.8.0

    2. حساب جدول بيتا كما هو موضح في البروتوكول الأساسي 1.

    3. حساب جدول ploidy كما هو موضح في البروتوكول الأساسي 2.

    2: تصوير وتفسير طاولة BETA و PLOIDY و DNA ADMIXTURE

    يصف البروتوكول الأساسي 1 كيفية اشتقاق قيمة بيتا لمقطع جينومي. يتم بعد ذلك وصف عينة الورم على أنها مجموعة من القيم (بيتا ، logR) التي تعمل على توسيع مساحة السجل المعتادة وتمكين حساب خليط الحمض النووي والبلوي في البروتوكولين الأساسيين 2 و 3 ، على التوالي. للمساعدة في تفسير نتائج البروتوكولات الأساسية من 1 إلى 3 ، يوفر CLONETv2 الوظيفة check_ploidy_and_admixture التي ترسم مساحة بيتا مقابل سجل آر لعينات معينة. يوضح الشكل 4 أ و 4 ب قيم بيتا مقابل السجل لنفس العينات المعروضة في الشكل 3 أ و ب, على التوالى. لكل مقطع جيني ، تُبلغ المؤامرة السجل وكذلك الإصدار التجريبي المحسوب بواسطة الوظيفة compute_beta_table. لمساعدة المستخدم ، تتنبأ الوظيفة (beta ، logR) بالتوقع (beta ، logR) نظرًا لمستوى إدخال ploidy وخلط الحمض النووي وفقًا للمعادلات الموضحة في ورقة CLONET (Prandi et al. ، 2014). يتم حساب القيم المتنبأ بها لمجموعات مختلفة من أرقام النسخ الخاصة بالأليل (انظر البروتوكول الأساسي 4) ويتم تمثيلها كدوائر حمراء. تساعد مقارنة القيم المتوقعة (الدوائر الحمراء) والقيم (النقاط الرمادية) في تفسير التقديرات. على سبيل المثال ، لا يمكن أن تكون المقاطع التي تحتوي على logR بالقرب من 0 في الشكل 3B من النوع البري ، لأن بيتا بها هي ∼0.8 ، وهي قيمة متوافقة مع وجود ثلاث نسخ من الحمض النووي.

    الموارد اللازمة

    المعدات

    كمبيوتر 64 بت يعمل بنظام Linux مع 4 جيجابايت من ذاكرة الوصول العشوائي

    برمجة

    تم اختبار المكتبة باستخدام R الإصدار 3.5.2 ومكتبات R المتوازية 3.5.2 و ggplot2 3.1.0 والمجموعات 1.0-18 و arules 1.6-3 و ggrepel 0.8.0

    2. اتبع البروتوكولات الأساسية 1 و 2 و 3 لحساب جدول بيتا bt ، الجدول ploidy pl ، وجدول خليط الحمض النووي adm ، على التوالي.

    check_plot هو كائن ggplot (Wickham ، 2009) يمكن للمستخدم تخصيصه (على سبيل المثال ، لحجم الخط واللون وعرض الخط).

    4: الحوسبة رقم نسخ محدد

    1. beta_table: جدول تم إنشاؤه باستخدام دالة bt الموضحة في البروتوكول الأساسي 1
    2. ploidy_table: جدول تم إنشاؤه باستخدام وظيفة pl الموضحة في البروتوكول الأساسي 2
    3. admixture_table: جدول تم إنشاؤه باستخدام وظيفة adm الموضحة في البروتوكول الأساسي 3
    4. error_tb: نفس error_tb المستخدمة في الوظيفة compute_dna_admixture من البروتوكول الأساسي 3 ، الخطوة 4
    5. allelic_imbalance_th (افتراضي 0.5): الدالة compute_allele_specific_scna_table ترجع أيضًا قيمًا صحيحة cnA.int و cnB.int لـ cnA و cnB ، على التوالي. القيمة cnA.int هي القيمة المقربة لـ cnA if | cnA.int - cnA | & lt allelic_imbalance_th وإلا لم يتم تعريف cnA.int. تم تعريف cnB.int بالمثل فيما يتعلق بـ cnB.

    1. log2.corr: قيمة logR تم تعديلها من خلال ploidy والنقاء: أي قيمة logR التي سيحصل عليها المقطع في عينة ورم نقي بنسبة 100٪ ثنائية الصبغيات
    2. cnA و cnB: عدد نسخ الأليل الرئيسي (cnA) والثانوي (cnB) لا تحتوي القيم على معلومات حول ploidy والنقاء - في الواقع ، cnA + cnB تساوي 2 × 2 log2.corr
    3. cnA.int، cnB.int: عدد صحيح من نسخ الأليلات الرئيسية والثانوية على التوالي.

    الموارد اللازمة

    المعدات

    كمبيوتر 64 بت يعمل بنظام Linux مع 4 جيجابايت من ذاكرة الوصول العشوائي

    برمجة

    تم اختبار المكتبة باستخدام R الإصدار 3.5.2 ومكتبات R المتوازية 3.5.2 و ggplot2 3.1.0 والمجموعات 1.0-18 و arules 1.6-3 و ggrepel 0.8.0

    2. اتبع البروتوكولات الأساسية 1 و 2 و 3 لحساب جدول بيتا bt ، الجدول ploidy pl ، وجدول خليط الحمض النووي adm ، على التوالي.

    5: حساب استنساخ رقم النسخ SOMATIC

    1. beta_table: جدول تم إنشاؤه باستخدام الوظيفة الموضحة في البروتوكول الأساسي 1
    2. ploidy_table: جدول تم إنشاؤه باستخدام الوظيفة الموضحة في البروتوكول الأساسي 2
    3. admixture_table: جدول تم إنشاؤه باستخدام الوظيفة الموضحة في البروتوكول الأساسي 3
    4. error_tb: يتم نشر نفس error_tb المستخدمة في دالة compute_dna_admixture من بروتوكول Basic Protocol 3 حول بيتا لتقدير الاستنساخ واستخدامها في تقديرها
    5. clonality_threshold (افتراضي = 0.85): الدالة compute_scna_clonality_table ترجع الحد الأدنى والحد الأقصى للنسخة لمقاطع جينوم الإدخال clonality_threshold لتقدير الاستنساخ كما وصفه براندي وآخرون. (2014)
    6. beta_threshold (افتراضي = 0.9): قيم بيتا المدخلة التي تقل عن حد beta_theshold يتم تمييزها على أنها قد تكون شاذة وتستخدم لتقديرات الاستنساخ.

    1. الاستنساخ: القيمة الحقيقية التي تمثل النسبة المئوية المقدرة للخلايا السرطانية مع رقم نسخة موحد لقطعة جينومية معينة
    2. clonality.min، clonality.max: القيم الحقيقية التي تمثل الحد الأدنى والحد الأقصى للنسخة المقدرة بالنظر إلى توزيع قيم بيتا وسجل آر
    3. clonality.status: استنساخ متقطع.

    الموارد اللازمة

    المعدات

    كمبيوتر 64 بت يعمل بنظام Linux مع 4 جيجابايت من ذاكرة الوصول العشوائي

    برمجة

    تم اختبار المكتبة باستخدام R الإصدار 3.5.2 ومكتبات R المتوازية 3.5.2 و ggplot2 3.1.0 والمجموعات 1.0-18 و arules 1.6-3 و ggrepel 0.8.0

    2. اتبع البروتوكولات الأساسية 1 و 2 و 3 لحساب جدول بيتا bt ، الجدول ploidy pl ، وجدول خليط الحمض النووي adm ، على التوالي.

    6: حوسبة استنساخ وحيد النيوكليوتيد

    1. snv_read_count: جدول يُبلغ في كل صف عن الإحداثيات الجينية لـ SNV مع أرقام المراجع والقراءات البديلة التي تغطي الموضع المتحور
    2. beta_table: جدول تم إنشاؤه باستخدام الوظيفة الموضحة في البروتوكول الأساسي 1
    3. ploidy_table: جدول تم إنشاؤه باستخدام الوظيفة الموضحة في البروتوكول الأساسي 2
    4. admixture_table: جدول تم إنشاؤه باستخدام الوظيفة الموضحة في البروتوكول الأساسي 3
    5. error_tb: يتم نشر نفس error_tb المستخدم في دالة compute_dna_admixture من بروتوكول Basic Protocol 3 حول بيتا لتقييم حدود الاستنساخ ويستخدم بدوره لتقديره
    6. error_rate (الافتراضي = 0.05): جزء من SNVs المراد استبعاده بناءً على توزيع VAF المعدل.

    1. cnA ، cnB: أرقام النسخ الخاصة بالأليل للجزء الجينومي الذي يحتوي على SNV
    2. t_af_corr: تم تعديل الورم VAF من أجل رقم النسخ الخاص بالأليل والخلط والخلط
    3. استنساخ SNV: النسبة المئوية للخلايا السرطانية التي تؤوي SNV
    4. SNV.clonality.status: SNV.clonality المنفصل.

    الموارد اللازمة

    المعدات

    كمبيوتر 64 بت يعمل بنظام Linux مع 4 جيجابايت من ذاكرة الوصول العشوائي

    برمجة

    تم اختبار المكتبة باستخدام R الإصدار 3.5.2 ومكتبات R المتوازية 3.5.2 و ggplot2 3.1.0 والمجموعات 1.0-18 و arules 1.6-3 و ggrepel 0.8.0

    2. اتبع البروتوكولات الأساسية 1 و 2 و 3 لحساب جدول بيتا bt ، الجدول ploidy pl ، وجدول خليط الحمض النووي adm ، على التوالي.

    • & gt read.table (system.file ("sample_snv_read_count.tsv" ، الحزمة = "CLONETv2") ، header = T ، as.is = T ، comment.char = "" ، check.names = F ، na.strings = " - ")

    فقدان الجنين

    34.3.2 نمط تشوهات الكروموسومات التي تظهر في الحمل المجهض

    الغالبية العظمى من تشوهات الكروموسومات التي لوحظت في الأجنة المجهضة التي تم تقييمها بواسطة G-banding هي عددية ، بما في ذلك التثلث الصبغي الجسدي ، وتعدد الصبغيات ، والكروموسوم الجنسي ، والتثلث الصبغي المزدوج (26). دراسة عام 2009 ، تجمع بين G-banding و MLPA و aCGH (27) في 115 حالة إجهاض في الثلث الأول من الحمل ، وجدت أن 69 حالة (60٪) غير طبيعية من الناحية الصبغية. من بين هؤلاء ، كان 69 ٪ لديهم تثلث صبغي جسدي (بما في ذلك 2 ٪ مع تثلث صبغي مزدوج) ، و 12 ٪ كان متعدد الصيغ الصبغية (ثلاثي الصبغيات بشكل أساسي) ، و 10 ٪ كان لديهم كروموسوم جنسي أحادي (45 ، X) ، مع 1 ٪ فقط تظهر تشوهات هيكلية والباقي يظهر أخطاء لا تتضمن كروموسومات كاملة ، مثل الازدواجية أو الحذف. تم الإبلاغ عن نتائج مماثلة من خلال الجمع بين تحليل النمط النووي مع FISH المنعكس (28) ، والتي لاحظت وجود 61٪ تثلث صبغي ، و 15٪ تعدد الصبغيات (ثلاثي الصبغيات بشكل أساسي) ، و 14٪ صبغي أحادي الصبغي الجنسي و 7٪ تشوهات هيكلية. ليس من المستغرب أن تكون التشوهات الأكثر شيوعًا هي التثلث الصبغي الجسدي ، حيث تم التعرف عليها في وقت مبكر من عام 1984 من قبل هاسولد وتشيو (5) أن خطر كل من فقدان الحمل ووقوع التثلث الصبغي نتيجة عدم انفصال الأم يزداد مع عمر الأم ، وبالتالي من المحتمل أن يحدث بشكل متزامن. تُظهر بياناتنا (غير المنشورة) تشوهات الكروموسومات الأكثر شيوعًا في الخسائر الجنينية المتفرقة المفترض أن تكون ثلاثية الصبغيات ، وحيدة الكروموسوم الجنسي ، والتثلث الصبغي (21 ، 22 ، 15 ، 18 ، 13 و 16 بترتيب تنازلي (الشكل 34-1)). لوحظ وجود نمط مختلف قليلاً بين الخسائر من النساء اللواتي لديهن تاريخ من فقدان الحمل ، حيث كانت التشوهات الأكثر انتشارًا هي ثلاثية الصبغيات والتثلث الصبغي 22 و 16 و 15 و 21. أخطاء (9) ، في حين أن النمط الذي شوهد في النساء المصابات بفقدان متكرر قد ارتبط بالأخطاء الانقسامية التي شوهدت في أجنة التلقيح الاصطناعي الفسيفسائية.قد تكون الندرة النسبية للكروموسوم الجنسي بين الخسائر المتكررة مرتبطة بالعمر المتقدم قليلاً (37.3 مقابل 36.2 سنة) في هذه المجموعة ، حيث أن الكروموسوم الجنسي غالبًا ما يكون بسبب عدم الانفصال عند الذكور ، وبالتالي لن يكون بالضرورة مرتبطًا بـ عمر الأم. التثلث الصبغي المزدوج ، الذي ، باستثناء حالات نادرة جدًا تتضمن وجود كروموسوم جنسي إضافي ، غير قابل للحياة ، ليس نادرًا في عينات الإجهاض ، ويمثل حوالي 1-2٪ من هذه الحالات (29). هم دائما تقريبا نتيجة لعدم انفصال الأم (30) وترتبط أيضًا بعمر الأم الأكبر سنًا. وتجدر الإشارة إلى أنه في حين أن الدراسات التي أجريت على الأجنة قبل الانغراس (انظر سابقًا) غالبًا ما تشير إلى صغر جسمي أحادي ، وتبلغ ذروتها في مرحلة ثماني خلايا تقريبًا ، فإن مثل هذه الأنماط غير قابلة للإنغراس ، ولم يتم الإبلاغ عن تشريح جسمي أحادي في عينات المجهض.

    الشكل 34-1. التواتر النسبي لتشوهات الكروموسومات التي لوحظت في POCs غير الطبيعي خلويًا من النساء اللواتي لديهن تاريخ مُبلغ عن فقدان الحمل المتكرر مقارنةً بأولئك الذين تم الإبلاغ عن فقدان الحمل المتقطع. كان متوسط ​​عمر الأم 37.3 سنة في مجموعة الراجعة و 36.2 سنة في المجموعة المتفرقة. عدد الكروموسومات المعنية المقدمة عبر المحور X مع 23 = تثلث صبغي مزدوج ، 24 = أحادي الصبغي X ، 25 = ثلاثي الصبغيات ، 26 = رباعي الصبغيات. التشوهات التي تعتبر قابلة للحياة (التثلث الصبغي 13 و 18 و 21 و monosomy X) تكون جميعها أكثر شيوعًا في المجموعة التي تعاني من خسائر متفرقة ، مع انتشار التثلث الصبغي 15 و 16 و 22 بشكل أكبر بين أولئك الذين يعانون من فقدان متكرر.


    بيانات المشترك

    لكل شرط تجزئة نعرضه هنا ، ستجد وصفًا موجزًا ​​لما يتحكم فيه ، وجدولًا يعرض جميع الخيارات في القوائم المنسدلة. في معظم الحالات ، لا يوجد سوى ثلاثة اختيارات يجب القيام بها ، ولكن بالنسبة لبعض أنواع الشروط ، ستظهر قائمة منسدلة رابعة.

    في جميع الحالات تقريبًا ، لن ترى جميع الخيارات التي تظهر على هذه الصفحة في القائمة المنسدلة بحسابك. تقتصر القوائم المنسدلة التي تظهر في حسابك على البيانات المتوفرة في الجمهور الذي تعمل معه.

    نشاط الأتمتة

    تتوفر بيانات تقرير الأتمتة في خيارات التقسيم ، بحيث يمكنك سحب شرائح من المشتركين بناءً على ما إذا كانوا قد بدأوا أو أكملوا أتمتة معينة للبريد الإلكتروني.

    نشاط الحملة

    قم بإنشاء شرائح بناءً على كيفية تفاعل المشتركين مع حملات البريد الإلكتروني الخاصة بك. على سبيل المثال ، استخدم مجموعة من معايير التقسيم لاستهداف المشتركين الذين تم إرسال حملاتهم مؤخرًا ولكن لم يفتحوها.

    • أي / كل الحملات الخمس الأخيرة

    فيما يلي بعض الأمثلة على كيفية عمل شرائح نشاط الحملة.

    • نشاط الحملة | تم ارساله | كل الحملات الخمس الأخيرة
      المشتركون الذين تلقوا جميع حملات البريد الإلكتروني الخمس الأخيرة
    • نشاط الحملة | لم يتم إرسالها | كل الحملات الخمس الأخيرة
      المشتركون الذين لم يتلقوا أيًا من حملات البريد الإلكتروني الخمس الأخيرة
    • نشاط الحملة | لم يتم إرسالها | أي من آخر 5 حملات
      المشتركون الذين لم يتم إرسالهم واحدة أو أكثر من حملات البريد الإلكتروني الخمس الأخيرة
    • نشاط الحملة | تم ارساله | أي من آخر 5 حملات
      المشتركون الذين تلقوا واحدة أو أكثر من حملات البريد الإلكتروني الخمس الأخيرة
    • نشاط الحملة | لم تفتح | أي من آخر 5 حملات
      المشتركون الذين لم يفتحوا واحدة أو أكثر من حملات البريد الإلكتروني الخمس الأخيرة
    • نشاط الحملة | لم تفتح | كل الحملات الخمس الأخيرة
      المشتركون الذين فتحوا أيًا من حملات البريد الإلكتروني الخمس الأخيرة
    • نشاط الحملة | افتتح | أي من آخر 5 حملات
      المشتركون الذين فتحوا واحدة أو أكثر من حملات البريد الإلكتروني الخمس الأخيرة
    • نشاط الحملة | افتتح | كل الحملات الخمس الأخيرة
      المشتركون الذين فتحوا جميع حملات البريد الإلكتروني الخمس الأخيرة

    ملحوظة: كن حذرًا عند الإرسال إلى شرائح النشاط بناءً على الحملات المجدولة أو المسودة أو المتوقفة مؤقتًا. لن يتم الانتهاء من إجمالي عدد المستلمين لشريحتك حتى يتم إرسال حملتك.

    نشاط البطاقة البريدية

    استخدم شرط نشاط البطاقة البريدية لتقسيم جهات الاتصال الخاصة بك بناءً على ما إذا كان قد تم إرسال حملة بطاقة بريدية إليهم. لا تتضمن شرائح نشاط البطاقة البريدية أي شخص تلقى بطاقة بريدية باستخدام أداة البحث عن الجمهور المشابه ، نظرًا لأن هذه الأداة لا تضيف جهات اتصال إلى جمهورك.

    • لم يتم إرسال بطاقة بريدية محددة

    تقييم الإتصال

    استخدم شرط "تصنيف جهات الاتصال" لإنشاء شريحة للمشتركين الأكثر تفاعلاً أو الأقل تفاعلاً.

    نشاط المحادثات

    ميزة المحادثات في Mailchimp تتعقب ردود البريد الإلكتروني من المشتركين لديك. استخدم هذا الشرط لتقسيم المشتركين الذين استجابوا للحملات عبر البريد الإلكتروني. الحملات المرسلة والحملات الاختبارية متاحة. تسحب جميع الحملات الأخيرة البيانات من أحدث 500 حملة تم إرسالها إلى جمهورك.

    • أي من آخر 5 حملات

    تم إضافة التاريخ

    استخدم شرط "تاريخ الإضافة" لإنشاء شريحة بناءً على تاريخ تسجيل المشترك أو استيراده إلى جمهورك. يحول عامل تاريخ الإضافة تلقائيًا وقت تسجيل كل جهة اتصال إلى التوقيت العالمي المنسق (UTC) ، لذلك قد تظهر مقاطع التاريخ المضافة في بعض الأحيان لإرجاع نتائج خارج الإطار الزمني المختار.

    • تم إرسال حملة معينة

    * بالنسبة إلى عوامل التشغيل ، أدخل قيمة رقمية صحيحة لمعلمة "العدد الأخير من الأيام". لاحظ أن كل يوم هو 24 ساعة ، يتم احتسابها تنازليًا من وقت إنشاء الشريحة. على سبيل المثال ، إذا اخترت ضمن، وإدخال 3 أيام ، سنجد المشتركين الذين انضموا إلى جمهورك في آخر 72 ساعة.

    عميل البريد الإلكتروني

    إذا كان لديك تصميمات مختلفة للحملة للأشخاص الذين يستخدمون تطبيقات صندوق بريد مختلفة ، فيمكنك تقسيمها إلى عميل البريد الإلكتروني. يمكن تحديد عميل واحد فقط لكل حالة ، ولكن يمكن تحديد ما يصل إلى خمسة شروط لأي شريحة.


    نتائج

    يمكن تشغيل VCF2CNA من خلال واجهة ويب بسيطة (الشكل 1 أ) أو كأداة سطر أوامر. بالنسبة لواجهة الويب ، يكون الإدخال الوحيد هو ملف VCF (أو ملف في أحد تنسيقات الملفات المتغيرة الأخرى المدعومة) من تحليل الورم - العادي WGS أو WXS ، والذي يتم تحميله عبر الواجهة إلى خادم ويب حيث التطبيق أشواط. يتم إرجاع النتائج إلى عنوان البريد الإلكتروني الذي قدمه المستخدم. بالنسبة لأداة سطر الأوامر ، يتم تشغيل خط الأنابيب عن طريق استدعاء أمر تشغيل واحد. يتكون VCF2CNA من وحدتين رئيسيتين: (1) استرجاع معلومات SNP ومعالجتها من بيانات الإدخال و (2) التجزئة القائمة على التقسيم العودي باستخدام تعداد أليل SNP (الشكل 1 ب). يبلغ وقت التشغيل الفعلي لعينة WGS النموذجية ما يقرب من 30 إلى 60 دقيقة ، اعتمادًا على مدى تعقيد الجينوم.

    نظرة عامة على عملية VCF2CNA. (أ) واجهة المستخدم مع المعلمات. (ب) خط أنابيب جانب الخادم. متوازي الأضلاع يصور ملفات الإدخال أو الإخراج ، والمستطيل يصور عملية تحليلية ، والماس يصور الشرط لعملية المتابعة.

    لتقييم فائدة VCF2CNA ، قمنا بتشغيله على 192 مجموعة بيانات WGS للورم العادي و 15 مجموعة بيانات WXS عادية للورم. تضمنت هذه التسلسلات 46 ورم أرومي دبقي بالغ من WGS (GBMs) من مجموعة بيانات أطلس جينوم السرطان (TCGA-GBM) 10 ، متسلسلة بواسطة تقنية Illumina ، و 146 ورم أرومي عصبي للأطفال WGS (NBLs) من البحوث القابلة للتطبيق علاجيًا لتوليد علاجات فعالة (TARGET-NBL) مجموعة البيانات 11 ، متسلسلة بواسطة تقنية Complete Genomics، Inc. (CGI). في المتوسط ​​، استخدم VCF2CNA ما يقرب من 2.8 مليون تعدد الأشكال عالي الجودة لكل عينة (متوسط ​​2،811،245 نطاق ، 2،029،467-3،519،454 في بيانات TARGET-NBL) لاشتقاق ملفات تعريف CNA. قمنا أيضًا بتقييم الاتساق بين WGS و WXS باستخدام 15 عينة من الساركوما العضلية المخططة التي تم تسلسلها على كلا النظامين 12 وقدرنا نقاء الورم في هذه العينات.

    تحليل CNA لبيانات TCGA-GBM

    تضمنت بيانات TCGA-GBM البالغة التي تم تنزيلها من dbGaP (رقم الإدخال: phs000178.v8.p7) 46 عينة. قمنا أولاً بتقييم مقاومة VCF2CNA لأعمال بناء المكتبة باستخدام 24 عينة من هذه المجموعة ، والتي تم تحديدها مسبقًا على أنها تحتوي على نمط جينوم مكسور عن طريق CONSERTING وخوارزميات CNA الأخرى 7. في الواقع ، أنتج VCF2CNA ملفات تعريف CNA متوافقة عالميًا مع ملفات تعريف CNA المشتقة من مصفوفة SNP (تم تنزيلها من TCGA ، الملف التكميلي s1) وأكثر قوة للضوضاء من تلك التي تنتجها CONSERTING. على وجه التحديد ، أنتج VCF2CNA انخفاضًا متوسطًا قدره 59.4 ضعفًا في عدد المقاطع المتوقعة مقارنةً بـ CONSERTING (متوسط ​​، نطاق 46.2 ، 16.2-285.7 ص = 3.0 × 10 −6 بواسطة اختبار تصنيف موقع ويلكوكسون ، الشكل 2 أ والملف التكميلي s1).

    مؤامرة Circos التي تعرض CNAs التي تم العثور عليها بواسطة CONSERTING (الحلقة الخارجية) و VCF2CNA (الحلقة الوسطى) ومجموعة SNP (الحلقة الداخلية) لـ (أ) TCGA-GBM عينة مكسورة 41-5651-01A و (ب) عينة TCGA-GBM غير مكسورة 06-0125-01A. يتم استخدام الكروموسومات الرمادية والسوداء بالتناوب للتباين. تصور المناطق الصفراء فجوات التسلسل ، بينما تصور المناطق الحمراء موقع السنترومير. توضح المقاطع الزرقاء فقدان رقم النسخ ، بينما تشير المقاطع الحمراء إلى اكتساب رقم النسخ. تصور الأسطورة نطاق CNA لكل مسار.

    استخدمنا حرف F1 مقياس التسجيل 13 لقياس الاتساق بين ملفات تعريف CNA المستمدة من VCF2CNA و CONSERTING في أزواج العينات الـ 22 المتبقية عالية الجودة (الشكل 2 ب والملف التكميلي s2). حددت هذه البرامج ما يقرب من 700 ميجا بايت من مناطق CNA في كل عينة (النطاق ، 92-2299 ميجا بايت) مع تناسق عالٍ (متوسط ​​F1 النتيجة ، النطاق 0.9941 ، 0.9699–0.9995) (الجدول 1).

    قمنا بتقييم التداخل القطاعي بين مخرجات CONSERTING ومخرجات VCF2CNA لكل عينة. تم تصنيف مقطع CNA الذي تم اكتشافه بواسطة CONSERTING على أنه مؤكد إذا تلقت 90 ٪ من القواعد في المقطع نفس النوع من مكالمة CNA من VCF2CNA (الجدول 2). تُظهر المقارنة أن VCF2CNA أعاد تلخيصها بأمانة لشرائح CNA المتوسطة إلى الكبيرة (≥100 كيلو بايت) ، في حين أن CONSERTING كانت تتمتع بقوة أكبر لتحديد السعة البؤرية (& lt100 كيلو بايت) منخفضة السعة (تغيير نسبة السجل المطلق 2 & lt1.0) CNAs (ص = 1.306 × 10 5 بواسطة اختبار رتبة موقع ويلكوكسون). علاوة على ذلك ، كشف التحليل القطاعي أن قدرة الكشف كانت أقل تأثرًا في CNAs البؤرية ذات السعات الكبيرة (نسبة لوغاريتم 2 3.0) (الشكل 3).

    مؤامرة الكمان مرتبة حسب حجم المقطع وشدة CNA لجميع العينات غير المكسورة البالغ عددها 22 TCGA-GBM. يمثل الماس الذهبي الجزء المتوسط ​​من الأجزاء المطابقة بين VCF2CNA و CONSERTING.

    لمزيد من اختبار ما إذا كان VCF2CNA يلتقط بدقة أنماط CNA في العينات باستخدام أدوات المكتبة ، قمنا بتطبيق خوارزمية cghMCR 14. توفر هذه الحزمة في R Bioconductor وظائف لتحديد المناطق الجينومية ذات الأهمية بناءً على بيانات رقم النسخة المجزأة من عينات متعددة. استخدمنا هذه الوظيفة لتصوير هذه المكاسب والخسائر الشائعة عبر جميع العينات الـ 46 من ملفات تعريف VCF2CNA أو ملفات تعريف CNA المشتقة من مصفوفة SNP (تم تنزيلها من TCGA). يتم تحديد النتائج من خلال درجة مكاسب أو خسارة المقطع (SGOL). على الرغم من أن الإشارة الواردة من VCF2CNA احتوت على ضوضاء أقل من الإشارة الواردة من صفيف SNP في معظم العينات (الملف التكميلي s1) ، فإن كلا الملفين يكشفان عن مناطق مشتركة متضخمة و / أو مفقودة بشكل متكرر (الشكل 4). تضمنت هذه التغييرات تغييرات على مستوى الكروموسوم (أي تضخيم chr7 وفقدان chr10) و CNAs القطاعية (أي الحذف البؤري لـ CDKN2A / ب locus on chr9p) 15. علاوة على ذلك ، حدد VCF2CNA الخسائر المتكررة في ERBB4 في chr2q و GRIK2 على chr6q التي كانت غائبة في ملفات تعريف صفيف SNP. ERBB4 يشفر كيناز مستقبل الغشاء الضروري لتطور الخلايا العصبية 16. كثيرا ما يتم تحور في المرضى الذين يعانون من سرطان الرئة ذو الخلايا غير الصغيرة 17 ، وإسكات ERBB4 من خلال فرط ميثيل الحمض النووي يرتبط بسوء التشخيص في أورام الثدي الأولية 18. بصورة مماثلة، GRIK2 هو جين مرشح مثبط للورم يتم حذفه بشكل متكرر في ابيضاض الدم الليمفاوي الحاد 19 ويتم إسكاته بواسطة فرط ميثيل الحمض النووي في سرطان المعدة 20.

    مؤامرة chgMCR من 46 عينة TCGA-GBM. (أ) بيانات صفيف SNP و (ب) يتم عرض بيانات VCF2CNA.

    تمثل التضخمات مثل الكروموسومات المزدوجة الدقيقة ومناطق التلوين المتجانس آلية شائعة للتعبير المفرط للجين الورمي في الأورام 21. من بين 46 عينة TCGA-GBM التي تم تحليلها ، حدد VCF2CNA كروموسومات مزدوجة الدقيقة في 34 عينة تؤثر على EGFR 22 , MDM2 23 , MDM4 24 ، بدجفرا 25 ، HGF 26 ، GLI1 27 ، CDK4 28 و CDK6 29 جينًا (الشكل 5 والملف التكميلي s3). تألفت هذه الأحداث من تضخمات عالية المستوى في 21 عينة ذات أنماط جينوم مكسورة محتملة (الملف التكميلي s3a) و 13 عينة تم الإبلاغ عنها مسبقًا (الملف التكميلي s3b) 7،30.

    مؤامرة سيرك من VCF2CNA (الحلقة الخارجية) و CONSERTING (الحلقة الداخلية) ، تصور مقاطع CNA البؤرية عالية السعة في عينة TCGA-GBM 06-0152-01A. وتشمل هذه المقاطع جينات السرطان المعروفة EGFR, CDK4، و MDM2. يتم تحديد نطاق CNA لكل عينة.

    تحليل CNA لبيانات TARGET-NBL

    قمنا بتطبيق VCF2CNA على مجموعة البيانات TARGET-NBL 11 التي تم تنزيلها من dbGap (رقم Assession: phs000467). تتكون مجموعة البيانات هذه من 146 ورمًا مع عينات WGS طبيعية متطابقة ، متسلسلة باستخدام تقنية CGI. نظرًا لأن تقنية CGI القائمة على الربط لها اختلافات ملحوظة في اكتشاف متغيرات النوكليوتيدات المفردة (SNVs) وعمليات الإدراج / الحذف (indels) مقارنة بأنظمة Illumina 31 ، فقد وفرت مجموعة البيانات هذه فرصة لتقييم متانة VCF2CNA باستخدام منصات تسلسل مختلفة.

    استخدمنا VCF2CNA لإجراء تحليل cghMCR مع ملفات تعريف CNA ولاحظنا نمطًا جينومًا مشابهًا لما تم الإبلاغ عنه لمنصات مصفوفة SNP (الشكل 6 أ). بالإضافة إلى فقدان مناطق كبيرة في chr1p و 3p و 11q واكتساب واسع لـ chr17q ، وجد VCF2CNA تضخيمًا بؤريًا متكررًا لـ MYCN في أورام NBL والعديد من CNAs المحتملة المرتبطة بالسرطان ، بما في ذلك التضخمات عالية المستوى لـ CDK4 (1 ورم) ، و ALK (2 أورام) (الشكل 6 ب).

    تحليل مجموعة بيانات TARGET-NBL ، التي تتكون من 146 ورمًا. (أ) مخطط chgMCR حيث يصور اللون الأخضر مناطق كسب رقم النسخ والأحمر يصور مناطق فقدان رقم النسخ. (ب) مخطط السيروس يظهر مكسبًا بؤريًا على الكروموسوم 2 لـ MYCN و ALK5 لعينة PARETE-01A-01D. تم تحديد نطاق CNA.

    تضخيم عالي المستوى MYCN هو محرك معروف للورم موجود في

    25٪ من مرضى الأطفال المصابين بـ NBL ، والمرتبطون بأورام عدوانية وضعف الإنذار 33. تحتوي مجموعة فرعية من 32 ورمًا في مجموعة TARGET-NBL على تضخمات تم التحقق من صحتها سريريًا لـ MYCN. على الرغم من أن نموذج Markov CNA المخفي لـ CGI (غير منشور) قد تم الإبلاغ عنه MYCN في 15 من هذه الأورام الـ 32 ، نجح VCF2CNA في تحديد تضخمات عالية المستوى في 31 ورمًا. في التحقق من صحتها سريريا MYCNعينة مضخّمة لم يتم اكتشافها بواسطة VCF2CNA ، كشفت مراجعة متابعة أن تغاير الورم وتحيز أخذ العينات ساهم على الأرجح في هذا التناقض. علاوة على ذلك ، توقع VCF2CNA اثنين إضافيين MYCN أحداث التضخيم بين عينات الورم المتبقية ، مما يشير إلى أن VCF2CNA يمكنه تحديد CNAs ذات الصلة سريريًا والتي لم يتم اكتشافها بواسطة الطرق التقليدية للكشف عن CNA. يوفر التوافق عالي المستوى مع البيانات التي تم التحقق من صحتها سريريًا مؤشرًا قويًا على أن VCF2CNA قابل للتطبيق على أنواع الأورام المتعددة التي تم جمعها من منصات التسلسل المختلفة.

    تحليل CNA لبيانات الساركوما العضلية المخططة لمقارنة WXS و WGS

    على الرغم من أن WGS يوفر قياسات تغطية غير متحيزة عبر الجينوم ، إلا أن تسلسل الإكسوم الكامل (WXS) يوفر توصيفًا لمناطق الترميز في الجينوم (2٪ من الجينوم) على عمق أعلى بكثير ، مما يوفر بديلاً مناسبًا وغير مكلف لـ WGS وكان واسع الانتشار. تم تبنيها في مشاريع تصنيف الجينوم واسعة النطاق والإعدادات السريرية. نظرًا لاختلافات التصميم الرئيسية بين النظامين الأساسيين ، قمنا بتقييم اتساق اكتشاف تغيير رقم النسخ بين الإكسوم الكامل وتسلسل الجينوم الكامل ، باستخدام مجموعة من عينات الساركوما العضلية المخططة التي تم تسلسلها على كلا النظامين 12. لاحظنا ملفات تعريف CNA متسقة للغاية بين منصات WGS و WXS (متوسط ​​درجة F1 0.97 على مجموعة من 15 عينة xenograph لساركوما عضلي مخطط). في حين أنه من المرجح أن يتم تفويت التغييرات البؤرية في منصة WXS مقارنة بمنصة WGS ، فإن VCF2CNA يكتشف بشكل موثوق CNAs كبيرة من كل من منصات WGS و WXS (الشكل 7 ، الملف التكميلي s5).

    تم حساب CNAs الجسدية باستخدام VCF2CNA لإقران كامل الإكسوم والجينوم الكامل لعينة ساركوما ساركومة عضلية مخططة Xenograph SJRHB000026_X1_G1.

    تقدير النقاء القائم على CNA

    باستخدام نتيجة رقم النسخة المطلقة لكل مقطع تم تحديده من خلال ترددات VCF2CNA وترددات B-allele (BAFs) المحسوبة من ملف VCF ذي الورم الطبيعي ، قمنا بتطوير خوارزمية لتقدير نقاء الورم باستخدام مقاطع مع كسب أو خسارة رقم نسخة واحدة في VCF2CNA. باختصار ، بالنسبة لتعدد أشكال النوكليوتيدات المفردة غير المتجانسة (SNPs ، BAF الأساسي 0.5) ، يمكن قياس مدى فقد الزيجوت غير المتجانسة (LOH) بالفرق المطلق بين جزء B-allele في الورم و ذلك في عينة السلالة الجرثومية. LOH هو نتيجة لتغيير رقم النسخ و / أو نسخ LOH المحايد في الخلايا السرطانية. استخدمنا إشارات LOH في مناطق الكسب / الخسارة المحايدة أو أحادية النسخة (بين فقد الكروموسوم من نسخة واحدة وكسب الكروموسوم من نسخة واحدة) لتقدير نقاء الورم.

    باستخدام تقديرات النقاء من مناطق مختلفة داخل الجينوم ، أجرينا تحليلًا جماعيًا غير خاضع للإشراف باستخدام حزمة mclust (الإصدار 5.4) في R (الإصدار 3.4.0). تم تعريف نقاء الورم للعينة على أنه أعلى قيمة لمركز الكتلة بين جميع المجموعات. قدرنا نقاء الورم لـ 15 عينة متطابقة من مخطط Xenograph للورم العضلي المخططي WGS. (الجدول 3). جميع الحالات باستثناء حالة واحدة لديها تنبؤ بنقاوة الورم بالقرب من 100٪ ، بما يتوافق مع فكرة أن معظم القراءات المشتقة من الفئران لن يتم تعيينها لتجميع الجينوم البشري 34،35. أظهرت العينة SJRHB010468_X1_G1 CNAs الفرعية واسعة النطاق عبر كروموسومات متعددة (ملف تكميلي s5). في حين أن CNAs subclonal لا تدل على انخفاض النقاء ، فإن مقاطع عدد النسخ الفرعية واسعة النطاق تؤدي إلى تقدير غير صحيح لنقاء الورم (0.533) ، وهو تقييد للخوارزمية. كشفت مؤامرة كثافة جزء الأليل الطافر (MAF) للاختلافات الجسدية أحادية النوكليوتيدات (SNVs) التي تم اكتشافها في مناطق ثنائية الصبغيات ، عن استنساخ فرعي في 50 ٪ من الخلايا السرطانية ، والتي تضم أكثر من 75 ٪ من SNVs المكتشفة (الملف التكميلي s6).


    عرض وتحرير الاستعلام الخام

    يوفر مصمم المقطع واجهة رسومية لإنشاء منطق مقطع ديناميكي. أثناء العمل مع الإعدادات ، تقوم بالفعل بإنشاء استعلام يستند إلى النص في الخلفية. هذا هو الاستعلام الذي سيقوم النظام بتشغيله بالفعل على قاعدة البيانات الخاصة بك. عادة لا تحتاج إلى استخدام الاستعلام لأي شيء ، ولكن في بعض الأحيان يمكن أن يساعد في استكشاف الأخطاء وإصلاحها. يمكنك أيضًا نسخ / لصق الاستعلامات في المصمم ، والتي قد تستخدمها لإنشاء نسخة من مقطع موجود أو لمشاركة تصميم استعلام عبر البريد الإلكتروني.

    للبحث عن الاستعلام وعرضه وتحريره ، قم بالتمرير إلى أسفل الصفحة وافتح ملف عرض الاستعلام انقر هنا.


    شاهد الفيديو: حل جميع مشاكل عدم ظهور وقراءة الفلاش USB وكروت الذاكرة بأربع طرق فعالة (شهر فبراير 2023).