معلومة

كيف تعلق على ملف .broadpeak من 9 أعمدة؟

كيف تعلق على ملف .broadpeak من 9 أعمدة؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

لدي ملف الذروة هذا الذي استردته من مصفوفة ENCODE chip-seq. إنه.broadpeakالملف يبدو كالتالي:

chr22 16096195 16096367. 517. 8.245591 1.4 -1 chr22 16191942 16192481. 374. 4.452878 1.7 -1 chr22 16192350 16192560. 480. 7.273034 1.3 -1 chr22 16848326 16848437. 687. 12.776952 3.4 -1 chr22 16849900 16851299. 374. 4.444921 12.8 -1 chr22 16851301 16851828. 394. 4.968297 3.2 -1 chr22 16852259 16852459. 514. 8.182164 2.4 -1 chr22 16853163 16855156. 328. 3.229621 7.6 -1 chr22 16856415 16857273. 374. 4.450283 5.9 -1 chr22 16857361 16857946. 375. 4.475713 2.4 -1 chr22 16857760 16857903. 637. 11.443585 4.2 -1 chr22 16858449 16858683. 645. 11.655504 11.1 -1 chr22 16860284 16860823. 382. 4.655282 2.4 -1 chr22 16861104 16862410. 370. 4.343772 10.8 -1 chr22 16928019 16928525. 385. 4.743283 2.2 -1 chr22 16928388 16928554. 602. 10.515230 4.4 -1 chr22 17066663 17067190. 487. 7.452445 12.6 -1 chr22 17076317 17076417. 699. 13.091462 2.8 -1 chr22 17079512 17087549. 1000. 29.157293 13.6 -1 chr22 17105156 17105287. 582. 9.993482 1.6 -1 chr22 17162805 17163461. 763. 14.801068 100.0 -1 chr22 17198501 17199415. 615. 10.861807 15.1 -1 chr22 17228872 17229131. 713. 13.478983 15.7 -1 chr22 17229147 17229434. 621. 11.023589 13.2 -1

أريد أن أجعل التعليق التوضيحي وأن أحصل على معرفات إنتريز لأقرب الجينات. أنا جديد على هذا وأظل أحاول بعض الأدوات ولكن لا شيء يبدو أنه يعمل. لقد استخدمت أداة تحليل الذرات كثيرًا ، لكنها ظلت تقول أن هذا الملف يفتقد إلى أعمدة يجب أن يكون ملفًا مكونًا من 12 عمودًا ، لكنني لا أعرف كيفية القيام بذلك. إذا أضفت المزيد من الأعمدة ، فسيؤدي ذلك إلى تغيير التعليق التوضيحي.


هذا ما تعنيه أعمدة تنسيق broadPeak (من UCSC):

  1. الكروم - اسم الكروموسوم (أو كونتيج ، سقالة ، إلخ).
  2. ابدأ - موضع بداية السمة في الكروموسوم أو السقالة. تم ترقيم القاعدة الأولى في الكروموسوم 0.
  3. نهاية الكروم - موضع النهاية للميزة في الكروموسوم أو السقالة. لا يتم تضمين قاعدة chromEnd في عرض الميزة. على سبيل المثال ، يتم تعريف القواعد المائة الأولى للكروموسوم على أنها chromStart = 0 ، و chromEnd = 100 ، وتمتد على القواعد المرقمة من 0 إلى 99. إذا كانت جميع الدرجات "0" عند تقديم البيانات إلى DCC ، DCC
    الدرجات المعينة 1-1000 بناءً على قيمة الإشارة. من الناحية المثالية ، متوسط ​​الإشارةالقيمة لكل قاعدة سبريد ما بين 100-1000.
  4. اسم - الاسم الذي يطلق على منطقة (يفضل أن يكون فريدًا). يستخدم '.' إذا لم يتم تعيين اسم.
  5. نتيجة - يشير إلى مدى الظلام الذي سيتم عرض الذروة في المتصفح (0-1000).
  6. ساحل - +/- للإشارة إلى حبلا أو اتجاه (كلما أمكن ذلك). يستخدم '.' إذا لم يتم تعيين اتجاه.
  7. إشارةالقيمة - قياس التخصيب الكلي (عادة ، المتوسط) للمنطقة.
  8. قيمة - قياس الدلالة الإحصائية (-log10). استخدم -1 إذا لم يتم تعيين قيمة pValue.
  9. q القيمة - قياس الدلالة الإحصائية باستخدام معدل الاكتشاف الخاطئ (-log10). استخدم -1 إذا لم يتم تعيين qValue.

وهذه هي الطريقة التي يبدو بها تنسيق BED (من UCSC):

  1. الكروم - اسم الكروموسوم (مثل chr3 ، chrY ، chr2_random) أو السقالة (مثل scaffold10671)
  2. ابدأ - موضع بداية السمة في الكروموسوم أو السقالة. تم ترقيم القاعدة الأولى في الكروموسوم 0.
  3. نهاية الكروم - موضع النهاية للميزة في الكروموسوم أو السقالة. لا يتم تضمين قاعدة chromEnd في عرض الميزة. على سبيل المثال ، يتم تعريف القواعد المائة الأولى للكروموسوم على أنها chromStart = 0 ، و chromEnd = 100 ، وتمتد على القواعد المرقمة من 0 إلى 99.
  4. اسم - يحدد اسم خط BED. يتم عرض هذا الملصق على يسار خط BED في نافذة متصفح الجينوم عندما يكون المسار مفتوحًا لوضع العرض الكامل أو مباشرة على يسار العنصر في وضع الحزمة.
  5. نتيجة - درجة بين 0 و 1000. إذا تم تعيين السمة useScore لخط المسار على 1 لمجموعة بيانات التعليق التوضيحي هذه ، فستحدد قيمة الدرجة مستوى اللون الرمادي الذي يتم عرض هذه الميزة به (أرقام أعلى = رمادي أغمق).
  6. ساحل - يحدد الشريط - إما "+" أو "-".
  7. سميك - موضع البداية الذي يتم عنده رسم السمة بشكل كثيف (على سبيل المثال ، كودون البدء في عروض الجينات). عندما لا يكون هناك جزء سميك ، عادةً ما يتم ضبط ThickStart و ThickEnd على وضع chromStart.
  8. سميك - موضع النهاية الذي يتم عنده رسم السمة بشكل كثيف (على سبيل المثال ، رمز الإيقاف في عروض الجينات).
  9. itemRgb - قيمة RGB للنموذج R ، G ، B (على سبيل المثال 255،0،0). إذا تم تعيين سمة سطر المسار RGB على "تشغيل" ، فستحدد قيمة RBG هذه لون عرض البيانات الموجودة في سطر BED هذا. ملاحظة: يوصى باستخدام نظام ألوان بسيط (ثمانية ألوان أو أقل) مع هذه السمة لتجنب إرباك موارد الألوان لمتصفح الجينوم ومتصفح الإنترنت الخاص بك.
  10. blockCount - عدد الكتل (exons) في خط BED.
  11. الأحجام - قائمة أحجام الكتل مفصولة بفواصل. يجب أن يتوافق عدد العناصر في هذه القائمة مع blockCount.
  12. blockStarts - تبدأ قائمة حظر مفصولة بفواصل. يجب حساب جميع مواضع blockStart بالنسبة إلى chromStart. يجب أن يتوافق عدد العناصر في هذه القائمة مع blockCount.

لذا ، فإن الأعمدة الستة الأولى هي نفسها بشكل أساسي. يجب أن يتطابق العمودان السابع والثامن من ملف BED الجديد مع العمودين الثالث والرابع على التوالي. نظرًا لأن الأعمدة 4-12 اختيارية في الواقع لملف BED ، فلن تحتاج فعليًا إلى ملء بقية الأعمدة. على أي حال ، فإن blockCount سيكون صفرا لحالتك. قيمة RGB ليست ضرورية أيضًا. ومع ذلك ، إذا كان أي برنامج تستخدمه يطلب ملفًا مكونًا من 12 عمودًا ، فقم بتعيين ما يلي:

  • itemRGB (العمود 9) = 0،0،0 (أسود)
  • blockCount (العمود 10) = 0

يمكنك استخدام المسافة البيضاء في باقي العمودين.

يمكنك بسهولة استخدام أي لغة برمجة للقيام بذلك. لن أشرح كيفية القيام بذلك لأن هذا خارج عن الموضوع هنا.


كيف تجد أقرب الجينات دون استخدام Peakanalyzer؟

  • قم بتنزيل ملف GENCODE التوضيحي GTF وفك ضغطه.
  • اقرأ ملف broadPeak وقم بتخزين مواقع القمم.
  • تحديد الحد الأدنى لمستوى التقارب (على سبيل المثال 2kbp up / downstream)
  • حلل فقط تلك السطور من GTF حيث العمود الثالث = "جين"
  • اطرح نافذة المصب لبدء وإضافة نافذة المنبع لإيقاف موضع الجين. الأعمدة 4 و 5 على التوالي.
  • يتم تخزين معلومات الجينات في العمود التاسع.
  • إذا كان موضع الذروة المخزن يقع ضمن مواضع البدء / الإيقاف المعدلة ، فقم بطباعة العمود التاسع.

مرة أخرى ، يجب أن يتم ذلك برمجيًا. ليس من الصعب جدا. شرح كيفية القيام بذلك خارج عن الموضوع في هذا المنتدى. شرحت الخوارزمية التي يمكنك تنفيذها بلغة البرمجة النصية المفضلة لديك.


دليل مستخدم ChIPpeakAnno

الحزمة مخصصة لتسهيل تحليل المصب لتجارب ChIP-seq. يتضمن وظائف للعثور على أقرب جين أو exon أو miRNA أو ميزات مخصصة مثل العناصر الأكثر حفظًا ومواقع ربط عامل النسخ الأخرى التي يوفرها المستخدمون ، واسترداد التسلسلات حول الذروة ، والحصول على مصطلحات أو مسارات Gene Ontology (GO) المخصبة. بدءًا من 2.0.5 ، تمت إضافة وظائف جديدة للعثور على القمم مع المروجين ثنائي الاتجاه مع إحصاءات موجزة (PeaksNearBDP) ، لتلخيص حدوث الزخارف في القمم (تلخيصPatternInPeaks) ولإضافة معرفات أخرى إلى القمم المشروحة أو المخصب GO (addGeneIDs) . بدءًا من 3.4 ، تمت إضافة اختبار التقليب لتحديد ما إذا كان هناك تداخل كبير بين مجموعتين من القمم. بالإضافة إلى ذلك ، يمكن تصور أنماط الربط لعوامل النسخ المتعددة (TFs) أو توزيعات العلامات اللاجينية المتعددة حول السمات الجينية ومقارنتها بسهولة باستخدام خريطة حرارية جنبًا إلى جنب ومخطط للكثافة.

إصدار الحزمة: ChIPpeakAnno 3.6.5


محتويات

أصبح الترسيب المناعي للكروماتين (ChIP) متبوعًا بتسلسل الحمض النووي (ChIP-seq) و ChIP متبوعًا بتحليل صفيف تبليط الجينوم (ChIP-chip) تقنيات إنتاجية عالية منتشرة لتحديد مواقع الربط لبروتينات ربط الحمض النووي من حيث الجينوم. تم نشر عدد من الخوارزميات لتسهيل تحديد مواقع الربط لبروتينات ربط الحمض النووي ذات الأهمية. عادةً ما يتم تحويل مواقع الربط المحددة كقائمة من القمم إلى ملفات BED أو ملفات كبيرة ليتم تحميلها على متصفح الجينوم UCSC كمسارات مخصصة للمحققين لعرض القرب من الميزات الجينية المختلفة مثل الجينات أو exons أو العناصر المحفوظة. ومع ذلك ، فإن النقر على متصفح الجينوم يعد مهمة شاقة عندما يزداد عدد القمم أو تنتشر القمم على نطاق واسع عبر الجينوم.

هنا قمنا بتطوير تشيببيك، حزمة Bioconductor 1 ، لتسهيل شرح الدُفعات للقمم المحددة من تجارب ChIP-seq أو ChIP-chip. قمنا بتنفيذ وظائف للعثور على أقرب جين أو exon أو miRNA أو ميزات مخصصة أخرى يوفرها المستخدمون مثل العناصر الأكثر حفظًا ومواقع ربط عامل النسخ الأخرى التي تستفيد من GRanges. منذ أن يتم تحديث شرح الجينوم بشكل متكرر ، فقد استفدنا من حيوي حزمة لاسترداد بيانات التعليقات التوضيحية على الطاير. يتمتع المستخدمون أيضًا بالمرونة لتمرير بيانات التعليقات التوضيحية أو التعليقات التوضيحية الخاصة بهم من الميزات الجينية كما غرانج. لقد استفدنا أيضًا BSgenome و حيوي لاسترداد التسلسلات حول الذروة المحددة للتحقق من صحة الذروة أو اكتشاف الحافز 2. لفهم ما إذا كانت القمم المحددة يتم إثرائها حول الجينات بمصطلحات GO معينة ، قمنا بتنفيذ اختبار الإثراء Gene Ontology (GO) في تشيببيك حزمة الاستفادة من اختبار phyper فوق الهندسة في احصائيات حزمة ومتكاملة مع شرح GO من الله ب حزمة وضبط تعدد وظائف من multtest الحزمة 3-8. يتم دعم تحليل المسار باستخدام رد الفعل أو KEGG أيضًا. بدءًا من 3.4 ، نقوم أيضًا بتنفيذ وظائف اختبار التقليب لتحديد ما إذا كان هناك تداخل كبير بين مجموعتين من القمم. بالإضافة إلى ذلك ، يمكن تصور أنماط الربط لعوامل النسخ المتعددة (TFs) أو توزيعات العلامات اللاجينية المتعددة حول السمات الجينية ومقارنتها بسهولة باستخدام خريطة الحرارة جنبًا إلى جنب ومخطط الكثافة.


1.4 شرح القمم

كما هو موضح من توزيع أرقام الذروة المجمعة حول TSS وتوزيع القمم في مناطق الكروموسوم المختلفة ، فإن معظم القمم تقع حول TSS. لذلك ، من المعقول استخدام التعليقات التوضيحية PeakInBatch أو annoPeaks لتوضيح القمم إلى مناطق المروج لجينات Hg19. يمكن تحديد المروجين باستخدام منطقة ملزمة. بالنسبة للمثال التالي ، يتم تعريف منطقة المروج على أنها المنبع 2000 والمنزل 500 من TSS (منطقة الربط = c (-2000 ، 500)).

يمكن تصور توزيع القمم الشائعة حول المعالم باستخدام مخطط دائري.


تعليق توضيحي مناسب للإسبات للبايت []

لدي تطبيق يستخدم تعليقات السبات 3.1 و JPA. يحتوي على عدد قليل من الكائنات بسمات البايت [] (حجمها 1 ك - 200 ك). يستخدم التعليق التوضيحي لـ JPALob ، ويمكن أن يقرأ السبات 3.1 هذه بشكل جيد في جميع قواعد البيانات الرئيسية - يبدو أنه يخفي خصائص بائع JDBC Blob (كما ينبغي).

اضطررنا إلى الترقية إلى الإصدار 3.5 ، عندما اكتشفنا أن وضع السبات 3.5 يقطع (ولن يصلح) مجموعة التعليقات التوضيحية هذه في postgresql (بدون حل بديل). لم أجد إصلاحًا واضحًا حتى الآن ، لكنني لاحظت أنه إذا قمت بإزالةLob للتو ، فإنه يستخدم postgresql type bytea (والذي يعمل ، ولكن فقط على postgres).

أنا أبحث عن طريقة للحصول على فئة مشروحة واحدة (مع خاصية blob) يمكن نقلها عبر قواعد البيانات الرئيسية.

  • ما هي الطريقة المحمولة لإضافة تعليق توضيحي لخاصية بايت []؟
  • هل تم إصلاح هذا في بعض الإصدارات الحديثة من السبات؟

تحديث: بعد قراءة هذه المدونة ، توصلت أخيرًا إلى الحل البديل الأصلي في مشكلة JIRA:

ومع ذلك، هذا لا يعمل لي - ما زلت أحصل على OID بدلاً من bytea ، إلا أنه نجح مع مؤلف مشكلة JIRA ، الذي بدا أنه يريد OID.

بعد إجابة أ.

ما أحتاجه حقًا هو التحكم في @ org.hibernate.annotations. اكتب المجموعة (Lob + byte [] التي يتم تعيينها) إلى (على postgresql).

هذا هو المقتطف من 3.5.5.Final من MaterializedBlobType (نوع SQL Blob). وفقًا لمدونة Steve ، تريد postgresql منك استخدام Streams لـ bytea (لا تسألني لماذا) ونوع Blob المخصص لـ postgresql لـ oids. لاحظ أيضًا أن استخدام setBytes () على JDBC مخصص أيضًا للبايت (من التجربة السابقة). لذا فإن هذا يفسر سبب عدم تأثير تدفقات الاستخدام على كلاهما يفترض "بايت".

تحديث السؤال المنطقي التالي هو: "لماذا لا تقوم فقط بتغيير تعريفات الجدول يدويًا إلى bytea" والاحتفاظ بـ (Lob + byte [])؟ هذه هل الشغل، حتى حاولت تخزين بايت فارغ []. الذي يعتقد محرك postgreSQL أنه تعبير من نوع OID ونوع العمود هو بايت - وهذا لأن السبات (بشكل صحيح) يستدعي JDBC.setNull () بدلاً من JDBC.setBytes (فارغ) الذي يتوقعه سائق PG.

نظام الكتابة في وضع السبات هو حاليًا "عمل قيد التقدم" (وفقًا لتعليق الإيقاف 3.5.5). في الواقع ، تم إهمال الكثير من التعليمات البرمجية 3.5.5 ، ومن الصعب معرفة ما يجب النظر إليه عند تصنيف PostgreSQLDialect).

يجب تعيين AFAKT و Types.BLOB / 'oid' في postgresql إلى نوع مخصص يستخدم وصول JDBC بنمط OID (أي كائن PostgresqlBlobType وليس MaterializedBlobType). لم أستخدم بلوبس بنجاح في الواقع مع postgresql ، لكنني أعلم أن bytea يعمل ببساطة كواحد / أتوقعه.

أنا أبحث حاليًا في BatchUpdateException - من المحتمل أن برنامج التشغيل لا يدعم التجميع.

اقتباس رائع من عام 2004: "لتلخيص عمليات التنزه الخاصة بي ، أود أن أقول إنهم يجب أن ننتظر حتى يقوم سائق JDBC بتنفيذ LOBs بشكل صحيح قبل تغيير وضع السبات."


كيف تعلق على ملف .broadpeak مع 9 أعمدة؟ - مادة الاحياء

تستخدم كل من مسارات نوع السرير والسرير الكبير بعضًا من الإعداد مع الرؤية لإنجاز شيء ما.

يعلن عن تنسيق البيانات ويستخدم لتحديد طرق وخيارات العرض.

ليست كل أنواع المسارات مدعومة في المحاور. يتم استدعاء الأنواع المدعومة بشكل خاص في أعلى صفحة تعريف قاعدة بيانات Hub Track. في كثير من الحالات ، يتضمن إعداد النوع معلمات إضافية لتحديد تنسيق البيانات بشكل أكبر. بعض أنواع المسارات لها متطلبات إعداد إضافية ، ستتم مناقشتها أدناه.

يعلن عن تنسيق البيانات ويستخدم لتحديد طرق وخيارات العرض.

يمكن العثور على الأوصاف التفصيلية لكل نوع أدناه. في كثير من الحالات ، يتضمن إعداد النوع معلمات إضافية لتحديد تنسيق البيانات بشكل أكبر. بعض أنواع المسارات لها متطلبات إعداد إضافية ، ستتم مناقشتها أدناه.

يحدد "التسمية القصيرة" للمسار ، والتي تُستخدم في عدد من الأماكن في المتصفح لتحديد المسار. على سبيل المثال ، يتم عرض التسمية القصيرة بجانب المسار في صورة المتصفح. يجب أن تكون هذه التسمية مختصرة ومحددة بـ 17 حرفًا قابلاً للطباعة.

يحدد "التسمية الطويلة" للمسار ، والتي تُستخدم أيضًا في العديد من الأماكن في المتصفح لتحديد المسار. على سبيل المثال ، يتم عرض التسمية الطويلة فوق بيانات المسار في صورة المتصفح. يجب أن تكون هذه التسمية وصفية بما يكفي للسماح للمستخدمين بتعريف المسار بشكل فريد داخل المتصفح. يقتصر على 76 حرفًا قابل للطباعة.

تحدد Meta علامة البيانات الوصفية لهذا المسار. هذه العلامة هي مفتاح في جدول البيانات الوصفية المحدد إما في metaDb أو metaTab في ملف genomes.txt. يمكن أن تكون العلامة الوصفية أي سلسلة أبجدية رقمية. يجب أن تظهر كل علامة وصفية في مقطع trackDb وفي إما ملف مفصول بعلامات جدولة محدد بواسطة metaTab أو ملف tagStorm المحدد بواسطة metaDb في ملف genomes.txt الخاص بالمحور.

تحدد الرؤية (أي "وضع العرض") أي من الأوضاع الخمسة (بما في ذلك "إخفاء") يجب استخدامها لعرض المسار داخل صورة المتصفح. دائمًا ما يكون هذا الإعداد قابلاً للتخصيص بشكل ديناميكي بواسطة كل مستخدم. يعتمد التكوين الدقيق للعرض لكل وضع على نوع المسار ، وقد لا يتم دعم بعض الأوضاع لأنواع معينة من المسارات. يرجى ملاحظة أن إعدادات الرؤية في المسارات الفرعية المركبة موروثة مباشرة من الأصل. لذلك ، سيتم تجاهل أي خطوط رؤية تمت إضافتها على مستوى المسار الفرعي للمركب. تأكد من تجربة هذا الإعداد للتحقق من أنه يعمل على النحو المتوقع لنوع المسار وبنية المسار.

  • إخفاء: افتراضي. لا يتم عرض المسار في صورة المستعرض ما لم يغير المستخدم إعداد العرض.
  • كثيف: يتم عرض المسار كخط أو شريط واحد. في كثير من الحالات ، يتم تلخيص عناصر متعددة أو رسمها فوق بعضها البعض ، ولا يتم عرض التسميات الطويلة.
  • سحق: يتم رسم كل عنصر على حدة ، ولكن بنصف ارتفاع وبدون ملصق. (غير مدعوم لجميع الأنواع.)
  • الحزمة: يتم عرض العناصر بشكل فردي بارتفاع كامل ، ولكن في مساحة عمودية مضغوطة أكثر بكثير من الوضع الكامل. (غير مدعوم لجميع الأنواع.)
  • كامل: يتم عرض كل عنصر كسطر منفصل في صورة المتصفح. قد يتم عرض الإشارات الرسومية على ارتفاعات متفاوتة.

يحدد ملفًا يحتوي على وصف كامل لمسار بتنسيق HTML. يرتبط مسار اسم الملف هذا بمسار ملف trackDb. لاحقة ".html" ضمنية.

لكي تتوافق مع أوصاف مسار متصفح الجينوم القياسي ، يجب أن يحتوي هذا الوصف على عدة أقسام كما هو موضح أدناه. هنا رابط لنموذج يمكنك استخدامه.

بضع جمل تصف محتويات المسار وما يحاول إظهاره. يمكن أن يتضمن الوصف فقرات إضافية تقدم مزيدًا من التفاصيل ويمكن أن يتضمن روابط لمصادر خارجية.

اصطلاحات العرض والتكوين

وصف لما تمثله الشاشة. يتضمن هذا وصفًا لمصطلحات التلوين وأي صور رمزية خاصة مستخدمة في المسار. قد يصف كيفية تفسير الدرجات أو قيم الإشارة الكاملة. يمكن استخدام هذا القسم أيضًا لوصف كيفية تخصيص العرض باستخدام عناصر التحكم في التكوين.

وصف لكيفية إنشاء البيانات ، والذي قد يشمل كيفية معالجة العينات المادية بالإضافة إلى تفسيرات خوارزميات معالجة البيانات.

أسماء ومؤسسات الذين أجروا التجارب و / أو أعدوا البيانات وأي مصادر تمويل. يجب أن يتضمن هذا القسم عنوان بريد إلكتروني للاتصال للأسئلة المتعلقة بالبيانات.

الإشارات إلى أي عمل منشور يشير إلى هذه البيانات أو يعتمد عليها بالإضافة إلى أي مصادر يستند العمل إليها أو يمكن فهمها.

شائعة ، وإن كانت أقل استخدامًا

تتوفر الإعدادات التالية للعديد من أنواع المسارات أو جميعها ، ولكنها أقل استخدامًا. معظمها اختياري ، ولكن قد يكون بعضها مطلوبًا لأنواع مسارات محددة أو في مواقف محددة.

موقع ملف البيانات البعيد الذي يحتوي على بيانات ارتباط السلسلة.

موقع ملف البيانات البعيد الذي يحتوي على الجزء الأكبر من بيانات المسار.هذا الإعداد مطلوب لجميع مسارات البيانات في محور المسار.

الإعداد هو إما عنوان URL الكامل (بما في ذلك http: أو بروتوكول آخر) أو أنه متعلق بالدليل الذي يوجد فيه ملف trackDb الذي يحتوي على هذا الإعداد. يجب أن يكون الملف بأحد تنسيقات ملفات البيانات البعيدة المدعومة: bam / cram أو bigBarChart أو bigBed أو bigChain أو bigLolly أو bigInteract أو bigMaf أو bigPsl أو bigGenePred أو bigNarrowPeak أو bigWig أو vcfTabix. لاحظ أن أنواع bam / cram و vcfTabix / vcfPhasedTrio تتطلب ملف فهرس منفصل يجب أن يحمل نفس اسم ملف البيانات بالإضافة إلى لاحقة قياسية (".bai" و ".tbi" على التوالي) ، ما لم يتم استخدام bigDataIndex. سيتم استبدال جميع تكرارات السلسلة $ D في عنوان URL باسم قاعدة بيانات تجميع الجينوم. هذا يسمح باستخدام إدخال trackDb مع تجميعات متعددة. لم يتم تنفيذ استبدال $ D لمحاور المسار.

موقع ملف البيانات البعيد الذي يحتوي على الفهرس. يمكن استخدام هذا الإعداد عندما يتعذر وضع الفهرس بجانب ملف البيانات الضخمة ، على سبيل المثال بسبب أذونات الوصول المقيدة أو بسبب قيود اسم الملف.

الإعداد هو إما عنوان URL الكامل (بما في ذلك http: أو بروتوكول آخر) أو أنه متعلق بالدليل الذي يوجد فيه ملف trackDb الذي يحتوي على هذا الإعداد. يجب أن يكون الملف بأحد تنسيقات ملف بيانات الفهرس المدعومة: bai (BAM index) أو tbi (tabix index).

يقول جيم ، لكن لم لا. استخدمت من قبل. ->

يمكن وضع عناصر التحكم في التكوين داخل مربع في صفحة التكوين. هذا الإعداد للديكور فقط ، ولكن يمكن أن يجعل الصفحة المزدحمة تبدو أكثر تماسكًا. لا تدعم جميع أنواع المسارات حاليًا هذه الميزة ، ولكن الأنواع الأكثر شيوعًا تدعمها ، بما في ذلك الشعر المستعار ، والشعر المستعار الكبير ، والسرير ، والسرير الكبير. الافتراضي: إيقاف.

يمكن عرض معظم المسارات في أوضاع الرؤية الخمسة. ومع ذلك ، في بعض أنواع المسارات مثل الاهتزازات ، لا تقدم وضعا السحق والتعبئة أي ميزة حقيقية على الوضعين الكثيف والكامل. بشكل افتراضي ، لن تقدم هذه المسارات إعدادات الضرب والحزم. ومع ذلك ، يمكنك جعل المسار الخاص بك يقدم خيارات الرؤية هذه عن طريق تشغيل canPack. ملاحظة: ستعرض الفئات الفرعية للمركبات دائمًا جميع الخيارات الخمسة.

تسمح العديد من أنواع المسارات بتحديد لون البيانات المعروضة في الصورة باستخدام هذا الإعداد. يقبل الإعداد قيم الأحمر والأخضر والأزرق ، كل منها في النطاق من 0-255 ومحددة بفواصل. على الرغم من أن هذا الإعداد مدعوم على نطاق واسع ، تتجاهله بعض أنواع المسارات في أوضاع عرض معينة ، مثل مسارات EST في الوضع الكثيف.

هذا المثال يضبط اللون على الأحمر.

تسمح العديد من أنواع المسارات بتعيين نطاق ألوان يختلف من لون إلى بديل. على سبيل المثال ، تستخدم مسارات CpG Island إعداد altColor لعرض الجزر الأضعف ، بينما يتم عرض الجزر الأقوى بالألوان. إذا لم يتم تحديد altColor ، فسيستخدم النظام لونًا في منتصف المسافة بين ذلك المحدد في علامة اللون والأبيض بدلاً من ذلك.

يضبط هذا المثال اللون البديل على اللون الأزرق.

لا تحتوي بعض مجموعات البيانات على بيانات لجميع كروموسومات الجينوم. عندما يكون هذا صحيحًا ، استخدم هذا الإعداد كقائمة للكروموسومات المغطاة مفصولة بفواصل. يعرض النظام رسالة مفادها أنه لا توجد بيانات متاحة عندما يتصفح المستخدم كروموسومات غير مدرجة في هذه القائمة.

يمكن أيضًا تكوين معظم عروض المسار التي يمكن للمستخدم تكوينها من داخل صورة المتصفح مباشرةً من خلال خيار النقر بزر الماوس الأيمن الذي ينبثق مربع حوار التكوين. بينما تعمل هذه الوظيفة على غالبية أنواع المسارات ، فإن بعض مربعات حوار التهيئة معقدة للغاية أو تحتوي على قدر كبير جدًا من عناصر التحكم في جافا سكريبت المضمنة بحيث لا يمكن تهيئتها بشكل موثوق من خلال نافذة منبثقة. لإيقاف القدرة على تكوين المسار عن طريق النقر بزر الماوس الأيمن ، قم بتغيير هذا الإعداد إلى "إيقاف". سيظل المستخدم قادرًا على تكوين المسار في صفحة تكوين المسار. افتراضي في.

إذا كان هذا الإعداد "تشغيل" ، فإن لون الملصقات الموجودة على اليسار على شاشة المسار سيكون لونه أغمق إلى حد ما من عرض المسار نفسه. يمكن أن يكون هذا مفيدًا عندما يكون لون المسار (الذي ربما تم اختياره للالتزام بالاصطلاحات الخارجية) فاتحًا جدًا للملصقات القابلة للقراءة.

تخضع العديد من المسارات لمراجعات متعددة بمرور الوقت. في بعض الحالات ، يجب الاحتفاظ بالإصدارات القديمة ، ولكن حتى إذا لم تكن كذلك ، فقد يكون من المفيد الإعلان عن الإصدار الحالي للمسار. استخدم هذا الإعداد لعرض بيان الإصدار في صفحة تكوين المسار وصفحة تفاصيل العنصر للمسار. ستدعم السلسلة HTML محدود. بالنسبة للمسارات الأصلية ، وليس لوحات الوصل ، يمكن أن يكون هذا الإعداد أيضًا اسم ملف محلي مطلق لقراءة سلسلة الإصدار منه.

بشكل افتراضي ، يمكن ربط العناصر المعروضة في صورة المستعرض بصفحة تفاصيل تقدم معلومات حول هذا العنصر. يمكن للرابط بدلاً من ذلك الانتقال إلى عنوان URL المعلن هنا. تم تنسيق عنوان URL كسطر printf بما في ذلك الحقول التالية بهذا الترتيب:

  • ٪ s - اسم العنصر
  • ٪ s - اسم الكروموسوم
  • ٪ d - موضع بدء الكروموسوم (نسبة إلى الصفر)
  • ٪ d - موضع نهاية الكروموسوم (نسبة إلى واحد)
  • ٪ s - اسم المسار
  • ٪ s - اسم قاعدة البيانات

لا يلزم وجود جميع الحقول ، ولكن يجب أن تكون الحقول الموجودة بهذا الترتيب ، وفي حالة وجود حقل لاحق ، يجب استخدام جميع الحقول السابقة. يمكن أن يكون عنوان URL إما عنوان URL خارجيًا كاملاً أو محليًا لموقع الويب.

"العربة" هي جدول مخفي يحتوي على التحديدات المستمرة التي قام بها المستخدمون في متصفح الجينوم. لضمان وصول directUrl إلى إعدادات سلة التسوق هذه ، قم بتضمين معرف متصفح المستخدم مع هذا الإعداد.

في هذا المثال ، سيتم إلحاق معرف متصفح المستخدم بعنوان URL المحدد بواسطة directUrl بحيث تكون إعدادات سلة التسوق متاحة.

يسمح هذا الإعداد بدمج صفحة html خارجية في صفحة التفاصيل الافتراضية ، كإطار iframe. يمكن استخدام متغيرات الاستبدال المعتادة ضمن عنوان URL هذا:

  • $ - ID ، سيتم استبداله باسم عنصر أو معرف سلسلة آخر اعتمادًا على الحقول في نوع المسار المحدد.
  • $ T - اسم جدول قاعدة البيانات
  • $ S - اسم الكروموسوم (اسم السقالة على تجميعات السقالة)
  • $ [- أقصى موضع يسار لنافذة العرض الحالية (نسبة إلى الصفر)
  • $] - أقصى موضع في أقصى يمين نافذة العرض الحالية (نسبة إلى واحد)
  • $ <- موقع بدء العنصر الذي تم النقر فوقه (بالنسبة إلى الصفر)
  • $> - موقع نهاية العنصر الذي تم النقر فوقه (متعلق بعنصر)
  • $ s - اسم كروموسوم بدون chr البادئة (أو بدون سقالة_ أو سقالة_ البادئة على تجميعات السقالة)
  • $ D - اسم قاعدة البيانات (مثل "hg19")
  • $ P - جزء اسم العنصر قبل الأول: في الاسم
  • $ p - جزء اسم العنصر بعد الأول: بالاسم حتى النقطتين التاليتين
  • taxId $ - معرف تصنيف NCBI للكائن الحالي (من hgCentral.dbDb)
  • $ n - الاسم العلمي للكائن الحالي (من hgCentral.dbDb)

يمكن أن يكون عنوان URL إما عنوان URL خارجيًا كاملاً أو محليًا لموقع الويب.

في HTML ، لا يمكن تغيير حجم إطارات iframes بسهولة ، لذا فإن الحجم الثابت الافتراضي هو 1024 بكسل. يمكن تغيير هذا باستخدام خيارات iframe

عند استخدام iframeUrl ، تحدد هذه العبارة سلسلة يتم إدراجها حرفيًا في علامة HTML & ltiframe & gt. يمكن أن يتضمن الخيارات اللازمة لتنسيق iframe ، مثل العرض والارتفاع والتمرير وما إلى ذلك.

في حالة عدم وجود العبارة ، يكون العرض الافتراضي هو العرض = '100٪' height = '1024'.

ملاحظة: تغيير الحجم الديناميكي لإطارات iframe ليس بالأمر السهل ، حيث يجب تغيير حجمها باستخدام جافا سكريبت ، عبر المجالات. نوصي بالحفاظ على الحجم ثابتًا واستخدام أشرطة التمرير.

هذا المثال يصلح الحجم إلى 800 × 800 بكسل وينشط أشرطة التمرير.

بشكل افتراضي ، يمكن ربط العناصر المعروضة في صورة المستعرض بصفحة تفاصيل تقدم معلومات حول هذا العنصر. يمكن للرابط بدلاً من ذلك الانتقال إلى عنوان URL المعلن هنا. تم تنسيق عنوان URL كسطر printf بما في ذلك الحقول التالية بهذا الترتيب:

  • ٪ s - اسم العنصر
  • ٪ s - اسم الكروموسوم
  • ٪ d - موضع بدء الكروموسوم (نسبة إلى الصفر)
  • ٪ d - موضع نهاية الكروموسوم (نسبة إلى واحد)
  • ٪ s - اسم المسار
  • ٪ s - اسم قاعدة البيانات

لا يلزم وجود جميع الحقول ، ولكن يجب أن تكون الحقول الموجودة بهذا الترتيب ، وفي حالة وجود حقل لاحق ، يجب استخدام جميع الحقول السابقة. يمكن أن يكون عنوان URL إما عنوان URL خارجيًا كاملاً أو محليًا لموقع الويب.

اسم التجمع الآخر في المحاذاة الزوجية لهذا المسار.

الأنواع الأخرى (بخلاف المرجع) في المحاذاة هي مجموعة مكبر الصوت في نفس ملف HAL.

غالبًا ما تحتاج أنواع المسارات التي تُظهر المحاذاة الزوجية إلى الإعلان عن الأنواع / التجميعات الأخرى المضمنة في المحاذاة. تشمل الأنواع التي تستخدم هذا الإعداد bed ، و chain ، و netAlign ، و psl ، و snake.

يعيّن هذا المثال التجميع الثاني في المحاذاة لتجميع الماوس mm10.

إصدار التجميع الأصلي الذي تم إنشاء مجموعة البيانات من أجله. قد تكون مجموعات البيانات التي تم إنشاؤها عن طريق التعيين إلى مجموعة جينوم واحدة مفيدة بما يكفي لتعيينها إلى مجموعة أحدث. من الناحية المثالية ، سيتم إعادة إنشاء مجموعات البيانات لتعيين إحداثيات التجميعات الجديدة ، ولكن في بعض الأحيان لا يكون هذا عمليًا أو مناسبًا. لذلك ، قد يتم "رفع" إحداثيات الجينوم الخاصة بمجموعة البيانات إلى التجميع الأحدث. في بعض الحالات يؤدي هذا إلى تمثيل أدنى ولكن مع ذلك مفيد. يجب أن يكون لمجموعات البيانات هذه تجميعها الأصلي معرّفًا بهذا الإعداد.

يمكن تمييز مسارات معينة بشكل مرئي في قائمة المتصفح باستخدام رمز أو تسمية نصية ورابط لوصف معنى العلامات. يتم عرض الرمز بجوار التسمية القصيرة للمسار في قسم مجموعات المسارات أسفل صورة المستعرض ، وفي وصف المسار وصفحات التكوين. يمكن إضافة رموز pennantIcons متعددة على مسار واحد عن طريق فصل كل إدخال بفاصلة منقوطة ''. يتكون هذا الإعداد من ثلاثة أجزاء:

  • أيقونة - يمكن أن يكون عنوان URL مؤهلًا بالكامل (http ، https ، ftp) لملف صورة ، أو اسم صورة في دليل صور المستعرض في شجرة مصدر المتصفح.
  • نص - تسمية كلمة واحدة. يتم تجاهل حالة الأحرف ، يتم عرض التسمية بأحرف كبيرة صغيرة.
  • اللون - اسم لون HTML لتلوين تسمية النص
  • html - مسار html نسبي أو كامل لوثيقة وصف تشرح معنى الرمز. يتم عرض هذه الصفحة عندما ينقر المستخدم على الرمز.
  • تلميح - نصيحة "سلسلة مقتبسة" ستظهر عندما يحوم مؤشر الماوس الخاص بالمستخدم فوق الرمز.

تُستخدم الأولوية لتحديد ترتيب المسار داخل مجموعة المسار أو مركز البيانات الخاص به ، بالإضافة إلى الترتيب الافتراضي داخل صورة المستعرض. يمكن للمستخدم تغيير الترتيب داخل الصورة ديناميكيًا وسيعتمد دائمًا على المسارات الأخرى المرئية حاليًا. عادةً ما يتم تعيين الأولوية فقط للمسارات التي يتم تشغيلها افتراضيًا من أجل تحريكها قبل المسارات الأخرى. يتم عرض المسارات ذات الأولوية داخل مجموعة أو مركز بيانات بترتيب أولوية تصاعدي ، متبوعة بمسارات غير مرتبة حسب الأولوية مرتبة أبجديًا بواسطة تسمية قصيرة. يتم فرز المسارات التي لها نفس الأولوية داخل مجموعة أو محور حسب التسمية القصيرة. الأولوية هي رقم الفاصلة العائمة. الافتراضي: 0.

يحدد هذا إصدار المستعرض حيث سيتم عرض المسار. يمكن أن تحتوي على أي مجموعة من القيم الثلاث:

  • ألفا - معروض على متصفح ألفا (ويعرف أيضًا باسم اختبار الجينوم ، hgwdev)
  • beta - معروض على متصفح بيتا (ويعرف أيضًا باسم hgwbeta)
  • عام - تم إصداره في المتصفح العام (المعروف أيضًا باسم genome.ucsc.edu)

الافتراضي: ألفا ، بيتا ، عام (جميع المتصفحات الثلاثة).

إعداد المسار لمعظم المسارات هو نفس اسم الجدول. ومع ذلك ، في بعض الحالات ، من المستحسن الرجوع إلى نفس الجدول في أكثر من مسار واحد. مثال على ذلك هو إظهار جدول كمسار إشارة فردي وكجزء من مسار تراكب مركب ، كما هو موضح لاحقًا في هذا المستند. بالنسبة للبيانات الموجودة في جداول MariaDB ، يجب استخدام هذا الإعداد إذا لم يكن إعداد المسار هو اسم الجدول.

يسمح مستعرض الجدول عادةً بالاستعلام عن بعض أو كل البيانات الأولية لمسار ما وتنزيلها. تمنع القيمة off وصول مستعرض الجدول إلى مجموعات البيانات مع قيود (على سبيل المثال ، تلك ذات قيود السرية أو الترخيص). تسمح قيمة noGenome بالاستعلامات داخل مناطق جينومية محددة ، ولكن ليس على مستوى الجينوم. من خلال تسمية جداول إضافية في هذا الإعداد ، يمكن أيضًا رفض الوصول إلى هذه الجداول.

يتم حظر الجدول الخاص بهذا المسار ، بالإضافة إلى جداول decipherRaw و knownToDecipher ، من الوصول إلى مستعرض الجدول.

يتم تعطيل الاستعلامات على مستوى الجينوم لجدول التتبع بالإضافة إلى omimAv و omimAvRepl. الاستعلامات عن المناطق الجينومية مسموح بها.

تسمح العديد من المسارات بارتباط خارجي عند فحص عنصر بيانات المسار الفردي. استخدم هذا الإعداد لوضع ارتباط إلى عنوان URL خارجي على صفحة التفاصيل. قد يشتمل عنوان url على أحرف البدل التي سيتم استبدالها بقيم من بيانات المسار أو متغيرات المتصفح الأخرى:

  • $ - ID ، سيتم استبداله باسم عنصر أو معرف سلسلة آخر اعتمادًا على الحقول في نوع المسار المحدد.
  • $ T - اسم جدول قاعدة البيانات
  • $ S - اسم الكروموسوم (اسم السقالة على تجميعات السقالة)
  • $ [- أقصى موضع يسار نافذة العرض الحالية (نسبة إلى الصفر)
  • $] - أقصى موضع في أقصى يمين نافذة العرض الحالية (نسبة إلى واحد)
  • $ <- موقع بدء العنصر الذي تم النقر فوقه (بالنسبة إلى الصفر)
  • $> - موقع نهاية العنصر الذي تم النقر فوقه (متعلق بعنصر)
  • $ s - اسم كروموسوم بدون chr البادئة (أو بدون سقالة_ أو سقالة_ البادئة على تجميعات السقالة)
  • $ D - اسم قاعدة البيانات (مثل "hg19")
  • $ P - جزء اسم العنصر قبل الأول: في الاسم
  • $ p - جزء اسم العنصر بعد الأول: في الاسم ، حتى النقطتين التاليتين
  • taxId $ - معرف تصنيف NCBI للكائن الحالي (من hgCentral.dbDb)
  • $ n - الاسم العلمي للكائن الحالي (من hgCentral.dbDb)

المطالبة الافتراضية التي سيشاهدها المستخدم لعنوان url هذا هي "الرابط الخارجي:". استخدم urlLabel لتقديم موجه أكثر إفادة.

بالنسبة للمسارات المحلية (غير المحورية) ، يمكن استخدام إعداد إضافي للعثور على معرف من جدول آخر بناءً على اسم العنصر أو المعرف من جدول المسار. القيمة التي تم العثور عليها ستحل محل الرمز "$" في عنوان url. لاحظ أن تنسيق إعداد trackDb هذا هو تنسيق لغة C عادي بحيث يحل العنصر محل الرمز المميز "٪ s" في عبارة sql.

تسمح العديد من المسارات بارتباط خارجي عند فحص عنصر بيانات المسار الفردي. استخدم هذا الإعداد لوضع ارتباط إلى عنوان URL خارجي على صفحة التفاصيل. قد يشتمل عنوان url على أحرف البدل التي سيتم استبدالها بقيم من بيانات المسار أو متغيرات المتصفح الأخرى:

  • $ - ID ، سيتم استبداله باسم عنصر أو معرف سلسلة آخر اعتمادًا على الحقول في نوع المسار المحدد.
  • $ T - اسم جدول قاعدة البيانات
  • $ S - اسم الكروموسوم (اسم السقالة على تجميعات السقالة)
  • $ [- أقصى موضع يسار نافذة العرض الحالية (نسبة إلى الصفر)
  • $] - أقصى موضع في أقصى يمين نافذة العرض الحالية (نسبة إلى واحد)
  • $ <- موقع بدء العنصر الذي تم النقر فوقه (بالنسبة إلى الصفر)
  • $> - موقع نهاية العنصر الذي تم النقر فوقه (متعلق بعنصر)
  • $ s - اسم كروموسوم بدون chr البادئة (أو بدون سقالة_ أو سقالة_ البادئة على تجميعات السقالة)
  • $ D - اسم قاعدة البيانات (مثل "hg19")
  • $ P - جزء اسم العنصر قبل الأول: في الاسم
  • $ p - جزء اسم العنصر بعد الأول: في الاسم ، حتى النقطتين التاليتين
  • taxId $ - معرف تصنيف NCBI للكائن الحالي (من hgCentral.dbDb)
  • $ n - الاسم العلمي للكائن الحالي (من hgCentral.dbDb)

المطالبة الافتراضية التي سيشاهدها المستخدم لعنوان url هذا هي "الرابط الخارجي:". استخدم urlLabel لتقديم موجه أكثر إفادة.

هذا مشابه لعلامة url ، لكنه يسمح بعناوين url في الحقول التي ليست في حقل "name". استخدم هذا البيان إذا كنت بحاجة إلى روابط متعددة في صفحة التفاصيل أو إذا كان الارتباط الخاص بك لا يعتمد على حقل الاسم.

ضع معرفات هذه الروابط في حقول bigBed الموسعة كما هو موضح في المثال 3 من وثائق bigBed. أسماء الحقول من ملف .as هي أسماء الحقول المشار إليها في هذه العبارة. تدعم عناوين url في هذا البيان نفس أحرف البدل مثل بيان url. تأكد من إحاطة عناوين URL بعلامات اقتباس مزدوجة. التسمية الافتراضية للمعرف هي وصف الحقل في ملف as (كل النص بعد علامة #).

إذا كان الحقل يحتوي على "|" الرمز ، الجزء الذي يسبق الرمز يُستخدم لاستبدال حرف البدل $ والجزء الذي يليه كتسمية. هذا مشابه لكيفية تشفير Wikpedia للارتباطات. في المثال أدناه ، تؤدي قيمة الحقل pmid "115330 | Doe، J. et al" إلى إنشاء ارتباط بعنوان URL https://www.ncbi.nlm.nih.gov/pubmed/115330 والتسمية " Doe ، J. et al ".

إذا كان هذا الإعداد "قيد التشغيل" ، فلن تعرض صفحة تفاصيل العنصر الحقول التي تحتوي على قيم فارغة. يمكن أن يكون هذا مفيدًا عندما يكون لديك العديد من الحقول الإضافية ولكن القليل منها فقط له قيمة.

يمكن استخدام هذا الإعداد لمنع الحقول الإضافية في صفحة تفاصيل العنصر. يمكن أن يكون مفيدًا إذا كنت لا تريد إظهار الحقول المستخدمة فقط لـ mouseOvers أو التسميات.

يغير هذا الإعداد صفحة تفاصيل العنصر ويقسم الجدول المستخدم لإظهار الحقول الإضافية قبل أي من الحقول المحددة. قد يكون من المفيد فصل الحقول الإضافية بصريًا إلى فئات منطقية.

بالنسبة لملفات bigBed التي تحتوي على أكثر من 8 حقول ، فإن هذا يضيف مؤشر الماوس فوق النص الذي يختلف عن حقل "الاسم" في ملف bigBed. إذا كان الحقل فارغًا ، فسيرجع مؤشر الماوس فوقه إلى حقل الاسم.

لإنجاز هذا العمل ، قم بإنشاء ملف bigBed يحتوي على 8 أعمدة على الأقل ووضع النص الخاص بالماوس في حقل كبير كبير الحجم كما هو موضح في المثال 3 من وثائق bigBed. اسم الحقل من ملف .as الخاص بك هو اسم الحقل لهذه العبارة.

بالنسبة لملفات bigBed ، ينشئ هذا الإعداد مؤشر الماوس فوق النص من نمط يعتمد على قيم الحقول في الملف. يتم إنشاء النمط بأسماء الحقول من ملف كملف ، مسبوقًا بعلامة الدولار ($) ، ويمكن أن يتضمن نصًا عشوائيًا بين أسماء الحقول.

يؤدي هذا الإعداد إلى ظهور رابط في تكوين المسار وصفحات تفاصيل العناصر لبدء عرض مناطق مخصصة متعددة المناطق ، حيث يتم تحديد المناطق بواسطة الملف المقدم كوسيطة للإعداد. إنه مفيد للمسارات ذات التعليقات التوضيحية المتفرقة في الجينوم. يجب أن يكون الملف بتنسيق BED ، ويجب أن يحتوي على عدد محدود (على سبيل المثال من 2 إلى 10) مناطق ذات أهمية للمقطع الصوتي. يمكن أن يكون تنسيق BED 3 (كروم ، بداية ، نهاية) ، ولكن قد يحتوي على أي عدد من الحقول الإضافية. عند النقر فوق الارتباط ، يتم أيضًا إنشاء مسار مخصص مصاحب لتمييز المناطق المعروضة وتحديد عنوانها. إذا كان حقل الاسم (الحقل 4) موجودًا في ملف BED ، فسيتم عرض اسم كل منطقة في المسار المخصص.

  • يتم عرض الصورة المصغرة الخاصة (NHGRI helix) قبل تسمية المسار في قائمة مسار المتصفح
  • يتم عرض شعار ENCODE على صفحة تكوين المسار
  • تظهر روابط المتصفح "التنزيلات" و "المعاينة" في الجزء العلوي الأيمن من صفحة تكوين المسار
  • يتضمن وصف المسار ملاحظة حول البيانات الموجودة في متصفح المعاينة
  • تظهر روابط "التنزيلات" و "البيانات الوصفية" بعد "عرض الجدول:" في صفحة تفاصيل المسار

Bed / bigBed: عنصر أو مسارات المنطقة

بعض أنواع المسارات الأكثر شيوعًا هي تلك التي تسلط الضوء على مناطق أو عناصر ذات أحجام مختلفة في مجموعة الجينوم. هناك العديد من الاختلافات في مسار "العناصر" ، ومعظمها محدد بتنسيق سرير أو سرير كبير. هذان التنسيقان عبارة عن مجموعة من العديد من التنسيقات تبدأ جميعها بثلاثة حقول مشتركة (نهاية بداية الكروموسوم) ولديها عددًا أكبر من الحقول اختياريًا. للحصول على تعريفات كاملة لتنسيق السرير أو bigBed ، يرجى الاطلاع على الأسئلة الشائعة.

BigChain: محاذاة زوجية على مستوى الجينوم

يصف تنسيق bigChain المحاذاة الزوجية التي تسمح بوجود فجوات في كلا التسلسلين في وقت واحد ، تمامًا كما تفعل ملفات السلسلة ، ولكن يتم ضغط ملفات bigChain وفهرستها على أنها BigBeds.يتم إنشاء ملفات bigChain باستخدام برنامج bedToBigBed مع ملف AutoSQL خاص يحدد حقول سلسلة bigChain. تكون ملفات bigChain الناتجة في تنسيق ثنائي مفهرس. الميزة الرئيسية لملفات bigChain هي أنه يتم نقل أجزاء فقط من الملفات المطلوبة لعرض منطقة معينة إلى UCSC. لذلك بالنسبة لمجموعات البيانات الكبيرة ، يكون bigChain أسرع بكثير من ملفات Chain العادية. يظل ملف bigChain على خادم الويب الذي يمكن الوصول إليه (http أو https أو ftp) ، وليس على خادم UCSC. يتم تخزين الجزء المطلوب فقط لموضع الكروموسومات الذي تشاهده حاليًا محليًا على أنه "ملف متفرق". للحصول على تعريفات تنسيق bigChain كاملة ، يرجى مراجعة صفحة تعليمات bigChain.

BigPsl: المحاذاة الزوجية

يخزن تنسيق bigPsl المحاذاة بين تسلسلين ، كما تفعل ملفات PSL ، ولكن يتم ضغطها وفهرستها على أنها BigBeds. يتم إنشاء ملفات bigPsl باستخدام برنامج bedToBigBed مع ملف AutoSQL خاص يحدد حقول bigPsl. تكون ملفات bigPsl الناتجة في تنسيق ثنائي مفهرس. الميزة الرئيسية لملفات bigPsl هي أنه يتم نقل أجزاء فقط من الملفات المطلوبة لعرض منطقة معينة إلى UCSC. لذلك بالنسبة لمجموعات البيانات الكبيرة ، يكون bigPsl أسرع بكثير من ملفات PSL العادية. يظل ملف bigPsl على خادم الويب الذي يمكن الوصول إليه (http أو https أو ftp) ، وليس على خادم UCSC. يتم تخزين الجزء المطلوب فقط لموضع الكروموسومات الذي تشاهده حاليًا محليًا على أنه "ملف متفرق". للحصول على تعريفات تنسيق bigPsl كاملة ، يرجى مراجعة صفحة تعليمات bigPsl.

BigGenePred: التعليقات التوضيحية الجينية

يخزن تنسيق bigGenePred عناصر التعليقات التوضيحية التي هي عبارة عن مجموعة مرتبطة من exons ، تمامًا مثل ملفات BED المفهرسة مثل bigBeds ، ولكن لدى bigGenePred معلومات إضافية حول إطارات الترميز وغيرها من المعلومات الخاصة بالجينات في ثمانية حقول إضافية. يتم إنشاء ملفات bigGenePred باستخدام برنامج bedToBigBed مع ملف AutoSQL خاص يحدد حقول bigGenePred. تكون ملفات bigBed الناتجة بتنسيق ثنائي مفهرس. الميزة الرئيسية لملفات bigBed هي أنه يتم نقل أجزاء فقط من الملفات المطلوبة لعرض منطقة معينة إلى UCSC. لذلك بالنسبة لمجموعات البيانات الكبيرة ، يكون bigBed أسرع بكثير من ملفات BED العادية. يظل ملف bigBed على خادم الويب الذي يمكن الوصول إليه (http أو https أو ftp) ، وليس على خادم UCSC. يتم تخزين الجزء المطلوب فقط لموضع الكروموسومات الذي تشاهده حاليًا محليًا على أنه "ملف متفرق". للحصول على تعريفات تنسيق bigGenePred كاملة ، يرجى مراجعة صفحة تعليمات bigGenePred.

BigNarrowPeak: القمم

يخزن تنسيق bigNarrowPeak قممًا عبر نطاق مع ذروة مركزية أساسية واحدة. تستند ملفات bigNarrowPeak إلى تنسيق bigBed. الحقول الستة الأولى هي نفسها مثل السرير. تشتمل الأربعة الأخرى على ثلاث درجات ، وإزاحة الزوج الأساسي للذروة المركزية. يتم إنشاء ملفات bigNarrowPeak باستخدام برنامج bedToBigBed مع ملف AutoSQL خاص يحدد حقول bigNarrowPeak. تكون ملفات bigBed الناتجة بتنسيق ثنائي مفهرس. الميزة الرئيسية لملفات bigBed هي أنه يتم نقل أجزاء فقط من الملفات المطلوبة لعرض منطقة معينة إلى UCSC. لذلك بالنسبة لمجموعات البيانات الكبيرة ، يكون bigBed أسرع بكثير من ملفات BED العادية. يظل ملف bigBed على خادم الويب الذي يمكن الوصول إليه (http أو https أو ftp) ، وليس على خادم UCSC. يتم تخزين الجزء المطلوب فقط لموضع الكروموسومات الذي تشاهده حاليًا محليًا على أنه "ملف متفرق". للحصول على تعريفات كاملة لتنسيق bigNarrowPeak ، يرجى الاطلاع على صفحة تعليمات bigNarrowPeak.

BigMaf: محاذاة متعددة

يقوم تنسيق bigMaf بتخزين محاذاة متعددة بتنسيق متوافق مع ملفات MAF ، والتي يتم ضغطها وفهرستها بعد ذلك على أنها أسرة كبيرة. يتم إنشاء ملفات bigMaf باستخدام برنامج bedToBigBed مع ملف AutoSQL خاص يحدد حقول bigMaf. تكون ملفات bigMaf الناتجة في تنسيق ثنائي مفهرس. الميزة الرئيسية لملفات bigMaf هي أنه يتم نقل أجزاء فقط من الملفات المطلوبة لعرض منطقة معينة إلى UCSC. لذلك بالنسبة لمجموعات البيانات الكبيرة ، يكون bigMaf أسرع بكثير من ملفات MAF العادية. يظل ملف bigMaf على خادم الويب الذي يمكن الوصول إليه (http أو https أو ftp) ، وليس على خادم UCSC. يتم تخزين الجزء المطلوب فقط لموضع الكروموسومات الذي تشاهده حاليًا محليًا على أنه "ملف متفرق". للحصول على تعريفات تنسيق bigMaf كاملة ، يرجى مراجعة صفحة تعليمات bigMaf.

BigBed: عنصر أو مسارات المنطقة

بعض أنواع المسارات الأكثر شيوعًا هي تلك التي تسلط الضوء على مناطق أو عناصر ذات أحجام مختلفة في مجموعة الجينوم. هناك العديد من الاختلافات في مسار "العناصر" ، يمكن تمثيل معظمها بتنسيق bigBed. هذا التنسيق عبارة عن مجموعة من العديد من التنسيقات تبدأ جميعها بثلاثة حقول مشتركة (نهاية بداية الكروموسوم) ولديها عددًا أكبر من الحقول اختياريًا. للحصول على تعريفات تنسيق bigBed كاملة ، يرجى الاطلاع على صفحة تعليمات bigBed.

HalSnake - محاذاة متعددة في ملف HAL

HAL هو ملف تم إنشاؤه بواسطة Cactus Progressive Alignment Suite ، راجع صفحة Cactus github.

إذا تم تضمين إعداد bigDataUrl ، فسيتم عرض البيانات الموجودة في الموقع المحدد بواسطة عنوان URL هذا. خلاف ذلك ، يمكن لجدول قاعدة البيانات الذي يحتوي على عمود واحد اسم الملف تحديد موقع ملف محلي أو عنوان URL. إذا كان جدول قاعدة البيانات يشتمل على عمود seqName ، فيمكن تحديد ملف VCF مختلف أو عنوان URL لكل تسلسل تجميع.

يمكن العثور على المثال أدناه.

يعلن كل من bed و bigBed عن عدد حقول الأسرة القياسية في البيانات. قد تتبع الحقول الإضافية هذه الحقول القياسية. إذا كان الأمر كذلك ، يجب أن ينتهي النوع بـ "+" (علامة زائد). حتى إذا لم تكن هناك حقول إضافية غير قياسية ، فإن المعلمة الإضافية '. (نقطة) مطلوبة ، إذا كان من المفترض أن يكون هذا المسار قابلاً للتكوين.

يمكن العثور على الأمثلة أدناه.

اكتب bigBed يعلن عن عدد حقول "السرير" القياسية في البيانات. قد تكون هناك حقول إضافية بعد هذه الحقول القياسية. إذا كان الأمر كذلك ، يجب أن ينتهي النوع بـ "+" (علامة زائد). حتى إذا لم تكن هناك حقول إضافية غير قياسية ، فإن المعلمة '. يجب تحديد '(نقطة) إذا كان من المفترض أن يكون هذا المسار قابلاً للتكوين.

كل من هؤلاء هو اختلاف متخصص في شكل السرير. يجب البحث عن تعريفاتهم المتخصصة في مكان آخر. ومع ذلك ، فإن مسارات العناصر هذه تشترك في العديد من نفس خيارات التكوين المتاحة لمسارات السرير.

يمكن العثور على مثال أدناه.

هذا الإعداد مخصص لمسارات نوع ملف البيانات البعيدة (مثل bigWig) وهو موصوف بالكامل في جزء "إعدادات trackDb العامة" من هذا المستند.

لتلوين العناصر بشكل مختلف حسب الخصلة التي تحاذيها ، استخدم إعداد colorByStrand. سيتم استخدام اللون الأول لمحاذاة الخصلة الزائدة والثاني للخصلة السالبة. هذا الإعداد غير متوافق مع الطيف وستكون جميع العناصر الموجودة على نفس الشريط لها نفس اللون ، بغض النظر عن درجة العنصر.

ستكون محاذاة الخصلة الزائدة ملونة باللون الأحمر ، وستكون محاذاة الخصلة ناقصة باللون الأزرق. هذا الإعداد غير متوافق مع الطيف ، وبالتالي فإن جميع العناصر الموجودة على نفس الشريط سيكون لها نفس اللون ، بغض النظر عن درجة العنصر.

في بعض الأحيان ، يتم أيضًا عرض الميزات التي يبرزها مسار السرير في جينوم واحد في مسارات جينومات أخرى. في حالة وجود عنصر يحمل نفس الاسم في مسارات السرير لجينومين أو أكثر ، يمكن إنشاء جسر بينهما بسهولة من خلال الروابط الموجودة في صفحة تفاصيل العنصر. لإنشاء هذا الارتباط ، يجب أن يكون للميزة نفس الاسم في كل جينوم ، ويجب أن يكون الاسم فريدًا ضمن مسار السرير لكل جينوم. مكونات هذا الإعداد هي قاعدة بيانات تجميع الجينوم ، وجدول وعمود اختياري ، مع تسمية للارتباط. إذا تم حذف معلمة العمود ، فمن المفترض أن تكون الاسم. إذا تم حذف الجدول ، فمن المفترض أن يكون هو نفسه الجدول الحالي. يمكن إنشاء روابط لجينومات متعددة باستخدام هذا الإعداد ، حيث يتم ربط كل زوج بـ "=" ومحدَّد بالمساحة. تأكد من استخدام "_" كبديل للمسافات في الملصقات.

في هذا المثال لمسار المروج ثنائي الاتجاه hg18 ENCODE ، كل جينوم له مسار يحمل نفس الاسم ، والأسماء فريدة في كل مسار. ومع ذلك ، لن يتم العثور على محفز ثنائي الاتجاه مسمى في كل جينوم لذلك ، سيتم فقط عرض روابط الجينوم حيث يوجد الاسم بالفعل.

TODO: تنبيه خطأ: تم ترميز هذا بشكل ضيق وقد يواجه بعض المشكلات عندما تختلف أسماء الجدول أو العمود عن الاسم الافتراضي. يمكن توسيع هذه الميزة لتوفير رابط إلى أعلى نتيجة لـ liftOver ، إذا لم يتم العثور على جدول مسمى.

اكتب مسارات bigBed في الوضع الكثيف مخططًا للكثافة استنادًا إلى أقصى تغطية يمكن رؤيتها عند كل بكسل. يتوافق maxVal مع العدد الذي تصل فيه الحبكة إلى أقصى درجات الظلام. إذا كان maxVal يساوي 0 ، فسيتم حساب ذلك من البيانات نفسها.

عادةً ما يتم رسم الملصقات (حقل اسم BED) بجوار الميزات. تحاول هذه العبارة رسم تسمية الميزة فوق كتل exon. التأثير يعتمد على حجم الميزة على الشاشة ، والتي بدورها تعتمد على مستوى التكبير. إذا لم تكن هناك مساحة كافية لـ 4 أحرف ، فلن يتم رسم تسمية على الإطلاق. إذا كان هناك مساحة أكبر ، يتم رسم الملصق بلون متباين على الكتل الشبيهة بـ exon. إذا كانت قصيرة جدًا بالنسبة إلى النص ، فسيتم اقتطاعها لتلائم المساحة المتوفرة واللاحقة ".". لاحظ أنه لا ينبغي أن تحتوي الميزات على مناطق رفيعة جدًا (UTR) طويلة جدًا ، حيث قد يكون من الصعب قراءة النص في هذه الأجزاء.
للحفاظ على النص قابلاً للقراءة ، يتم عرض الأسهم التي تشير إلى الخيط فوق الإنترونات ، ولكن يتم منعها على الكتل ، لذلك يجب استخدام العبارة للمسارات التي لا تكون فيها الخيوط ذات أهمية أساسية ، أو غير محددة في حقل BED strand أو تم إلغاء تنشيطها باستخدام exonArrows.

في المسارات التي تعرض exons أو الكتل داخل الميزات ، تتيح أسهم exon للمستخدم الانتقال إلى exon التالي أو حظره خارج الصورة. عادةً ما يتم عرض أسهم Exon افتراضيًا في هذه الأنواع من المسارات ، باستثناء المسارات الموجودة في مجموعة التنظيم. يمكن إظهار الأسهم أو إخفاؤها بشكل صريح باستخدام هذا الإعداد.

يمكن إظهار أو إخفاء تمرير الماوس الذي يظهر أرقام exon و intron بشكل صريح باستخدام هذا الإعداد. الإعداد الافتراضي هو "on" لأنواع المسار genePred و bigGenePred.

يمكن ضبط النص باستخدام خياري "exonText" و "intronText". يتم تعيينها افتراضيًا على "exon" و "intron" ، على التوالي.

يتوفر عدد من المرشحات العددية لمسارات السرير. يتم تسمية هذه بشكل ملائم بواسطة الحقل الذي تمت تصفيته على. يعتمد المرشح العددي الأكثر شيوعًا على درجة حقل السرير القياسي ، وبالتالي يتم التحكم فيه عن طريق إعداد عامل تصفية النقاط. الأمثلة الأخرى هي pValueFilter و qValueFilter و signalFilter ، وهي مرشحات على حقول السرير غير القياسية المحددة في تنسيقات broadPeak و الضيقة. يجب أن تتضمن إعدادات التصفية الرقمية هذه القيمة الافتراضية. إذا كان الحقل الرقمي عبارة عن فاصلة عائمة ، فيجب أن يحتوي الحقل الافتراضي على منزلة عشرية واحدة على الأقل.

بشكل افتراضي ، يكون نطاق القيم لمرشح رقمي من 0 إلى 1000. ومع ذلك ، يمكنك بشكل صريح تعيين الحدود العليا والسفلى للمرشح عن طريق تعيين & ltcolumn & gtFilterLimits.

ستستبعد عوامل التصفية الرقمية العناصر التي تقع تحت الإعداد. وهذا يعني أن عامل تصفية الدرجة 800 سيستبعد جميع العناصر التي تقل درجة عن 800. يمكنك أيضًا تصفية القيم الموجودة داخل نطاق ، من خلال تضمين إعداد & ltcolumn & gtFilterByRange. على سبيل المثال ، سيتضمن نطاق الفلاتر من 800 إلى 900 فقط العناصر ذات الدرجات التي تبلغ 800 أو أعلى أو أقل من 900.

ملاحظة: يُسمح بفلاتر متعددة من حقول مختلفة.

في هذا المثال ، سيتم استخدام درجة حقل السرير القياسي ، وهي عدد صحيح ، لتصفية العناصر في المسار. بشكل افتراضي ، سيتم استبعاد العناصر ذات الدرجات الأقل من 100. أيضًا بشكل افتراضي ، تكون حدود الدرجة المرشح هي 0-1000.

سيتم ترشيح قيمة pValue لحقل السرير غير القياسي ، وهي النقطة العائمة ، حسب النطاق. نطاق البيانات المتوقع هو 0.0 إلى 15.0 ، وبشكل افتراضي سيتم عرض العناصر ذات القيم p في النطاق 3.0 إلى 15.0 فقط.

يمكن تصفية مسارات BigBed من النوع على درجة حقل السرير القياسي. يتم طلب هذا المرشح الرقمي من خلال إعداد ScoreFilter ، والتي يجب أن تتضمن القيمة الافتراضية.

بشكل افتراضي ، يتراوح نطاق القيم لمرشح النتيجة من 0 إلى 1000. ومع ذلك ، يمكنك تعيين الحد الأعلى والأدنى للمرشح بشكل صريح عن طريق تعيين ScoreFilterLimits.

سيستبعد مرشح النتيجة العناصر التي تقع تحت الإعداد. وهذا يعني أن عامل التصفية 800 سيستبعد جميع العناصر التي تقل درجاتها عن 800.

منذ إدخال مرشح ScoreFilter أكثر قوة. توجد خيارات & ltfieldName & gt حيث يمكن تصفية عمود النتيجة باستخدام بنية مختلفة. بهذه الطريقة ، يمكن استبدال كل من ScoreFilter 400 و ScoreFilterLimits 0: 1000 بـ filter.score 400 و filterByRange.score 0: 1000. تتمثل ميزة التبديل إلى عامل التصفية. & ltfieldName & gt في أنه يمكن أيضًا إضافة عوامل التصفية على bigBed & ltfieldNames & gt مثل filterText.disease أو filterValues.cellType حيث يمكن تصفية BigBeds المحددة بمرض أو عمود cellType. راجع عامل التصفية. & ltfieldName & gt لمزيد من المعلومات والأمثلة.

سيتم استخدام حقل درجة السرير القياسي ، وهو عدد صحيح لتصفية العناصر في المسار. بشكل افتراضي ، سيتم استبعاد العناصر ذات الدرجات الأقل من 300. لا يمكن ضبط الفلتر على أقل من 200 أو أكثر من 1000 ..

ليس للمراكز. غير مدعوم بعد من قبل bigBeds

طريقة أخرى لتصفية العناصر تعتمد على قيم منفصلة. قد يحتوي حقل واحد أو أكثر مثل الاسم أو الدرجة على عدد محدود من القيم المنفصلة التي يمكن تصفيتها على أساسها. سيتم عرض هذه القيم المنفصلة في قائمة منسدلة يمكن للمستخدم من خلالها اختيار خيار واحد أو أكثر. في حين أن الحد الأقصى لعدد الخيارات في القائمة غير محدود ، فإن عرض الكثير من الخيارات قد يكون محيرًا للمستخدم.

  • نظرًا لأن مرشحات الحقول المختلفة محددة بمسافة بيضاء ، يجب استبدال أي مسافة بيضاء في العناوين والتسميات بالحرف "_" (شرطة سفلية).
  • يتم ضم كل زوج حقل / خيار بواسطة "=" (علامة التساوي).
  • يمكن أن يكون لجزء الحقل عنوان محدد من اسم الحقل بواسطة ": (نقطتان)".
  • سيكون لمرشح الحقل الفردي خيارات متعددة محددة بفواصل.
  • إذا كانت الخيارات عبارة عن فهرس مبني على 1 (1،2،3) ، فيمكن أن تسبق قائمة الخيارات بعلامة "+" (علامة زائد) والخيارات نفسها عبارة عن ملصقات فقط.
  • وإلا ، فسيكون كل خيار قيمة وتسمية اختيارية محددة بـ '| ' (شريط عمودي). لاحظ أنه إذا كان أحد الخيارات يحتوي على تسمية ، فيجب أن تحتوي جميع خيارات هذا الفلتر على تصنيف.
  • أخيرًا ، قد تحتوي الخيارات على نمط CSS ملفوف الأقواس وإلحاقها بالنهاية.

بسبب هذا التعقيد ، يرجى تذكر استخدام سطر المتابعة "" لضمان سهولة قراءة الإعداد:

من المحتمل أن يتم إعادة تعريف هذا الإعداد في مرحلة ما ، نظرًا لأنه معقد للغاية. ومع ذلك ، سيتم دعم هذا التنسيق الحالي حتى يتم استبداله بالكامل.

  1. تجنب استخدام أحرف المحدد ، |: = <> في العناوين والتسميات. (يمكن تضمين هذه الأحرف عبر أكواد HTML.) يمكن تضمين المسافات باستخدام الحرف "_".
  2. يمكن أن تكون تسميات الخيارات ملونة أو لها سمات نمط CSS أخرى. قم بإلحاق النمط محاطًا بأقواس متعرجة ولا يحتوي على مسافات. على سبيل المثال: Pull_Over . إذا كان أحد الخيارات يحتوي على نمط CSS ، فيجب أن تتضمن جميع خيارات هذا المرشح تعريف نمط.
  3. يتم تنفيذ خيار filterBy في التعليمات البرمجية باستخدام جملة where. على سبيل المثال ، قد ينتج عن التصفية في حقل الاسم لـ "فريد" و "إيثيل" عبارة SQL حيث تكون عبارة "حيث الاسم في ('فريد' ، 'إيثيل')". في نوع مسارات genePred ، تُستخدم هذه المعرفة لتحديد عوامل التصفية في الحقول في جدول منفصل! يتم ذلك عن طريق تعريف المجال على أنه . .

أفضل طريقة لفهم هذا الإعداد هي باستخدام مثال. هذا مثال عملي في مسار hg19 "Open Chrom Synth".

يقوم هذا الإعداد بإعداد مرشحين ، أحدهما على حقل "اللون" والثاني للحقل "ocCode". يتم إعطاء مرشح اللون العنوان "مستوى التحقق من الصحة". الخيار الثاني له قيمة "255" وتسمية "فتح كروماتين (OC 2-3)". لاحظ أنه سيظهر باللون الأزرق في القائمة بسبب ملف تعريف النمط. لاحظ أيضًا أن جميع خيارات حقل اللون هذا لها نمط محدد ، على الرغم من أن الخيار الأول أسود وسيكون كذلك افتراضيًا. في هذا المثال ، المسافة البيضاء الوحيدة ضمن قسم قيمة الإعداد تسبق مباشرة تعريف المرشح الثاني. المرشح الثاني ، "ocCode" ، بعنوان "كود OC" الغامض. إنه مرشح فهرس رقمي (كما هو موضح بواسطة "+"). قيمة الخيار الثاني هي 2 ويتم تعريف التسمية فقط على أنها "Two: Dnase (all)". لاحظ أن النقطتين في التسمية هي رمز HTML.

مرشح بواسطة الإعداد قوي جدا. نوصي بتجربة الإعدادات لتحديد الأفضل لحالتك.

  • عامل التصفية حسب التاريخ
  • filterByNumber (حاليًا * عامل التصفية)
  • عامل التصفية
  • filterByWildList (مثل البحث في المسار)

يجب أن تعمل عناصر التحكم في التصفية العامة هذه من خلال "عبارة where" ويجب السماح بها في أي مسار يعتمد على العنصر بما في ذلك bigBeds! لاحظ أن bigBeds يدعم بالفعل ScoreFilter وستواجه دائمًا مشكلة أن التصغير لن يدعم التصفية. يجب أن تظهر واجهة مستخدم المتصفح عند تصفية المسارات ، بحيث يصبح فقدان الفلتر واضحًا!

عامل التصفية. & ltfieldName & gt يستخدم للبيانات الرقمية. يتطلب تمرير قيمة افتراضية. يمكن استخدام القيمة 0 (أو أدنى قيمة موجودة في مجموعة البيانات) لتمكين التصفية الرقمية ، مع عدم تصفية أي شيء افتراضيًا.

بشكل افتراضي ، نطاق قيم عامل التصفية. & ltfieldName & gt هو من 0 إلى 1000. ومع ذلك ، يمكنك بوضوح تعيين الحدود العليا والسفلى للمرشح باستخدام filterLimits. & ltfieldName & gt.

ستستبعد عوامل التصفية الرقمية العناصر التي تقع تحت الإعداد. أي ، عامل التصفية. & ltfieldName & gt من 800 سيستبعد جميع العناصر التي تقل درجاتها عن 800. يمكنك أيضًا تصفية القيم داخل نطاق من خلال تضمين إعداد filterByRange. & ltfieldName & gt. على سبيل المثال ، قم بتصفية. & ltfieldName & gt 800: 900 ستتضمن فقط العناصر ذات النتائج عند 800 أو أعلى أو أقل من 900. يوصى باستخدام filterByRange. & ltfieldName & gt مع filterLimits. & ltfieldName & gt لتعيين حدود الحدود.

ستكون تسمية المرشح هي وصف الحقل كما هو محدد بواسطة ملف autoSql (.as). يمكن تخصيص هذا التصنيف باستخدام معلمة filterLabel. & ltfieldName & gt. راجع صفحة تعليمات bigBed والمثال 3 لمزيد من المعلومات حول إنشاء ملفات فريدة. as لبيانات bigBed.

  • مرشح. & ltfieldName & gt يمكن استخدامها عدة مرات مع أعمدة مختلفة
  • يتم دعم كل من الأعداد الصحيحة والعشرية (عدد عشري)
  • سيتم التعامل مع أي قيم عمود / حقل تبدأ بأحرف غير رقمية على أنها أصفار
  • سيتم التعامل مع قيم اسم العمود / الحقل التي تبدأ برقم متبوعًا بأحرف غير رقمية كرقم فقط سيتم تجاهل الأحرف غير الرقمية (وأي أرقام تليها) (انظر المثال أدناه)
  • إذا كان اسم العمود / الحقل يحتوي على قيم سالبة ، فتأكد من تحديد قيمة افتراضية عند أدنى قيمة سلبية أو أقل منها لتجنب تصفية العناصر بشكل افتراضي (ما لم يكن هذا هو السلوك المقصود)
  • لكي تعمل المرشحات ، يجب أن يكون المسار من نوع bigBed N + أو اكتب bigBed N. مطلوب & quot + & quot (لمسارات bigBed +) أو & quot. & quot (لمسارات bigBed غير الممتدة)
  • بشكل افتراضي ، ستحتوي جميع مسارات السرير التي لا تقل عن bed5 على مرشح نقاط. سيؤدي تمكين أي من عوامل التصفية *. & ltfieldName & gt filter settings إلى تعطيل هذا الفلتر الافتراضي

في هذا المثال ، يتم تمكين التصفية لدرجة الحقل. نحن نمرر قيمة افتراضية 0 ، وهي عادة قيمة افتراضية آمنة لتمريرها حيث أن معظم قيم الدرجات تحتوي على أرقام موجبة فقط. لاحظ ، مع ذلك ، أنه سيتم تصفية أي قيم سلبية بشكل افتراضي في هذا المثال.

في هذا المثال الثاني ، نقوم بتمكين التصفية على نفس درجة الحقل ، ومع ذلك ، فإننا نجتاز العدد الصحيح 300. وهذا يعني أنه عند تحميل البيانات ، سيتم استبعاد العناصر التي تقل درجاتها عن 300 بشكل افتراضي. يمكن بعد ذلك تعديل هذه القيمة في صفحة وصف المسار.

في هذا المثال ، نقوم بتمكين التصفية الرقمية لإشارة المجال. يتم أيضًا تمكين filterByRange. & ltfieldName & gt ، مما يسمح بالترشيح بين قيم الفاصل الزمني ، وهذا يسمح لنا أيضًا بتمرير مجموعة من القيم إلى عامل التصفية. & ltfieldName & gt المعلمة. في هذه الحالة ، يتم عرض القيم الافتراضية فقط بين 300 و 400. أخيرًا ، يتم تعديل حدود المرشح لقبول القيم بين 200 و 500 بدلاً من القيمة الافتراضية من 0 إلى 1000.

أمثلة على القيم في حقل / عمود نقاط الثقة:

يطبق هذا المثال عامل التصفية. & ltfieldName & gt على القيم الموجودة في الحقل المسمى نقاط الثقة التي تحتوي على بعض القيم غير الرقمية. إذا تمت تصفية العناصر ذات القيم الأربع أعلاه بقيمة لا تقل عن 6:

5- ستتم إزالة العنصر لأنه أقل من قيمة التصفية
6 (غير مؤكد) - يجب أن يظهر العنصر ، حيث سيتم تفسيره على أنه & quot6 & quot
غير معروف - ستتم إزالة العنصر حيث سيتم تفسيره على أنه 0
7.0 - سيظهر العنصر على أنه يتم دعم الكسور العشرية

filterText. & ltfieldName & gt تستخدم لتمكين البحث عن النص في اسم الحقل المحدد. يتطلب تمرير سلسلة بحث افتراضية. يمكن استخدام علامة النجمة / حرف البدل (*) لتمكين البحث عن النص ، ولكن دون تمرير أي قيمة افتراضية. إذا تم تمرير كلمة أو سلسلة ، فسيتم تصفية العناصر المطابقة للسلسلة بشكل افتراضي. انظر الأمثلة أدناه للحصول على التفاصيل.

filterText. & ltfieldName & gt سيمكن نوعين من البحث ، أحرف البدل والتعبير العادي. بشكل افتراضي ، يتم تمكين خيار أحرف البدل. هذا يعني أن مصطلح البحث الذي يحتوي على عنصر حرف بدل (*) على كلا الطرفين سيتطابق مع أي عدد من الأحرف الإضافية قبل و / أو بعد مصطلح البحث. يسمح خيار regexp بالبحث باستخدام قواعد التعبير العادي. الإعدادات الاختيارية filterType. & ltfieldName & gt يمكن إضافتها لتبديل الافتراضي من حرف البدل إلى التعبير العادي.

ستكون تسمية المرشح هي وصف الحقل كما هو محدد بواسطة ملف autoSql (.as). يمكن تخصيص هذا التصنيف باستخدام معلمة filterLabel. & ltfieldName & gt. راجع صفحة تعليمات bigBed والمثال 3 لمزيد من المعلومات حول إنشاء ملفات فريدة. as لبيانات bigBed.

  • filterText. & ltfieldName & gt سيتعامل مع جميع الحقول كسلاسل. وهذا يعني أنه يمكن تمكينه في الحقول الرقمية بالكامل ، مثل chromStart ، إذا كان المرء يتطلع إلى تصفية القيم الرقمية كنص
  • لكي تعمل المرشحات ، يجب أن يكون المسار من نوع bigBed N + أو اكتب bigBed N. مطلوب & quot + & quot (لمسارات bigBed +) أو & quot. & quot (لمسارات bigBed غير الممتدة)
  • بشكل افتراضي ، ستحتوي جميع مسارات السرير التي لا تقل عن bed5 على مرشح نقاط. سيؤدي تمكين أي من عوامل التصفية *. & ltfieldName & gt filter settings إلى تعطيل هذا الفلتر الافتراضي

في هذا المثال ، نطبق مرشحًا افتراضيًا على حقل geneName بحيث تظهر فقط العناصر التي تحتوي على BRCA في geneName. بشكل افتراضي ، يعد هذا بحثًا عن حرف بدل لـ * BRCA * والذي يعادل بحث regexp. * BRCA. *. يمكن تغيير مصطلح المرشح بحرية في صفحة إعداد المسار مما يسمح للمستخدمين بالتصفية على القيم الأخرى في حقل geneName.

يتيح هذا المثال إمكانية التصفية في نفس الحقل كما هو مذكور أعلاه ، geneName ، ومع ذلك ، فإنه لا يعلن عن معلمة بحث افتراضية. يتم ذلك بتمرير علامة النجمة / حرف البدل (*) فقط. هذا يعني أن مربع البحث سيكون موجودًا ولكن لن يتم تصفية أي عناصر geneName من البيانات ما لم يحدد المستخدم قيمة.

يتيح هذا المثال مرة أخرى التصفية في نفس الحقل ، ومع ذلك ، فإنه يعلن عن regexp كنوع مرشح ويمرر تعبيرًا عاديًا ليتم تطبيقه افتراضيًا. في هذه الحالة ، نحن نستهدف جميع عناصر geneName التي هي الإصدار 1.

filterValues. & ltfieldName & gt تستخدم لتمكين التصفية حسب القيم المحددة داخل الحقل. يمكن استخدامه في الحقول التي يمكن أن تحتوي على قيمة نصية واحدة أو قائمة بقيم نصية مفصولة بفواصل ، مثل "classA، classB". عادة ما تكون هذه أسماء فئات. يتطلب الخيار قيمة واحدة على الأقل للتصفية.

يجب أن يتم تمرير كل قيمة فردية يمكن أن تحدث في الحقل في قائمة مفصولة بفواصل. ستتمكن بعد ذلك من تحديد هذه القيم كفئة ، واختيار عرض العناصر التي تنتمي إلى واحدة أو أي من القيم المحددة أو واحدة على الأقل. بشكل افتراضي ، يمكن للمستخدم تحديد قيم متعددة من هذه القائمة ويتيح عامل التصفية تمرير أي ميزات مع واحدة على الأقل من هذه القيم (multiListOr).

لاختيار سلوك التحديد الافتراضي ، يمكن استخدام المعلمة الاختيارية filterType. & ltfieldName & gt. إذا لم يتم تمرير هذه المعلمة ، فسيتم تعيين التحديد افتراضيًا على & quotone أو أكثر من مطابقة & quot وهو نفس الشيء مثل وجود filterType.fieldName multipleListOr. إذا كان يجب أن يكون المستخدم قادرًا فقط على تحديد قيمة واحدة ، فيمكن تمرير قائمة واحدة بدلاً من ذلك. هناك خيار آخر ، MultipleListAnd ، يعني أنه يمكن للمستخدم تحديد فئات متعددة ، لكن المرشح سيسمح بتمرير الميزات فقط حيث توجد كل هذه الفئات.

multiListOr و multiList ولا يزال كلاهما يتيح للمستخدم تجاوز نوع المجموعة يدويًا في واجهة المستخدم باستخدام زر اختيار. إذا قمت بتحديد multiListOnlyOr أو multipleListOnlyAnd ثم يتم منع الزر الراديوي ولن يتمكن المستخدم من الاختيار بين الخيارات بعد الآن. يمكن استخدام هذا في الحالات التي يكون فيها من غير المنطقي تقديم البحث OR أو AND بحكم طبيعة المجال.

يمكنك أيضًا اختيار القيم التي سيتم تحديدها افتراضيًا باستخدام filterValuesDefault. & ltfieldName & gt المعلمة. يمكن أن يستغرق الأمر قائمة مفصولة بفواصل تمامًا مثل filterValues. & ltfieldName & gt ، وسيتم تحديد أي عناصر مضمنة تلقائيًا. لا يعني أن القيم يجب أن تكون موجودة في كلا الإعدادين.

يمكن تكوين الملصقات الموجودة في القائمة المعروضة للمستخدم لعرض اسم / تسمية مختلفة عن تلك الموجودة في حقل bigBed. يمكن أن يكون هذا مفيدًا عندما تتم كتابة قيم البيانات في شكل قصير ، لكنك تريد اسمًا وصفيًا أطول يظهر في واجهة المستخدم. تنسيق هذا الاستبدال كما يلي:

على سبيل المثال إذا كانت القيمة في حقل bigBed هي AML ، فإن إعدادًا مثل اللوكيميا النخاعية الحادة | AML سيُظهر سرطان الدم النخاعي الحاد في واجهة المستخدم ولكنه سيؤدي إلى قيمة AML التي يتم البحث عنها في حقل bigBed. هذا يمكن أن يقلل من حجم ملف bigBed كثيرًا. انظر المثال أدناه لمزيد من المعلومات.

  • حاليًا ، يجب تحديد جميع القيم بشكل فردي
  • يجب أن تتطابق أسماء القيم تمامًا
  • بشكل افتراضي ، ستحتوي جميع مسارات السرير التي لا تقل عن bed5 على مرشح نقاط. سيؤدي تمكين أي من عوامل التصفية *. & ltfieldName & gt filter settings إلى تعطيل هذا الفلتر الافتراضي
  • لكي تعمل المرشحات ، يجب أن يكون المسار من نوع bigBed N + أو اكتب bigBed N. مطلوب & quot + & quot (لمسارات bigBed +) أو & quot. & quot (لمسارات bigBed غير الممتدة)
  • يجب ألا تكون هناك مسافات بيضاء بين العناصر المصرح عنها بعد الفواصل ، على سبيل المثال. "itemOne ، itemTwo ، itemThree"
  • يمكن تخصيص التسمية الافتراضية باستخدام filterLabel. & ltfieldName & gt المعلمة
  • عند استخدام قيم عامل التصفية في حقل يتضمن فاصلات ، يمكن استخدام فاصلة إضافية للتخلص منها. السابق. "fieldOne ، fieldTho ، fieldTwo ، fieldThree"

في هذا المثال البسيط ، نقوم بتطبيق filterValues. & ltfieldName & gt على حقل OddEven ، والذي يعين إما & quotEven & quot أو & quotOdd & quot. يمكننا بعد ذلك تصفية البيانات باستخدام حقل OddEven مع قائمة منسدلة معروضة على صفحة عناصر التحكم في المسار للتساوي أو الاحتمالات. نظرًا لعدم وجود filterType ، يمكن للمستخدم أيضًا إظهار كل من التساوى والاحتمالات في نفس الوقت.

في مثال المتابعة هذا ، نقوم بتمرير معامل filterType.fieldName singleList ، مما يعني أنه يمكن اختيار عنصر واحد فقط في حقل OddEven ، في هذه الحالة & quotOdd & quot أو & quotEven & quot. يؤدي هذا إلى إزالة الإعداد الافتراضي الذي يسمح بتحديدات متعددة.

في هذا المثال الثالث ، أضفنا معامل filterValuesDefault.fieldName أيضًا. الآن سيتم تحديد قيمة Odd مسبقًا للمرشح الافتراضي عند تحميل المحور.

في هذا المثال ، يتم تطبيق عامل التصفية على قيم متعددة في حقل نوع التعليقات التوضيحية. يمكننا بعد ذلك الاختيار من هذه القيم في حقل نوع التعليقات التوضيحية بقائمة منسدلة معروضة في صفحة إعدادات المسار ، وعرض العناصر التي تطابق اختياراتنا فقط. ستسمح لنا اختيارات التحديد بمطابقة قيمة واحدة أو جميعها أو أي مجموعة من القيم المقدمة.

في هذه المتابعة للسؤال السابق ، قمنا بتغيير اسم العناصر التي تظهر في القائمة المنسدلة لتكون وصفية أكثر من قيم تنسيق الملف الكثيف. هذا يعني أننا إذا أردنا فقط رؤية العناصر التي تحتوي على شرح توضيحي نوع DNA-BR ، فسنختار منطقة ربط الحمض النووي من قائمة الواجهة.

عندما ينقر المستخدم على عنصر المسار في صورة المتصفح ، تظهر صفحة تفاصيل العنصر. يحدد هذا الإعداد تسمية بديلة لعامل التصفية في تلك الصفحة. بدون هذا الإعداد ، ستكون التسمية هي وصف الحقل كما هو محدد بواسطة ملف autoSql (.as). بعض المعلمات التي تم تعديلها بواسطة هذا هي:

في هذا المثال ، لدينا حقل قياسي & quotstrand & quot BED مع الوصف الافتراضي & quot + أو - لـ strand & quot. لقد قمنا بتمكين عامل التصفية وتبسيط التسمية إلى "ستراند (الاتجاه)" فقط.

في تنسيقات الأسرة التي تدعم 9 حقول سرير قياسية على الأقل ، يمكن استخدام هذا الإعداد لتنشيط تلوين العناصر باستخدام القيمة في الحقل التاسع ، itemRgb. يجب أن تكون قيمة حقل العنصر ثلاثية R و G و B. عند تحميله في جدول ، يظهر هذا الحقل كعدد صحيح مع قيم RGB في بتات محددة من العدد الصحيح. لملاحظة هذا الحقل ، حدد النوع كـ ، اكتب bigBed 9 ، أو اكتب bigBed 9+ ، للأعمدة الإضافية غير القياسية ، في مقطع trackDb لملف bigBed.

لاحظ أن عرض اللون يتأثر بخيار maxItems. عندما يتم تكبير المسار إلى النقطة التي يتجاوز فيها عدد العناصر المراد عرضها الحد الأقصى للعناصر ، يتم إجبار المسار على الوضع الكثيف ويتم رسم العناصر من ملخص bigBed بلون المسار الافتراضي بدلاً من استخدام عمود العنصر RGB.

الحد الأقصى لعدد العناصر المراد عرضها بشكل فردي في الوضع الكامل. عندما يتم تجاوز الحد الأقصى ، يتم رسم العناصر الزائدة فوق بعضها البعض في السطر الأخير. في وضع التعبئة ، يشير هذا إلى عدد الأسطر بدلاً من عدد العناصر. الافتراضي: 250. بالنسبة لنوع مسارات bigBed ، لا يمكن أن يكون هذا الإعداد أكبر من 100000.

عندما يتم عرض عدد كبير جدًا من عناصر السرير الفردية في صورة المتصفح (مثل قد يحدث عند عرض منطقة كبيرة من الكروموسوم) ، فإن maxWindowCoverage ستحول المسار إلى مخطط تغطية الكثافة عندما تحتوي النافذة على أكثر من العدد المحدد من القواعد.

ستؤدي صور المستعرض التي تعرض أكثر من 10000000 قاعدة إلى عرض بيانات المسار كرسم بياني للتغطية الكثافة.

عندما يتم عرض عدد كبير جدًا من عناصر السرير الفردية في صورة المستعرض (مثل قد يحدث عند عرض منطقة كبيرة من الكروموسوم) ، فإن maxWindowToDraw سيطلق خيارًا لعرض رسالة تطلب من المستخدمين تكبير منطقة أصغر.

اعتمادًا على الرؤية الحالية لمسار السرير وأي مسارات أخرى يتم عرضها بشكل متزامن ، قد يقوم المستعرض تلقائيًا بتقليل العرض إلى وضع التعبئة أو الوضع الكثيف في بعض الحالات. يسمح لك إعداد maxWindowToDraw بإجبار المستخدمين على التكبير لأن رسالة تجاوز ستحجب عرض البيانات. بخلاف إعداد maxItems ، الذي يتحكم في عرض المساحة الرأسية ويفرض كثافة العرض عند تجاوز الحد الأقصى لعدد العناصر ، يحدد إعداد maxWindowToDraw عدد القواعد التي سيتم عرضها في النافذة قبل حجب المسار برسالة تشرح شرط التكبير. حتى بدون هذا الإعداد ، هناك عمليات المتصفح التي ستمنع في النهاية عرض الكثير من العناصر عن طريق فرض ملخص مرئي في الوضع الكثيف كما هو مذكور.

ستؤدي صور المستعرض التي تعرض أكثر من 10000000 قاعدة إلى إخفاء بيانات المسار بملاحظة عبر النطاق الجينومي تفيد بتكبير الرسالة.

عندما يحتوي مسار السرير على درجة الحقل القياسية ، وعندما يتم استخدام هذه الدرجة لتقديم العناصر باللون الرمادي أو مقياس اللون (انظر الطيف) ، يحدد هذا الإعداد أخف ظل يتم استخدامه. هذا يمنع أقل الدرجات من أن يتم عرضها بلون فاتح جدًا بحيث لا يمكن عرضها بسهولة. عيّن القيمة في النطاق من 1 إلى 9 ، من الأفتح إلى الأغمق.

يؤدي هذا إلى تعيين أقل الدرجات إلى أقل بقليل من الرمادي المتوسط ​​، بينما تظهر أعلى الدرجات باللون الأسود.

بشكل افتراضي ، مسارات السرير مع 5 أو أكثر من حقول الأسرة القياسية التي تحتوي إما على '. سيكون 'أو' + 'في إعداد النوع قابلاً للتصفية على الدرجة أي ، سيكون لديهم إعداد مفترض لـ "ScoreFilter 0". لإيقاف هذا النمط الافتراضي الافتراضي ، قم بتضمين الإعداد "noScoreFilter".

إذا كان المسار الخاص بك عبارة عن سرير 5 أو أكبر ، فسيكون حقل درجة السرير القياسي موجودًا. يمكن استخدام هذه الدرجة ، التي من المتوقع أن تختلف من 0-1000 ، للتحكم في تظليل عناصر السرير المرسومة في صورة المتصفح. لتنشيط هذه الميزة ، قم بتشغيل الطيف. سيتم تظليل الدرجات المنخفضة باللون الرمادي الفاتح افتراضيًا ، بينما ستتجه الدرجات الأعلى نحو الأسود. يمكن تعديل ذلك بعدة طرق:

    يمكن استخدام اللون لاستبدال المقياس الرمادي بمقياس لون
  • altColor مع اللون يمكن أن تختلف العناصر من لون إلى بديل اللون ->
  • يمكن استخدام minGrayLevel لضبط مستوى الظل الأخف
  • يمكن استخدام ScoreMin و ScoreMax لتحديد الحدود الدنيا والعليا للنطاق الذي سيحصل على تظليل متدرج

ملحوظة: يجب أن يكون نوع الملف اكتب bigBed x حيث x على الأقل bigBed 5. إذا كان فقط اكتب سرير كبير ، لن يعمل الإعداد لأنه من المفترض أن يكون سريرًا كبيرًا 3.

في هذا المثال ، سيتم عرض وصف المسار باللون الأزرق ، لكن المسار سيظل مقياسًا باللون الرمادي. سيتم عرض العناصر ذات الدرجات الأقل من 700 أو التي تساويها باللون الرمادي الفاتح للغاية ، أما العناصر ذات الدرجات بين 700 و 900 فسيتم عرضها بظلال رمادية أكثر قتامة على نحو متزايد ، والعناصر ذات الدرجات الأكبر من أو تساوي 900 أعلاه ستظهر باللون الأسود.

يحدد قائمة أسماء الحقول التي تم عمل الفهرس عليها. عندما يقوم المستخدم بإدخال سلسلة في مربع البحث عن الموضع في المتصفح ، فسيتم البحث في هذا الفهرس للعثور على هذا الاسم ، وإذا كانت السلسلة موجودة في الفهرس ، فسيتم إما انتقال المستخدم إلى هذا الموضع في المتصفح ، أو إذا كان هناك هي أكثر من تطابق واحد من تلك السلسلة ، سيتم تقديم قائمة بالمواقع للاختيار من بينها. انظر هنا للحصول على إرشادات حول كيفية إنشاء فهرس لملف bigBed. يتطلب إعداد searchIndex أن تكون بيانات BED المدخلة مرتبة حسب الحالة (الفرز -k1،1 -k2،2n) ، حيث يتم تحسين الإصدارات الأحدث من الأداة bedToBigBed (المتوفرة هنا) للقبض على المدخلات غير الصحيحة.

يحدد عنوان URL لملف TRIX الذي يعيّن النص الحر لمجموعة من الفهارس التي يُفترض أن تحتوي على مؤشرات في ملف bigBed المرتبط. انظر هنا للحصول على إرشادات حول كيفية إنشاء ملف TRIX.

في مسارات السرير التي تحتوي على 8 حقول سرير قياسية أو أكثر ، يمكن رسم أجزاء من العناصر في مسارات مثل النماذج الجينية بشكل أكثر سمكًا للتمييز بين مناطق exon والإنترونات. عندما يتم عرض البيانات بمقاييس مختلفة ، يجب قياس العناصر والأجزاء السميكة من العناصر بشكل متناسب. ومع ذلك ، قد يكون رؤية وجود المناطق السميكة أكثر أهمية من محاولة الحفاظ على النسبة. من خلال ضبط thickDrawItem على ، يتم دائمًا رسم مناطق العرض السميكة للعناصر بحد أدنى 3 بكسل ، حتى عند التصغير بشكل كبير.

يؤدي تنشيط هذا الإعداد إلى توفير عناصر التحكم في نوع مرشح السرير التي تتيح لك تصفية عناصر السرير حسب الاسم مع مطابقة أحرف البدل.

TODO: يجب إعادة كتابة هذا للسماح به على أي مصدر بيانات قائم على العنصر وعدم استبعاد خيارات التصفية الأخرى أيضًا. (أي تحويل هذا إلى filterByWild أو filterByWildList)

سيكون مسار السرير قابلاً للتصفية حسب أسماء عناصر السرير.

راجع صفحة تنسيق مسار CRAM للحصول على وصف لكيفية استخدام هذا الإعداد.

عندما ينقر المستخدم على عنصر تتبع السرير في صورة المتصفح ، تظهر صفحة تفاصيل العنصر. يحدد هذا الإعداد تسمية بديلة لاسم العنصر في تلك الصفحة. بدون هذا الإعداد ، ستكون التسمية "العنصر:".

عندما ينقر المستخدم على عنصر المسار في صورة المتصفح ، تظهر صفحة تفاصيل العنصر. يحدد هذا الإعداد تسمية بديلة للدرجة على تلك الصفحة. بدون هذا الإعداد ، ستكون التسمية "الدرجة:".

يتم تحديد الحد الأعلى لنطاق البيانات في المسار بواسطة هذا الإعداد.

يسمح بدمج جميع عناصر المسار التي تمتد إلى ما وراء جانبي نافذة العرض الحالية في عنصر سرير واحد في الشاشة. يسمح وجود هذا الإعداد للعرض بتقديم خيار العرض المطوي هذا ، أثناء وجود ملف تشغيل أو إيقاف يشير إلى طريقة العرض التي يجب عرضها بشكل افتراضي.

يمكن للمستخدم تمكين / تعطيل العرض إما في صفحة تكوين المسار العادي ، أو عن طريق التحديد من قائمة النقر بزر الماوس الأيمن. إذا كان المسار bigBed 9 (+) ، فسيتم تظليل العنصر المدمج كمتوسط ​​لجميع العناصر المدمجة.

يغير هذا الإعداد معنى حقل اسم السرير إلى "وصف المعرف". إذا تم تنشيطه ، فلن يعرض المستعرض الكلمة الأولى من اسم عنصر BED ، ولكنه يستخدم هذه الكلمة الأولى للارتباط بصفحة تفاصيل العنصر. يسمح هذا بوضع معرف ، مثل معرف الجين ، ووصفه الذي يمكن قراءته بواسطة الإنسان في حقل اسم عنصر BED ، مفصولة بمسافة.

سيظهر حقل اسم BED "9005 PITX2" "PITX2" على متصفح الجينوم ، ولكن عندما ينقر المستخدم عليه ، سيتم إنشاء عنوان URL فقط من الكلمة الأولى ، افتراضيًا cgi-bin / hgc؟ i = 9005 & amp (.). يمكن تغيير عنوان URL باستخدام directUrl ، حيث يتم استبدال٪ s بالمعرف.

غالبًا ما يتم إنشاء ملفات bigBed باستخدام UCSC bedToBigBed برنامج. بشكل افتراضي ، يتوقع هذا البرنامج كلمة واحدة فقط لأسماء عناصر BED. لإخبار البرنامج بقبول كلمات متعددة مفصولة بمسافات (مطلوب لإعداد المسار هذا) ، ستحتاج إلى استخدام -التبويب خيار bedToBigBed. هذا يخبر البرنامج أنه يتم استخدام أحرف الجدولة تلك بدلاً من المسافات لفصل حقول ملف BED. يرجى ملاحظة أن هذا الخيار لن يعمل إلا إذا تم استخدام أحرف الجدولة كفاصل للحقول في ملف BED الخاص بك. يتوفر المزيد من المعلومات حول إنشاء ملفات bigBed هنا.

يحدد أين يمكن العثور على تسلسل العناصر (إن وجد) بحيث يمكن رسم تسلسل العنصر ، أو الاختلافات عن التسلسل الجيني ، عند عرض منطقة صغيرة بدرجة كافية.

  • إذا تم تحديد extFile ، يلزم وجود معلمتين إضافيتين ، اسم جدول seq متبوعًا باسم جدول extFile لاستخدامه في البحث عن التسلسل. يتم تحميل هذه الجداول بواسطة hgLoadSeq.
  • إذا تم تحديد hgPcrResult ، فسيتم استخدام نتيجة PCR.
  • إذا تم تحديد lfExtra ، فسيتم العثور على تسلسل العنصر في العمود الأخير من الجدول أو الملف البعيد.
  • إذا تم تحديد nameIsSequence ، فسيحتوي العمود الرابع (الاسم أو التسلسل) على التسلسل. (انظر hg / lib / encode / tagAlign.as)
  • إذا تم تحديد seq1Seq2 ، فإن العمودين السابع والثامن (seq1 و seq2) يحتويان على الزوجين الأيمن والأيسر من التسلسل. (انظر hg / lib / encode / pairedTagAlign.as)
  • إذا تم تحديد ss ، فسيتم البحث عن تسلسل blat الذي يوفره المستخدم.

يحدد أين يمكن العثور على إحداثيات تسلسل الترميز (CDS) (إن وجدت) بحيث يمكن رسم الكودونات عند عرض منطقة صغيرة بدرجة كافية. إذا تم تحديد الجدول ، يلزم وجود معلمة إضافية لاسم الجدول ، بتنسيق cdsSpec.

يحدد وضع الرسم الافتراضي. لا تنطبق خيارات itemBases و itemCodons و diffBases و diffCodons إلا إذا كان للمسار تسلسل ، كما هو محدد بواسطة إعداد baseColorUseSequence. لا تنطبق الكودونات الجينومية ، والعنصر ، والشفرات ، إلا إذا كان المسار يحتوي على معلومات CDS ، كما هو محدد بواسطة إعداد baseColorUseCds.

ليس للمراكز. غير مدعوم بعد من قبل bigBeds

اختر لونًا متباينًا (غالبًا ما يكون أبيض) أو ظل أفتح من اللون. يجب أن يكون هذا هو نفس اللون الذي سيتم اختياره للنص الأساسي إذا تم تكبير المستخدم إلى المستوى الأساسي.

إظهار الاختلافات الأساسية لجميع مستويات التكبير / التصغير.

ليس للمراكز. غير مدعوم بعد من قبل bigBeds

اعرض التعليقات التوضيحية التي تُبرز الاختلافات الأساسية أو الكودونية فقط إذا كان مستوى التكبير / التصغير الحالي لا يتجاوز الأساسيات BasPerPixel (عدد عشري). يجب أيضًا تعيين showDiffBasesAllScales لجعل هذا مفيدًا.

ليس للمراكز. غير مدعوم بعد من قبل bigBeds

عرض CDS لمسارات PSL في جميع مستويات التكبير / التصغير.

ليس للمراكز. غير مدعوم بعد من قبل bigBeds

استخدم هذا الإعداد (عائم) لتحديد أقصى حد للتصغير المسموح به لعرض CDS لمسارات psl. بالاقتران مع هذا الإعداد ، يجب تعيين showCdsAllScales على ويجب تعيين showDiffBasesMaxZoom على قيمة لا تزيد عن showCdsMaxZoom لجعل تكوين العرض هذا مفيدًا.

TODO: اشرح الأمثلة ، وقم بتوسيع شرح الخيار

في المسارات التي تُظهر exons أو الكتل داخل العناصر ، تسمح أسهم exon للمستخدم بالقفز إلى exon / block التالي خارج الصورة. استخدم هذا الإعداد لعرض أسهم exon حتى عندما يكون المسار في وضع كثيف.

ليس للمراكز. يجب أن يكون الجدول الإضافي في قاعدة البيانات المحلية.

استخدم هذا الإعداد لتحديد جدول ، مفهرسًا حسب اسم العنصر ، يحتوي على جزء HTML اختياري لعرضه في صفحة التفاصيل لهذا العنصر. العمودين المتوقعين في الجدول هما "الاسم" و "html".

يمكن إقران العناصر بالصور ويمكن جعل الصور مرئية باستخدام هذين الإعدادين. تحدد itemImagepath مسار URL إلى دليل يحتوي على ملفات صور مسماة بالتنسيق . . يتم استرداد الاسم من الجدول أو ملف البيانات البعيد. سيتم عرض هذه الصورة على صفحة تفاصيل العنصر. إذا تم توفير itemBigImagePath أيضًا ، فسيتم توفير رابط لصورة أكبر. إذا كان المسار المقدم محليًا للمتصفح ، فيجب أن يكون المسار نسبيًا.

عندما ينقر المستخدم على عنصر يسمى fred ، ستعرض صفحة تفاصيل العنصر الصور / myTrackImages / fred.png وستوفر أيضًا رابطًا لصورة أكبر على http://bigImages.com/myTrackImages/fred.jpg .

من خلال تحديد مسار محاذاة متعددة ، ستوضح صفحة تفاصيل العنصر الاختلافات في هذا العنصر عبر عدد من الأنواع.

بالنسبة للمسارات التي تقدم عناصر كتلة متعددة مثل نماذج الجينات ، عادةً ما يتم عرض أسهم exon التالية / السابقة افتراضيًا في المتصفح. يتم وصف وظيفة هذه الأسهم الصغيرة عن طريق تمرير الماوس فوق "تلميحات الأدوات" التي تعد افتراضيًا لـ "Next Exon" و "Prev Exon". إذا كانت الكتل لا تمثل exons ، فيمكنك ضبط نص تلميح الأداة على المعلومات المناسبة باستخدام هذين الإعدادين.

استخدم هذا الإعداد لإظهار قائمة ببعض العناصر ذات أعلى الدرجات في منطقة الجينوم ، عند النظر إلى عنصر فردي في صفحة تفاصيل العنصر. ستغطي المنطقة إحداثيات نافذة المتصفح الحالية. هذا الإعداد غير قابل للتكوين حاليًا.

أبسط تنسيق للسرير ، لا يحتوي على أكثر من كروموسوم وإحداثيات البداية والتوقف لكل عنصر سرير. لا يوجد شيء لتكوينه.

إعداد النوع للسرير والسرير الكبير متطابقان تقريبًا. هنا ، تحدد كلا إعدادات النوع مسارًا مع أول 6 حقول قياسية محددة (حتى حبلا) ومع حقول إضافية محددة بعد تلك الحقول الستة (المشار إليها بعلامة "+"). يقوم إعداد colorByStrand بتكوين عناصر plus strand ليتم تلوينها باللون الأحمر ، بينما تكون عناصر ناقص حبلا زرقاء.

مسار bigBed مع أول 8 حقول سرير قياسية (من خلال ThickEnd) ، ولا توجد حقول إضافية. ال ' . 'يُخبر المتصفح أنه يجوز للمستخدم تكوين هذا المسار. تم الإعلان صراحة عن مرشح النتيجة افتراضيًا إلى 700 ، ويشير النطاق المحدد من 100 - 1000 إلى عدم وجود قيم اهتمام أقل من 100. هذا المثال يلون أيضًا نص الوصف باللون الأزرق ويقدم طيفًا أو تدرجًا للظلام بناءً على نطاق النتيجة . يتم عرض العناصر التي حصلت على درجة أو 700 أو أقل على أنها الأفتح والأغمق للعناصر التي تحصل على درجة 900 أو أكثر. أخيرًا ، يضمن minGrayLevel أن يكون أخف ظل مرئيًا للمستخدم. لا شك في أن قيمة "4" تم اختيارها بعد التجربة مع عرض المتصفح.

هذا المسار عبارة عن مجموعة بيانات بتنسيق سرير 6 + 3 ، ولكن تم تعريفه بميزات خاصة لـ ENCODE. ينطبق pValueFilter على حقل يسمى pValue وهو أحد الحقول الثلاثة الإضافية بعد المعيار 6.

إعداد النوع للسرير والسرير الكبير متطابقان تقريبًا. هنا ، سيحدد كلا النوعين مسارًا مع أول 6 حقول سرير قياسية محددة (حتى حبلا) ومع حقول إضافية محددة بعد تلك 6. لاحظ أن عناصر حبلا الزائدة ملونة باللون الأحمر ، في حين أن العناصر ناقص حبلا زرقاء.

مسار bigBed مع أول 8 حقول سرير قياسية (من خلال ThickEnd) ، ولا توجد حقول إضافية. ال ' . مطلوب 'لإخبار المتصفح بأنه يجوز للمستخدم تكوين هذا المسار. تم الإعلان صراحةً عن مرشح النتيجة افتراضيًا إلى 700 ، ويشير النطاق المسموح به للنتيجة إلى عدم وجود قيم أقل من 100 تستحق النظر إليها. يقوم هذا المثال أيضًا بتعيين نص الوصف إلى اللون الأزرق ويقدم نطاقًا أو تدرجًا للظلام بناءً على نطاق النقاط. العناصر ذات الدرجة 700 أو أقل هي الأفتح ، والعناصر ذات الدرجة 900 أو أكثر هي الأغمق. أخيرًا ، تم ضبط الظل الأفتح بحيث لا يكون فاتحًا جدًا باستخدام إعداد minGrayLevel. لا شك أنه تم اختيار 4 بعد التجريب لمعرفة كيف يبدو في الواقع في المتصفح.

شعر مستعار ، وشعر مستعار ، و bedGraph: مسارات الرسوم البيانية للإشارة

مجموعة أخرى من أنواع المسارات الشائعة هي تلك التي ترسم إشارة الكثافة على طول الجينوم. يمكن أن يكون الرسم البياني عبارة عن مخطط كثافة متغير باستمرار أو يعرض إشارة كثافة في مناطق معينة فقط. أقدم وأبسط هذه هي شكل شعر مستعار. تم تحسين هذا النوع باعتباره رسمًا بيانيًا للسرير ثم تم تحسينه بشكل كبير باعتباره باروكة كبيرة. على الرغم من وجود اختلافات بين التنسيقات ، إلا أن جميعها تدعم عناصر التحكم الأساسية في تكوين الرسم البياني. للحصول على المواصفات التفصيلية لكل نوع وكيفية تحضيرها للعرض في متصفح الجينوم ، يرجى الاطلاع على الأسئلة الشائعة.

BigWig: إشارات المسارات البيانية

مجموعة أخرى من أنواع المسارات الشائعة هي تلك التي ترسم إشارة كثافة على طول الجينوم. يمكن أن يكون الرسم البياني مخطط كثافة متغيرة باستمرار أو مخطط يعرض إشارة كثافة في مناطق معينة فقط. بالنسبة لمراكز البيانات ، فإن نوع مسار الإشارة الأكثر شيوعًا هو bigWig. للحصول على المواصفات التفصيلية لتنسيق ملف البيانات عن بُعد bigWig وكيفية إعداده للعرض في متصفح الجينوم ، يرجى الاطلاع على: http://genome.ucsc.edu/goldenPath/help/bigWig.html.

يجب أن تعلن جداول MariaDB من نوع شعر مستعار وملفات البيانات البعيدة من النوع bigWig عن نطاق الإشارة المتوقع للبيانات.

يمكن العثور على الأمثلة أدناه.

يجب أن تعلن ملفات البيانات البعيدة من النوع bigWig عن نطاق الإشارة المتوقع للبيانات.

يمكن العثور على الأمثلة أدناه.

مسار نوع bedGraph له نفس تنسيق ملف مثل ملف bed ، ولكن يتم تحميله في قاعدة بيانات MariaDB في نموذج يمكن رسمه بيانيًا. بشكل افتراضي ، تكون القيمة المراد رسمها بيانيًا هي حقل السرير القياسي الخامس ، ومع ذلك ، يمكنك تحديد حقل مختلف لاستخدامه. عادةً ما يتم تضمين أول ثلاثة حقول قياسية فقط (الكروم ، والبدء ، والتوقف) ويحتوي الحقل الرابع على قيمة الإشارة. يقدم مسار bedGraph بعض التحسينات المهمة على مسار شعر مستعار. في مسارات شعر مستعار ، يتم اقتطاع قيمة الإشارة إلى بايت واحد ، وهو أمر فعال للرسم البياني ولكنه يفشل في تخزين البيانات. كما تم تصميم نوع شعر مستعار في الأصل للنوافذ ذات الحجم الثابت ، على الرغم من إضافة الاختلافات. يسمح نوع bedGraph بالنوافذ المتغيرة وتحديد القيم حتى وصولاً إلى المستوى الأساسي. لكي نكون واضحين ، فإن مسارات bigWig متعددة الاستخدامات مثل bedGraphs. فقط شكل شعر مستعار هو الذي يعاني من هذه القيود.

من ناحية أخرى ، فإن كثافة تخزين شعر مستعار ، وخاصة متغير الخطوة الثابتة ، هي أكثر كثافة من bedGraph. في الحالات التي تكون فيها البيانات مخصصة للعرض فقط ، فإن مستويات 256 التي يدعمها شعر مستعار أكثر من كافية. بالنسبة إلى قرارات أحادية القاعدة أو حتى ذات مستوى 10 قاعدة ، فإن رسم بياني ليس عمليًا على مستوى الجينوم بشكل عام. لاحظ أيضًا أن الشعر المستعار المحول إلى شعر مستعار لا يعاني من انخفاض دقة الشعر المستعار الذي يتم تحميله مباشرة في قاعدة البيانات. إن الباروكة الكبيرة على أساس الشعر المستعار ذو الخطوات الثابتة هي أفضل طريقة لتمثيل الرسوم البيانية الكثيفة على الجينوم.

لاحظ أن الحدود الدنيا والعليا لإشارة bedGraph لم يتم التصريح عنها في النوع ، بل يتم الإعلان عنها باستخدام إعدادين منفصلين ، minLimit و maxLimit.

TODO: تجاهل minLimit / maxLimit.

يمكن العثور على الأمثلة أدناه.

عند ضبط autoScale على "تشغيل" أو "مجموعة" في مسار الإشارة ، بالإضافة إلى ذلك ، فإن ضبط AlwaysZero على "on" سيضمن أن تكون قيمة y = 0 معروضة في جميع الأوقات. الافتراضي: إيقاف.

هذا الإعداد متاح لكل من أنواع الرسم البياني للمسارات (شعر مستعار ، وشعر مستعار كبير ، ورسم بياني) ومسارات خريطة الحرارة Hi-C (hic). يتصرف بشكل مختلف قليلاً لكل منهما.

لمسارات الرسم البياني ، عادةً ما يتم قياس الرسم البياني للبيانات المعروضة في صورة المستعرض على المحور ص في الإحداثيات المطلقة. ومع ذلك ، يمكنك عرض البيانات في نوعين من التدرج التلقائي مما يضمن إما أن الدرجة العالية في نافذة العرض الحالية ستبلغ ذروتها في الجزء العلوي من الرسم البياني ، أو أن جميع المسارات في مركب سيتم قياسها وفقًا لأعلى نقطة في نافذة عرض أي مسارات مرئية في نفس المركب. مثل معظم إعدادات الرسم البياني ، يمكن للمستخدم تكوين هذا. تعيينه على "تشغيل" في trackDb سيؤدي إلى ضبط المسار تلقائيًا على مقياس عرض البيانات. تعيينه على "مجموعة" في trackDb سيؤدي إلى تعيين المسار الافتراضي للمقياس التلقائي للمجموعة. الإعداد الافتراضي هو "إيقاف التشغيل" والذي سيحدد المسار لاستخدام إعداد نطاق العرض العمودي.

ملحوظة: يمكن أن تكون هذه الخيارات مضللة إذا ظهرت إشارة منخفضة صاخبة بشكل خاطئ على أنها مهمة بسبب عدم وجود إشارة عالية في نافذة العرض. خيار "المجموعة" ينطبق فقط على مسارات bigWig المركبة.

بالنسبة لمسارات Hi-C ، يتم تمثيل درجات التفاعل الأعلى بألوان أكثر كثافة. عند تعيين هذا الإعداد على "إيقاف" ، فإن الدرجة التي يصل عندها اللون إلى أقصى حد له هي قيمة ثابتة يمكن اختيارها باستخدام إعداد saturationScore trackDb. عند تعيين هذا الإعداد على "تشغيل" ، تتغير درجة الحد الأقصى للشدة ديناميكيًا وفقًا للقيم الموجودة في نافذة العرض الحالية. القيمة الافتراضية لهذا الإعداد هي "تشغيل". لا يتوفر خيار "المجموعة" للمقياس التلقائي لمسارات Hi-C.

يمكن رسم الإشارة إما على شكل "نقاط" معروضة عند قيمة الإشارة ، أو "شريط" افتراضي لملء الفراغ.

يجب الإعلان عن مقدار مساحة العرض الرأسية لمسار الإشارة الخاص بك ، على الرغم من أنه يمكن تكوينه بواسطة المستخدم. عادةً ما يتم ضبطه على ما لا يزيد عن 100 بكسل ولا يقل عن 8 ، مع افتراضي 16 أو 32 بكسل.

سيعرض المتصفح المسار بارتفاع 16 بكسل ، ولكن يمكن للمستخدم قياسه حتى 100 بكسل.

عند النقر فوق بيانات الإشارة في صورة المستعرض ، يتم عرض تفاصيل الإشارة في نافذة العرض الحالية. بالنسبة إلى BigWigs التي تشير إلى البيانات البعيدة ، يمكن أن يكون الاستعلام عملية مكلفة للغاية إذا كانت النافذة الحالية كبيرة. لتجنب إثقال كاهل المتصفح ، يجب أن يكون حجم نافذة الاستعلام محدودًا. قيمة هذا الإعداد هي الحد الأقصى لحجم النافذة في القواعد التي يجب الاستعلام عنها لإعطاء أرقام الإشارة التفصيلية.

نفي القيم في التذبذب ، مما يعني أن القيم الموجبة تصبح سالبة والعكس صحيح. هذا مفيد للتذبذبات التي تمثل النسخ أو الأنشطة الأخرى على شريط Crick. اعلم أن الاهتزازات ذات القيم السالبة يتم رسمها باستخدام لون بديل وليس لونًا مثل القيم الموجبة.

ليس للمراكز. لمسارات شعر مستعار فقط.

لتعيين مدى نقطة البيانات ليكون مجرد الامتداد الأول في الجدول أو قائمة الامتدادات في الجدول المحمل ، يمكنك العثور على الامتدادات من خلال القيام بما يلي: "تحديد امتداد من & ltable & gt group by span". عادةً ما تكون قائمة الامتداد واحدة فقط كما يوضح المثال. نادرًا ما قد يكون هناك المزيد:
"spanList 1،1000". يجب بذل جهود خاصة لتحميل مسافات إضافية في الجدول لأغراض خاصة.

غالبًا ما تكون معلومات الإشارة مكتنزة ، لأنه يتم إعطاء قيمة واحدة لعدد من القواعد. يمكن للرسم البياني أن يسهّل البيانات المكتنزة ، ويقدم عرضًا أكثر انعكاسًا للبيولوجيا الفعلية التي من المفترض أن يوضحها. تحدد القيمة العددية لهذا الإعداد مقدار البيانات المحيطة التي يجب استخدامها للتجانس: فكلما زاد الرقم ، كلما كانت المنحنيات أقل حدة. الإعداد قابل للتكوين بواسطة المستخدم. الافتراضي: إيقاف.

يمكن عرض إشارة المسار في نطاق لوغاريتمي باستخدام هذا الإعداد القابل للتكوين بواسطة المستخدم. الافتراضي: NONE.

قد يتم احتواء البيانات الأكثر أهمية في مسار الرسم البياني ضمن نطاق ضيق. عادةً ما تؤدي القيم الخارجية المرتفعة إلى تحريف الرسم البياني وقد تمثل القيم المنخفضة جدًا بيانات غير مهمة. استخدم viewLimits لتعيين نطاق العرض الافتراضي. استخدم أيضًا viewLimitsMax كحدود خارجية مقترحة.

سيتم عرض أي نقاط بيانات من 20 أو أعلى على أنها ذروة الرسم البياني. لن يتم عرض نقاط البيانات التي تقل عن 5. على الرغم من أن نطاق البيانات الكامل يمتد إلى 100 ، إلا أن هذه الإعدادات تشير إلى أن الدرجات التي تبلغ 20 أو أكثر تعتبر جميعها وثيقة الصلة بالموضوع.

ليس للمراكز. لمسارات شعر مستعار فقط.

يمكن تمييز مناطق الإشارة الرسومية بالألوان. استخدم طاولة السرير وإعدادات الألوان لتظليل مناطق مسار الشعر المستعار.

يتم استخدام جدول نوع السرير "myBed" لتمييز مناطق الإشارة الرسومية بناءً على النتائج الموجودة في هذا الجدول. قد يكون الجدول نفسه مسارًا مرئيًا ، أو قد يكون موجودًا فقط لغرض تسليط الضوء على مسار الإشارة.

اعتمادًا على حجم المنطقة الجينومية المعروضة في صورة المتصفح ، قد يكون من الضروري تلخيص الإشارة الفعلية. يتحكم هذا الإعداد القابل للتكوين بواسطة المستخدم في كيفية قيام المستعرض بطي الإشارة من (على سبيل المثال) 100 أو 100 ألف قاعدة إلى بكسل واحد. بشكل افتراضي ، يمثل البكسل الفردي متوسط ​​البيانات ، على الرغم من أنه يمكن عرض الحد الأقصى أو الحد الأدنى بدلاً من ذلك. غالبًا ما يكون الخيار الأكثر إفادة يعني + شعيرات. يعرض هذا الإعداد الانحراف المعياري المتوسط ​​، والحد الأقصى ، وانحراف معياري واحد فوق المتوسط ​​، متمايزًا عن طريق التظليل. يتم عرض المتوسط ​​على أنه أغمق ظل ، ويعني واحد stdDev أعلاه أنه أفتح قليلاً ، والحد الأقصى يعني أخف ظل. يمكن أن يشير هذا التظليل الدقيق بسرعة إلى ما إذا كانت البيانات المكثفة تخفي معلومات مهمة لا يمكن تقييمها بشكل كافٍ إلا من خلال التكبير.

عند التصغير ، سيعرض هذا المسار الإشارة المتوسطة ولكنه يتضمن تظليلًا يمثل درجات أعلى. يمكن للمستخدم تغيير هذا الإعداد.

قد يكون من المفيد رسم خط عبر الرسم البياني لإشارة المسار عند بعض إحداثيات y الثابتة. قم بذلك عن طريق تعيين yLineOnOff على "تشغيل" وتحديد إحداثيات y مع yLineMark. يمكن للمستخدم تكوين هذين الإعدادين. الافتراضيات: إيقاف و 0.0.

غالبًا ما يتم الخلط بين هذه الإعدادات القابلة للتكوين هي خاصية الشبكة الافتراضية ، والتي تقوم ببساطة برسم خط عند y = 0 عبر مسارك بالكامل. قد يكون هذا الإعداد مفيدًا إذا كان نقص البيانات يعادل إشارة 0.

يتم رسم الإشارة بخط متصل افتراضي عند الصفر ، مما يشير إلى أنه يجب تفسير أي فجوات في البيانات على أنها إشارة صفرية. سيكون هناك أيضًا خط عند ارتفاع الإشارة 2.5 يمكن استخدامه للتأكيد على أي قمم في الإشارة تصل إلى هذا الارتفاع الحرج.

يتكون مسار التذبذب هذا من جدول MariaDB وملفات ثنائية "wib" المشار إليها في الجدول. وظيفة النوافذ الافتراضية هي الإشارة القصوى في كل نافذة (تحت كل بكسل) معروضة. إن مدى القواعد التي يغطيها كل صف في الجدول متطابق ويمكن جمعه من الصف الأول في الجدول. يحتوي التذبذب على ألوان توفرها طاولة السرير ، myBed.

يتم الاحتفاظ بإشارة تنسيق bigWig هذه في ملف بيانات (قد يكون بعيدًا). يتم استخدام وظيفة النوافذ الأكثر إفادة + شعيرات بشكل افتراضي في هذا المسار ، وستكون الإشارة عالية 32 بكسل في عرض صورة المستعرض. لاحظ أنه على الرغم من أن قيمة الإشارة قد تكون أقل من الصفر ، فلن يتم عرض هذا الجزء من الإشارة. سيعرض المتصفح خطًا عند y = 0 وآخر عند y = 15 ، والتي قد تكون قيمة حدية لهذه الإشارة. سيتم تلوين المسار باللون الأرجواني.

يتكون مسار إشارة نمط bedGraph هذا من جدول MariaDB للعناصر ، كل منها بدرجة محددة في العمود الرابع. في حين أن المسار المتذبذب يتكون عادة من نوافذ ذات فواصل ثابتة للإشارة (على سبيل المثال 200 نقطة أساس) ، قد يحدد جدول رسم بياني السرير إشارة بأحجام متفاوتة من النوافذ ذات الفجوات أو بدونها.

يتم الاحتفاظ بإشارة تنسيق bigWig هذه في ملف بيانات (قد يكون بعيدًا). يتم استخدام وظيفة النوافذ الأكثر إفادة + شعيرات بشكل افتراضي في هذا المسار ، وستكون الإشارة عالية 32 بكسل في عرض صورة المستعرض. لاحظ أنه على الرغم من أن قيمة الإشارة قد تكون أقل من الصفر ، فلن يتم عرض هذا الجزء من الإشارة. سيعرض المتصفح خطًا عند y = 0 وآخر عند y = 15 ، والتي قد تكون قيمة حدية لهذه الإشارة. سيتم تلوين المسار باللون الأرجواني.

GenePred: النماذج الجينية والتنبؤات

ليس للمراكز. (لا تنطبق أي من الإعدادات الموجودة في هذا القسم على لوحات الوصل.)

genePred هي مجموعة متنوعة من المسارات المستندة إلى العناصر المصممة خصيصًا لعرض نماذج الجينات. يمكن تمثيل نماذج الجينات في مسارات من النوع 12 أو bigBed 12 ، لكن تنسيق جدول genePred يسمح بمزيد من التفاصيل ، مثل التمييز بين النسخ ومنطقة الترميز والتشفير مقابل exons غير المشفر. يرجى الرجوع إلى الأسئلة الشائعة للحصول على معلومات حول كيفية تحضير جداول genePred لتضمينها في متصفح الجينوم.

هذا النوع من المسارات ، الذي يعتمد على جداول MariaDB ، مخصص لنماذج الجينات والتنبؤات.

  • pepTable - جدول تسلسل البروتين الاختياري
  • mrnaTable - جدول مرنا تمثيلي اختياري

لاحظ أنه يمكن ملء الخيارات المفقودة بـ ". نقطة. تسمح الإعدادات الإضافية الموضحة أدناه بتجميع نماذج الجينات في فئات وتلوين النماذج وتصفيتها حسب الفئة.

يمكن العثور على الأمثلة أدناه.

يمكن تجميع الجينات في فئات لأغراض التلوين والتصفية. الحيلة هي كيفية ربط كل جين مسمى بفئته. استخدم geneClasses لإنشاء قائمة بجميع أسماء فئات الجينات المحددة بمسافة بيضاء.

قم بتعريف لون RGB لفئة مسماة.

قم بتعريف جدول MariaDB الذي سيربط الفئات بنماذج الجينات المسماة.

قم اختياريًا بتعريف عمود itemClassTbl الذي سيحتوي على أسماء genePred.الافتراضي: الاسم.

بشكل اختياري ، قم بتعريف عمود itemClassTbl الذي سيحتفظ بالفئة. الافتراضي: class.

في مسار النوع الجيني هذا ، تنقسم النماذج الجينية للحمض النووي الريبي إلى 3 فئات ملونة باللون الأحمر أو الأخضر أو ​​الأزرق. يتم تحديد ارتباط نماذج الجينات المسماة في جدول genePred بالفئات الثلاثة في جدول "rnaType". يحتوي هذا الجدول على نوع RNA في عمود "rnaType" واسم الجين في عمود "rnaName".

يمكن تحقيق ترشيح نماذج الجينات حسب عمود الجدول أو حتى عمود itemClassTbl بواسطة هذا الإعداد. يمكن العثور على وصف كامل لهذا الإعداد في إعدادات المسار المستندة إلى سرير / سرير كبير. فيما يلي مثال للإشارة إلى الفئة كما هو موجود في الجدول المحدد بواسطة itemClassTbl. لن تدعم جميع أنواع المسارات الجداول المُشار إليها خارجيًا باستخدام filterBy كما يفعل نوع genePred. ولكن إذا فهمت رمز CGI الذي يقوم بتحديد الجدول ، فيمكن أن يوفر filterBy امتدادًا قويًا لتحديد SQL المستخدم.

عند تحديد نماذج الجينات من جدول genePred للعرض في المتصفح ، يتم تحديد فئتها أيضًا من جدول "rnaTypes". يؤدي استخدام إعداد التصفية بواسطة الإعداد إلى إنشاء مربع قائمة منسدلة يمكن اختياره من قبل المستخدم من 3 اختيارات أو "الكل". عندما يقوم المستخدم بالتصفية بواسطة tRNA و snRNA (الخياران الأخضر والأزرق) ، فإن عبارة تحديد SQL المستخدمة بواسطة المتصفح ستقتصر على جملة where "حيث rnaTypes.rnaType في ('tRNA'، 'snRNA')".

بشكل افتراضي ، يتم إنشاء ترجمة بروتينية متوقعة لنموذج جيني عندما يشاهده المستخدم في صفحة التفاصيل. قد يتم حظر هذه الميزة عن طريق تعيين الترجمة التلقائية على صفر.

لن يُظهر مسار genPred تسلسل بروتين مُنشأ تلقائيًا ، ربما لأن هذا المسار مخصص لجينات الحمض النووي الريبي.

في رسم النماذج الجينية ، قد يكون من المفيد رؤية "أسهم exon" عندما يمتد النص إلى ما بعد النافذة الحالية. يضمن هذا الإعداد ، الذي يتم تعيينه افتراضيًا إلى الصفر ، أن هذه الأسهم لن يتم رسمها إذا كانت فجوة intron المتقاطعة أقل من العدد المحدد للقواعد.

لا ترسم أسهم exon عندما تكون الفجوة بين exons 12 قاعدة أو أقل.

في hgTables ، عند تحديد حقول الإخراج ، اعرض كل هذه الجداول المرتبطة بشكل افتراضي.

باستخدام هذا الإعداد ، يمكنك ربط الأسماء البديلة بنماذج الجينات الموجودة في genePred. يتم استخدام هذا بواسطة مستعرض الجدول لإنشاء روابط لجداول أخرى.

يرتبط المعرف الموجود في عمود الاسم في جدول knownGenes بالاسم المستعار الموجود في جدول kgAlias.

في الإصدارات المتتالية من النماذج الجينية ، قد يكون من المفيد تعيين الجينات القديمة لنماذجها الأحدث. يمكن القيام بذلك عن طريق توفير جدول MariaDB الذي يرسم التغيير ، ثم استخدام هذا الإعداد للتأكد من أن صفحة تفاصيل الجينات تعرض أي تغييرات.

يشير الإصدار الأقدم من جينات UCSC إلى التغييرات التي تظهر في الإصدار الأحدث.

مسار نموذج الجينات بفئات محددة وخيار التصفية حسب الفئات المشفرة بالألوان. لاحظ خيار تلوين المستوى الأساسي.

يرتبط مسار التنبؤ الجيني هذا بتمثيل mRNAs الموجود في جدول "mrna". يوجد أيضًا عنوان url "AceView Gene Summary" معروض في صفحة التفاصيل.

Bam / cram: محاذاة التسلسل المضغوط / مسارات الخريطة

تنسيق bam / cram هو تنسيق بيانات مضغوط مفهرس لمحاذاة التسلسل. إنه مثالي للوصول عن بُعد لعلامات التسلسل عالية الإنتاجية وهو تنسيق إخراج أصلي لبعض أدوات محاذاة التسلسل عالي الإنتاجية (HTS). تنسيق بيانات bam هو أزواج ملفات البيانات ، مع فهرس في ملف منفصل. ملفات CRAM هي إصدارات مضغوطة من ملفات BAM حيث لا يتم تضمين التسلسل المرجعي. يجب إدراج ملفات CRAM على أنها "type bam" في trackDb. غالبًا ما تكون هذه مجموعات البيانات البعيدة ، ولا توجد على خادم UCSC. يرجى الرجوع إلى صفحة تنسيق مسار BAM أو صفحة تنسيق مسار CRAM وموقع ويب SAMtools للحصول على معلومات حول كيفية إنشاء ونشر ملفات البيانات البعيدة هذه لتضمينها في مستعرض الجينوم.

تعلن عن إعدادات التكوين لمسار من نوع bam. إذا تم تضمين إعداد bigDataUrl ، فسيتم عرض تلك البيانات الموجودة في الموقع المحدد بواسطة عنوان URL هذا. خلاف ذلك ، يمكن لجدول قاعدة البيانات الذي يحتوي على عمود واحد اسم الملف تحديد موقع ملف محلي أو عنوان URL. إذا كان جدول قاعدة البيانات يشتمل على عمود seqName ، فيمكن تحديد ملف BAM مختلف أو عنوان URL لكل تسلسل تجميع.

يمكن العثور على المثال أدناه.

هناك طرق عديدة لتلوين مسارات bam لإبراز جوانب معينة من البيانات. كل هذه قابلة للتكوين بواسطة المستخدم.

  • حبلا: (افتراضي) عند تلوينها بالخيط ، يتم تمييز القواعد غير المتطابقة باللون الأحمر الفاتح ، ويتم تلوين المحاذاة على الخصلة العكسية باللون الأحمر الداكن ، ويتم تلوين المحاذاة على الشريط الأمامي باللون الأزرق الداكن.
  • الرمادي: عند تلوين العناصر بتدرج الرمادي ، يتم تظليل العناصر وفقًا للطريقة المحددة بواسطة bamGrayMode: جودة المحاذاة أو الصفات الأساسية أو النهايات غير المزدوجة.
  • العلامة: يتم تحديد الألوان في "العلامات المعرفة من قبل المستخدم". قد تتضمن SAM / BAM علامات يحددها المستخدم ، وتبدأ أسماؤها بـ X أو Y أو Z وتتضمن حرفًا أو رقمًا آخر. تحدد العلامة المعرفة من قبل المستخدم المسماة هنا شدة اللون الأحمر والأخضر والأزرق (RGB) كسلسلة صفرية منتهية (نوع العلامة Z) تحتوي على أرقام ثلاثية مفصولة بفواصل من 0-255. على سبيل المثال ، إذا تضمن سجل SAM / BAM العلامة YC: Z: 255،0،0 ، فسيكون العنصر ملونًا باللون الأحمر YC: Z: 0،0،255 يجعل العنصر باللون الأزرق. بشكل افتراضي ، العلامة هي "YC" ما لم يتم تغييرها باستخدام إعداد bamColorTag.
  • إيقاف: لا تلوين إضافي.

عند ضبط bamColorMode على "الرمادي" ، يمكنك تمييز أحد الخيارات التالية:

  • aliQual: (افتراضي) يتم تظليل "صفات المحاذاة" للعناصر على مقياس من 0 (الأفتح) إلى 99 (الأغمق). استخدم aliQualRange لتحديد نطاق افتراضي.
  • baseQual: يتم تظليل "الصفات الأساسية" على مقياس من 0 (الأفتح) إلى 40 (الأغمق). استخدم baseQualRange لتحديد نطاق افتراضي.
  • غير مقترن: عند تحديد "نهايات غير مقترنة" ، يكون العنصر الذي تم إقرانه بالتسلسل ولكن لم يتم تعيين رفيقه باللون الرمادي ، بينما يتم تلوين العناصر الفردية والعناصر المقترنة بشكل صحيح باللون الأسود.

الرجوع إلى تفاصيل تنسيق SAM لمناقشة هذه القيم.

يمكنك أيضًا استخدام بيانات RGB المرتبطة بعلامات فردية داخل ملف bam نفسه. راجع وثائق SAM لفهم كيفية تضمين قيم RGB. عندما يتم تعيين bamColorMode على "علامة" ، يتم استخدام علامة "YC" القياسية باعتبارها العلامة الافتراضية. قد يتم تجاوز الإعداد الافتراضي بهذا الإعداد.

خيارات تلوين بام قابلة للتكوين بواسطة المستخدم داخل المتصفح. إذا كانت مجموعة بيانات bam الخاصة بك لا تحتوي على علامات ألوان ، فيجب تضمين هذا الإعداد لمنع المتصفح من تقديم خيار تلوين العلامات بقيمة RGB مضمنة.

يضبط bam لاستخدام نظام التلوين الافتراضي بناءً على محاذاة الجدائل. في الوقت نفسه ، لن يوفر مسار bam خيار تلوين العلامات بقيم RGB ، ربما لأن هذا bam لا يحتوي على قيم RGB.

ستبرز هذه الإعدادات العلامات من خلال نقاط جودة المحاذاة. إذا كانت النتيجة 80 أو أعلى ، تكون العلامة مظللة باللون الأسود إذا كانت أقل من 20 ، وتكون العلامة مظللة باللون الرمادي الفاتح للغاية.

يتضمن ملف bam قيم RGB في حقل YC الذي سيتم استخدامه لتلوين العلامات.

لن يتم تطبيق ألوان خاصة على العناصر.

يمكن عرض أي علامة bam على صفحة التفاصيل من خلال النقر عليها في صورة المتصفح. تتضمن التفاصيل نقاط الجودة بشكل افتراضي. إذا لم تكن هذه الدرجات ذات صلة بهذا الوضع المعين ، فقد يتم استبعادها من صفحة التفاصيل باستخدام هذا الإعداد.

يمكن تمييز اختلافات الإدراج والحذف بين تسلسل العلامات والجينوم المرجعي باستخدام هذه الإعدادات. قد يتم تعيين هذه الخيارات من قبل المستخدم.

  • indelDoubleInsert: تُستخدم لإبراز فجوات المحاذاة في كل من تسلسل الهدف (المرجع) والاستعلام (العلامة) باستخدام أسطر مزدوجة (=).
  • indelQueryInsert: استخدمه لتمييز إدخال في تسلسل الاستعلام فقط عن طريق رسم خط عمودي برتقالي (|) أو أرجواني (|). تُظهر الخطوط البرتقالية مناطق غير قابلة للمحاذاة في منتصف التسلسل ، بينما تُظهر الخطوط الأرجوانية مناطق في نهاية تسلسل الاستعلام.
  • indelPolyA: استخدم هذا الخيار لإبراز شكل ذيل بولي صالح ظاهريًا عن طريق رسم خط أخضر رأسي (|).

عندما يتم تكبير صورة المستعرض إلى المستوى الذي تكون فيه العلامات الفردية مرئية ، يمكن تصفية العلامات الموجودة في ملف bam لإظهار تلك التي لديها حد أدنى من نقاط جودة المحاذاة فقط. هذا إعداد قابل للتكوين بواسطة المستخدم. الافتراضي: 0.

تؤدي بعض تقنيات التسلسل عالي الإنتاجية إلى علامات "نهاية مقترنة" ، وهي عبارة عن سجلين فرديين من نوع bam يتم ضمهما بواسطة أسمائهم. إذا كان هذا هو الحال مع مجموعة البيانات الخاصة بك ، فقم بتضمين هذا الإعداد.

سيقتصر البحث لربط أزواج من العلامات حسب الاسم على مسافة قصوى (الافتراضي: 20000 قاعدة). استخدم نطاقًا أكبر لزيادة احتمالية العثور على كلتا القراءات في زوج حتى عندما تكون القراءة واحدة فقط في المنطقة المعروضة. استخدم نطاقًا أصغر لتسريع عرض الصورة.

تتضمن مجموعة البيانات علامات نهاية مقترنة. الحد الأقصى لنطاق البحث للانضمام إلى أزواج العلامات حسب الاسم هو 5000.

عندما يتم تكبير صورة المستعرض إلى المستوى الذي يمكن فيه عرض العلامات الفردية ، يتم عرض اسم الاستعلام لكل علامة بشكل افتراضي. استخدم هذا الإعداد لإخفاء هذا الاسم.

يتيح إعداد doWiggle عرض بيانات BAM كرسم بياني شريطي حيث يتناسب الارتفاع مع عدد القراءات المعينة لكل موضع جينومي. من خلال الحساب الديناميكي للعناصر في النافذة الحالية ، ترسم هذه الميزة خطًا مشابهًا للرسم البياني المتذبذب الذي يمكن تخصيصه بعدد من خيارات التكوين القائمة على الرسم البياني مثل رسم خطوط المؤشر ، وتنعيم المؤامرات ، وضبط ارتفاع الرسم البياني والنطاق العمودي ، و التحول من الحانات إلى النقاط. يرجى ملاحظة أن الميزة يتم عرضها بشكل أفضل مع & quotDisplay mode & quot مضبوطة على كامل وأن & quot؛ تحجيم & ​​quot عرض البيانات الافتراضي هو & quot؛ مقياس الحصة التلقائية لعرض البيانات. & quot

يتم الاحتفاظ ببيانات bam في ملف "barneysSon.bam" الموجود في موقع يمكن الوصول إليه عبر الإنترنت. بالإضافة إلى ملف البيانات ، يجب أن يوجد ملف فهرس مرتبط في نفس الموقع. يجب أن يكون لملف الفهرس نفس اسم ملف البيانات ، مع إلحاق ".bai" (مثل barneysSon.bam.bai).

Psl: محاذاة التسلسل

ليس للمراكز. (لا تتوفر أي من الإعدادات الموجودة في هذا القسم للمحاور ، على الرغم من أنه من المحتمل أن تتم إضافة دعم الموزع في المستقبل.)

PSL هو تنسيق محاذاة يتم فيه أخذ البيانات عادةً من الملفات التي تم إنشاؤها بواسطة BLAT أو psLayout. لمزيد من المعلومات حول هذا التنسيق ، يرجى الرجوع إلى الأسئلة الشائعة ووثائق BLAT.

تتطلب مسارات النوع psl مواصفات النوع الفرعي: est أو mrna أو protein أو xeno. الافتراضي ، الذي يتم تمثيله كـ "." ، هو مرنا بشري عادي. عند تحديد النوع الفرعي xeno ، يمكن تعيين معلمة اختيارية إضافية لتحديد مجموعة الأنواع الأخرى. في حالة وجود المحاذاة ، يمكن ترميزها بالألوان بواسطة الكروموسوم ، ويتم عرض الكروموسوم والموضع (في قواعد الكيل) في ملصق المحاذاة.

يمكن العثور على الأمثلة أدناه.

قم بتضمين blastRef إلى التجميع والجدول الذي يحتوي على geneId والموضع الذي يمكن استرجاعه بواسطة معرف الانضمام. سيتم عرض هذه المعلومات في اسم العنصر.

بالنسبة لمسارات psl من النوع الفرعي xeno ، يمكن تلوين المحاذاة للإشارة إلى موقعها في الأنواع الأخرى. يتم تشغيل هذا الإعداد افتراضيًا عند تحديد الأنواع الأخرى في إعداد النوع psl. استخدم هذا الإعداد لإيقاف تشغيل تلوين الكروموسوم افتراضيًا ، مما يتيح للمستخدم خيار تشغيله.

استخدم الإعداد المسبق لتسمية التجميع والجدول الذي يحتوي على بيانات تسلسل البروتين للمحاذاة المسماة.

  • الكل: عرض ملصقات النوكليوتيدات على جميع القواعد.
  • مختلف: تسمية الاختلافات الأساسية فقط.
  • لا: اسمح للمستخدم بتحديد الخيار المفضل من الخيارين الآخرين.

  • transMapInfo: استخدمه لتسمية الجدول في التجميع الحالي الذي يربط المحاذاة مع تجميع المصدر والميزة.
  • transMapSrc: يُستخدم لتسمية الجدول في تجميع الأنواع المصدر الذي يحتوي على تفاصيل موقع مصدر الميزة.
  • transMapGene: استخدم لتسمية الجدول الذي يرسم خريطة المحاذاة لأسماء الجينات في الأنواع ذات الصلة. لاحظ أنه يجب وضع الجداول المشتركة بين الأنواع المتعددة في قاعدة بيانات hgFixed.
  • transMapTypeDesc: استخدم لتعيين تسمية لنوع transMapping الذي تغطي المحاذاة.

لاحظ أن العديد من الجداول المسماة موجودة في hgFixed ، وهي قاعدة بيانات تحتوي على جداول مشتركة بين أنواع وتجمعات متعددة. لاحظ أيضًا أن نفس الجدول الذي تم تسميته في transMapGene يُستخدم أيضًا في هذا المثال لـ baseColorUseCds.

بالنسبة للمحاذاة التي توضح التحويل الرجعي ، استخدم هذا الإعداد لتسمية جدول بتفاصيل موقع المصدر.

في هذا المثال من الجينات المعاد طرحها ، تمت محاذاة mRNA الناضجة مع الجينوم. لاحظ أن هناك جدول ucscRetroInfo يصف موقع الجين غير المحول. لاحظ أيضًا استخدام إعدادات baseColor لتلوين تسلسل الترميز (CDS).

في هذا المثال لنتائج blat لتسلسل البروتين ، يكون لون تسلسل المطابقة أخضر ، بينما يتم تمييز indels (في هذه الحالة introns) باللون الأصفر.

سيكون مثال علامة التسلسل المعبر عنها هذا محاذاة ملونة يتم تصنيفها حسب الدرجة بفضل "تشغيل الطيف". على الرغم من أن مسارات psl لا تحتوي على عمود نقاط كجزء من التنسيق ، يتم إنشاء النتيجة بناءً على التطابقات وعدم التطابق في المحاذاة. يعتبر التظليل أكثر دقة من حيث أن الوزن المعطى للإدخالات يختلف اعتمادًا على ما إذا كانت المحاذاة لنفس النوع أو نوع مختلف.

مسار psl هذا مخصص للأنواع الأجنبية أو محاذاة "xeno" ، وفي هذه الحالة يقرأ التسلسل نوعًا من الأسماك المحاذية للإنسان.

Chain and netAlign: محاذاة الأنواع المقترنة

ليس للمراكز. ولا يوجد أي من الإعدادات في هذا القسم.

على الرغم من اختلاف التنسيقين "chain" و "netAlign" ، إلا أنهما غالبًا ما يتم إقرانهما لإظهار عرضين مختلفين لنفس البيانات.

تظهر مسارات السلاسل محاذاة أنواع "الاستعلام" إلى مجموعة الجينوم "المستهدفة". على سبيل المثال ، يمكن محاذاة panTro2 الشمبانزي مع جينوم hg19 البشري. يسمح تنسيق السلسلة بوجود فجوات في كلا التسلسلين في وقت واحد. عند عرض السلاسل في المستعرض ، فإنها تعرض مربعات صلبة للمحاذاة ، مفصولة إما بخطوط مفردة أو مزدوجة. تظهر الأسطر المفردة عندما يحدث الإدراج في الهدف أو يحدث الحذف في أنواع الاستعلام. تمثل الخطوط المزدوجة فجوات في كلا النوعين يمكن أن تنتج عن عدد من الأسباب (مثل الانقلاب في نوع واحد). لمزيد من المعلومات حول تنسيق "chain" ، يرجى الرجوع إلى http://genome.ucsc.edu/goldenPath/help/chain.html.

يمثل مسار netAlign أفضل سلسلة لكل منطقة في الجينوم المستهدف. سيُظهر المسار الصافي أكبر سلاسل الدرجات التي تمتد عبر منطقة ما ، وأعلاها نقاطًا. عندما تحتوي هذه السلاسل على فجوات ، فقد يتم ملؤها بسلاسل إضافية ، كما هو موضح في مستوى أدنى ، ويمكن سد الفجوات في هذه السلاسل بدورها عند مستوى أدنى. تساعد هذه المستويات في تصور إعادة ترتيب الجينوم مثل الانقلابات والعناصر المعاد طرحها. لمزيد من المعلومات حول تنسيق netAlign ، يرجى الرجوع إلى http://genome.ucsc.edu/goldenPath/help/net.html.

تظهر مسارات سلسلة النوع محاذاة التسلسل من أنواع أخرى إلى الجينوم المرجعي. يتطلب هذا النوع تسمية قاعدة بيانات التجميع للأنواع الأخرى في كل من إعداد النوع وإعداد "otherDb".

يمكن العثور على المثال أدناه.

تُظهر مسارات النوع netAlign أفضل سلاسل محاذاة التسلسل من أنواع أخرى إلى الجينوم المرجعي. يتم سد الثغرات في المستويات ، حيثما أمكن ذلك. يتطلب هذا النوع تسمية قاعدة بيانات التجميع للأنواع الأخرى في كل من إعداد النوع وإعداد "otherDb".

يمكن العثور على المثال أدناه.

يتم تلوين السلاسل افتراضيًا بواسطة كروموسوم المحاذاة الخاص بأنواع الاستعلام. يمكن تجاوز هذا مع هذا الإعداد. الخيارات الثلاثة هي:

  • كروموسوم - افتراضي
  • النتيجة الطبيعية - يتم تلوين السلاسل حسب النتيجة
  • أسود - لا يحدث تلوين

يؤثر هذا الإعداد على مسارات السلسلة وليس مسارات نوع netAlign.

يجب أن يعكس إعداد chainLinearGap المعلمة "-linearGap" المستخدمة في axtChain لإنشاء المسار. تمثل مصفوفة قياس الفجوة المستخدمة وستكون إما:

هذا الإعداد مخصص لكل من المسارات من نوع السلسلة و netAlign.

يجب أن يعكس إعداد chainMinScore المعلمة "-minScore" المستخدمة في axtChain لإنشاء المسار. يمثل الحد الأدنى من النقاط للسلاسل التي سيتم تضمينها في المجموعة. الافتراضي هو 1000. هذا الإعداد هو لكل من مسارات نوع السلسلة و netAlign.

سلسلة معينة أو مسار netAlign قد يحتوي أو لا يحتوي على عمود معياري مأهول. إذا كان العمود موجودًا ، فيمكن عرض قيمته في صفحة تفاصيل العنصر بالمستعرض عن طريق تعيين chainNormScoreAvailable to yes. يتطلب تلوين العنصر بناءً على الدرجة كما هو محدد بواسطة سلسلة Color Normalized Score أيضًا أن يكون هذا الإعداد نعم.

تعتمد طريقة تسجيل النقاط واختيار السلاسل وتوليد netAligns على مصفوفة تكاليف الاستبدالات الأساسية. يمكن أن تختلف المصفوفة المستخدمة في إنشاء أي محاذاة زوجية معينة اعتمادًا على أشياء مثل المسافة التطورية والأنواع المعنية. يمكن تضمين المصفوفة المستخدمة ديناميكيًا في وصف HTML باستخدام ثلاثة عناصر:

  1. يجب أن يحتوي وصف HTML على رمز المصفوفة $ المميز فيه.
  2. يجب تحديد المصفوفة التي سيتم استخدامها باستخدام إعداد trackDb هذا. شكل هذا الإعداد هو حجم خلية المصفوفة الذي يكون بالنسبة لمحاذاة الحمض النووي 16. يتم فصل هذا الحجم بمسافة من المصفوفة المحددة بفواصل لجميع القيم حيث يتم تعبئة خلايا المصفوفة من اليسار إلى اليمين ومن أعلى إلى أسفل .
  3. يجب استخدام إعداد رأس المصفوفة لتحديد ترتيب انتقالات القاعدة في المصفوفة. عادة هو ldquoA ، C ، G ، T & ldquo.

هنا سيتم استبدال رمز المصفوفة $ الموجود في ملف chainNet.html بالمصفوفة التالية:

أججيتي
أ91-114-31-123
ج-114100-125-31
تي-31-125100-114
جي-123-31-11491

كل من مسارات السلسلة و netAlign أعلاه مخصصة لمحاذاة أنواع الاستعلام / التجميع rheMac2 ضد الأنواع المستهدفة التي تحددها قاعدة البيانات التي ينتمي إليها trackDb (على سبيل المثال ، human / hg19). نظرًا لأن مسار netAlign يعتمد على البيانات الموجودة في مسار السلسلة ، فإنه يشير إلى المسار في إعداد نوعه. يستخدم كلا المسارين نفس إعدادات المصفوفة و chainMinScore والفجوة الخطية. يتم وصف طرق تجميع هذين المسارين في مجموعة واحدة والتي تشارك الإعدادات لاحقًا في هذا المستند.

WigMaf: محاذاة متعددة

ليس (حاليًا) للمراكز. ولا يوجد أي من الإعدادات في هذا القسم.

يمكن عرض المحاذاة الزوجية المتعددة باستخدام مسارات من نوع "wigMaf". قد تتكون المسارات من هذا النوع بالفعل من عدة جداول وملفات بيانات. سيقوم إعداد النوع بتسمية جدول تنسيق MAF (مع ملف "maf" المرتبط في / gbdb). سيحدد إعداد "wiggle" الاختياري اسمًا واحدًا أو أكثر من جداول تنسيق شعر مستعار (مع ملفات "wib" المرتبطة) التي تحتوي على إشارات الحفظ. يرجى الرجوع إلى الأسئلة الشائعة للحصول على معلومات حول كيفية إعداد مجموعات بيانات تنسيق المحاذاة المتعددة.

يتكون المسار من نوع wigMaf من محاذاة تنسيق MAF (محملة بـ hgLoadMaf). قد يتضمن المسار اختياريًا إشارة حفظ واحدة أو أكثر. يجب أن تكون الإشارات ضمن نفس نطاق البيانات المحدد مع الحد الأدنى والحد الأقصى للقيم في إعداد النوع.

يمكن العثور على الأمثلة أدناه.

يمكن لمسار wigMaf أو bigMaf عرض ترجمة الشفرة الجينية. قد يختلف إطار القراءة بين الأنواع. من خلال توفير معلومات إطارات القراءة في جدول منفصل ، يمكن للمستخدم اختيار الإطار الذي سيستخدمه عند عرض البيانات.بالنسبة إلى bigMaf ، من المتوقع أن تكون القيمة سريرًا كبيرًا ، أما بالنسبة إلى wigMaf ، فيجب أن تكون طاولة.

  • سطر واحد "-": لا توجد قواعد في الأنواع المتوافقة. ربما بسبب إدخال خاص بالنسب بين الكتل المتوافقة في الجينوم البشري أو حذف خاص بالنسب بين الكتل المحاذاة في الأنواع المحاذاة.
  • خط مزدوج '=': تمتلك الأنواع المحاذاة قاعدة أو أكثر من القواعد غير القابلة للتحاذي في منطقة الفجوة. ربما بسبب المسافة التطورية المفرطة بين الأنواع أو indels المستقلة في المنطقة بين الكتل المتوافقة في كلا النوعين.
  • تلوين أصفر شاحب: محاذاة الأنواع لها Ns في منطقة الفجوة. يعكس عدم اليقين في العلاقة بين الحمض النووي لكلا النوعين ، بسبب عدم وجود تسلسل في الأجزاء ذات الصلة من الأنواع المحاذاة.

يتحكم هذا في ما إذا كان يجب كتابة أسماء الأنواع في المحاذاة المتعددة بأحرف كبيرة في العرض الزوجي. اضبط "noChange" لتجنب إجبار الحرف الأول على الأحرف الصغيرة.

عرض wigMaf في صورة المستعرض عبارة عن مجموعة مكدسة من المحاذاة الزوجية للجينوم الهدف. باستخدام هذا الإعداد ، يمكنك تغيير ارتفاع كل إشارة زوجية في الصورة.

هذا الإعداد ، الذي يستخدم مع "الإطارات" ، يعلن الأنواع الافتراضية لإطار قراءة الكودون.

للتحكم في أي من المحاذاة الزوجية المكدسة يتم عرضها أو إخفاؤها افتراضيًا ، استخدم النوع typesDefaultOff لسرد محاذاة الأنواع التي لن يتم عرضها. يتم تحديد كل نوع كما في ملف MAF ، يتم استبدال أسماء الكائنات باستثناء النقاط و / أو المسافات المضمنة بالشرطات السفلية (على سبيل المثال ، C. elegans - & gt c_elegans).

استخدم الأنواعأوامر للإعلان عن ترتيب المحاذاة المكدسة. إذا كان هناك العديد من الأنواع في المسار الخاص بك ، فقد يكون من المنطقي استخدام إعداد مجموعات الأنواع بدلاً من ذلك.

يمكنك تضمين قائمة من "الكتل" لتجميع الأنواع فيها. هذا الخيار هو بديل لطلب الأنواع ، ويستخدم عندما يكون هناك العديد من الأنواع. يجب أن يكون لكل نوع مجموعة في القائمة إعدادها الخاص (sGroup_ & ltgroup & gt) ، متبوعًا بقائمة الأنواع المحددة بالنسبة للأنواع النظام.

اختر أحد هذين البديلين لعرض الأنواع.

نادرًا ما يتم استخدام هذا الإعداد ، يمكن أن يحل محل الأنواع النظام والأنواع المجموعات. عيّن ملف الأنواعUseFile إلى مسار ذي صلة بـ apache cgi-bin. يجب أن يحتوي الملف على اسم نوع واحد كالكلمة الأولى من كل سطر.

يحتوي هذا الإعداد على اسم جدول يحتوي على جدول ملخص MAF ، أو عنوان url يشير إلى BigBed يحتوي على تلك المعلومات. يتم استخدام عرض الملخص عندما يتم تصغير عرض المستعرض لاحتواء مليون أو أكثر من الأزواج الأساسية. يتم إنشاء جدول ملخص من ملف MAF محاذاة متعددة باستخدام الأداة المساعدة hgLoadMafSummary. بالنسبة إلى bigMaf ، يُفترض أن تكون القيمة bigBed.

يمكن استخدام شجرة النشوء والتطور لإظهار العلاقات بين الأنواع في المحاذاة المتعددة يجب تضمينها كملف صورة. هذا المسار متعلق بدليل صور htdocs (عادةً / images).

اختياريًا ، يمكن تضمين أكثر من إشارة حفظ مع شاشة MAF الخاصة بك باستخدام هذا الإعداد. عندما تقوم بتضمين اهتزازات الحفظ ، يمكنك أيضًا تضمين الإعدادات القياسية للتحكم في مسارات نوع الإشارة. يشتمل الإعداد على ثلاثة أجزاء ، ثم (اختياريًا) مجموعات إضافية من ثلاثة ، وكلها محددة بمسافة بيضاء. الجدول الأول هو الافتراضي. يتم استخدام leftLabel لبادئة التسمية "Cons" في منطقة التسمية اليسرى لصورة المستعرض. يتم عرض uiLabel في صفحة تكوين المسار. إذا تم إدراج جدول واحد فقط ، ولم يكن هناك أي تسمية ، فسيتم عرض التسمية الافتراضية "الحفظ". لا يمكن أن تحتوي التسميات على مسافات ، ولكن سيتم ترجمة الشرطات السفلية (_) إلى مسافات في العرض.

ملاحظة: يُعد الاقتران المباشر لإشارات الحفظ داخل مسار wigMaf طريقة قديمة للقيام بالأشياء. من الأسهل منح المستخدمين التحكم في ما يريدون رؤيته ، من خلال تضمين مسار wigMaf ومسارات نوع الإشارة المنفصلة كمسارات فرعية ضمن مسار مركب. انظر وصف المسار المركب أدناه.

يتم تعريف هذه المحاذاة المتعددة ذات 8 اتجاهات لتجميع الإنسان hg17 لتشمل جدولًا موجزًا ​​وصورة شجرة وجدولًا واحدًا متذبذبًا يحتوي على درجة الحفظ للأنواع الثمانية. لاحظ أن المحاذاة الزوجية للأنواع الثلاثة الأخيرة متوقفة عن التشغيل افتراضيًا ، وسيكون ارتفاع كل محاذاة زوجية 10 بكسل. مع عرض عدد قليل من الأنواع افتراضيًا ، يتم تعيين irows افتراضيًا على "إيقاف" أيضًا ، مما يؤدي إلى عرض أكثر وضوحًا. نظرًا لوجود تذبذب للحفظ ، فهناك إعدادات إضافية لتلك الإشارة.

بالنسبة إلى مسار wigMaf هذا ، لا يوجد أي تذبذب محدد. في هذا المثال الفعلي المأخوذ من hg19 Genome Browser ، فإن إشارات الحفظ المتعددة المعروضة بالتنسيق مع هذه المحاذاة المتعددة هي مسارات منفصلة من نوع الإشارة تم تعريفها كجزء من المسار المركب "الحفظ" (انظر مناقشة المركبات أدناه). لاحظ أن الأنواع الـ 46 في هذه المحاذاة منظمة في مجموعات باستخدام إعداد "مجموعات الأنواع". كل كليد له إعداد "sGroup" الخاص به للإعلان عن الترتيب داخل (ليس كل الأنواع معروضة).

ExpRatio: بيانات تعبير ميكروأري

ليس للمراكز. ولا يوجد أي من الإعدادات في هذا القسم.

على الرغم من أن العديد من تجارب ميكروأري قد حلت محلها تجارب التسلسل عالي الإنتاجية (على سبيل المثال ، ChIP-seq) ، إلا أن العديد من مسارات المصفوفات الدقيقة لا تزال موجودة. علاوة على ذلك ، يمكن أن تكون تجارب ميكروأري الخيار الاقتصادي أو العملي في كثير من الحالات. يتم تخزين مجموعات البيانات لمسارات ميكروأري المضمنة في متصفح الجينوم في تنسيق السرير 12 + 3 (السرير 15) الذي يتضمن ثلاثة حقول إضافية: expCount و expIds و expScores. للعرض بشكل صحيح في متصفح الجينوم ، تتطلب مسارات ميكروأري إعداد العديد من السمات في ملف trackDb المرتبط بتجميع جينوم المسار. يجب أن يكون لكل مجموعة مسار ميكروأري أيضًا ملف تكوين microarrayGroups.ra مرتبط به يحتوي على معلومات إضافية حول البيانات في كل من المصفوفات. يرجى الرجوع إلى قسم مسار المصفوفة الدقيقة في ويكي الجينوم UCSC للحصول على معلومات حول كيفية تحضير مسارات المصفوفات الدقيقة. على وجه الخصوص ، يصف هذا المستند تنسيق ملف groupings.ra الذي يجب أن يقترن بمسار expRatio.

ملاحظة: يتم إعادة استخدام تنسيقات بيانات expRatio لنوع مصدر عامل.

يتم عرض بيانات Microarray في المستعرض عن طريق مسارات نوع expRatio. يتطلب النوع إعدادات إضافية: expScale و expStep والتجمعات.

يمكن العثور على المثال أدناه.

إذا كانت بيانات المصفوفة الدقيقة تتضمن نموذجًا جينيًا أو كتلًا داخل العناصر ، فيمكن عندئذٍ عرض البيانات على أنها exons و introns عن طريق تعيين expDrawExons على on. الإعداد قابل للتكوين من قبل المستخدم.

مقدار خطوة في مقياس التعبير المرئي. أفضل رقم تقريب قريب من expScale مقسومًا على 8.

يحدد هذا الإعداد اسم الجدول في قاعدة البيانات المشتركة hgFixed التي تحتوي على أسماء التجارب ، وما إلى ذلك.

TODO: لا أعرف من أين يتم قراءة هذا في رمز C.

يجب أن تشير مجموعة بيانات microarray إلى مجموعة محددة من التكوينات للتحميل من ملف microArrayGroups.ra. يرجى الرجوع إلى قسم مسار ميكروأري في ويكي الجينوم UCSC للحصول على إرشادات مفصلة حول موقع هذا الملف وتنسيقه. استخدم إعداد "المجموعات" للإشارة إلى مقطع مكتوب عليه "الاسم" في هذا الملف.

تشير مجموعة بيانات ميكروأري هذه إلى المجموعات المحددة في مقطع "gnfHumanAtlas2Groups" لملف makeDb / hgCgiData / Human / microarrayGroups.ra.

SnpNNN: فئة فرعية متخصصة من BED 6 لمتغيرات dbSNP

ليس للمراكز. ولا يوجد أي من الإعدادات في هذا القسم.

هذا المتغير المحدد من السرير 6 ، الذي تم تحديده بواسطة اسم الجدول ، هو لمجموعة فرعية من dbSNP الخاصة بـ UCSC ، قاعدة بيانات NCBI للمتغيرات الجينية القصيرة.

يمكن وصف المجموعة الفرعية لـ dbSNP الخاصة بـ UCSC بأنها "bed 6 + 19" ويتم إنتاجها بواسطة عملية معقدة تبدأ بتنزيل العديد من ملفات تفريغ قاعدة البيانات وملفات fasta من dbSNP ، وتنتهي بإنشاء snpNNN والعديد من جداول البيانات المساعدة. هذا النوع غير مدعوم كنوع مسار مخصص.

إذا تم استخدام سلاسل / شبكات الشمبانزي لتحديد أليل التجميع المرجعي للشمبانزي في الموقع المتماثل مع SNP البشري ، فإن هذا يحدد تجميع جينوم الشمبانزي الذي تم استخدامه ، على سبيل المثال panTro2.

إذا تم استخدام سلاسل / شبكات من قرود الشمبانزي وقرود المكاك لتحديد أليل التجميع المرجعي للشمبانزي أو المكاك في الموقع المتماثل مع SNP البشري ، فإن هذا يحدد جدول قاعدة البيانات الذي يحتوي على الأليلات المعينة.

إذا تم استخدام سلاسل / شبكات من الشمبانزي وإنسان الغاب وقرود المكاك لتحديد أليل تجميع مرجع الشمبانزي / إنسان الغاب / المكاك في الموقع المتماثل مع SNP البشري ، فهذا يحدد جدول قاعدة البيانات الذي يحتوي على الأليلات المعينة.

من المحتمل أن تتم إزالة الموقوفة. يحدد هذا تسمية نصية لعرض تنبؤات & lttable & gt لتأثير SNP على جين ترميز البروتين.

من المحتمل أن تتم إزالة الموقوفة. يحدد هذا جدولًا واحدًا أو أكثر يحتوي على تنبؤات بتأثيرات SNP على جينات ترميز البروتين.

يمكن أن تعرض صفحة تفاصيل SNP التأثير الوظيفي المتوقع على الجين من أي مسار جيني. نظرًا لوجود العديد من المسارات والنماذج الجينية في كثير من الأحيان ، فإن التنبؤ سيعتمد على نموذج الجين المستخدم. لدى المستخدم فرصة للاختيار من بين تلك المتاحة ، ولكن هذا الإعداد ينشئ مسارًا جينيًا افتراضيًا أو مسارات تستند إليها التنبؤات.

يعين dbSNP وزنًا قدره 1 أو 2 أو 3 لكل متغير ، اعتمادًا على عدد التعيينات المميزة التي يجب أن تحتويها التسلسلات المرافقة للمتغير على الجينوم. إذا تم تعيين هذا على 1 ، فسيتم عرض المتغيرات المعينة بشكل فريد فقط بشكل افتراضي. في حالة 2 ، لن يتم عرض سوى المتغيرات والمتغيرات المعينة بشكل فريد مع عدد صغير من التعيينات المكررة. إذا كان الرقم 3 ، فسيتم عرض جميع المتغيرات بغض النظر عن الوزن. ملاحظة: بعض الجداول مثل snpNNNمشترك و snpNNNتحتوي العلامات التي تم وضع علامة عليها على متغيرات معينة تم تعيينها بشكل فريد فقط ، وبالتالي فإن هذا الإعداد ليس له أي تأثير على تلك الجداول.

تبحث صفحة تفاصيل SNP عن معرف SNP في جداول تتبع HapMap التي لها أسماء ومحتويات مختلفة اعتمادًا على ما إذا تم تحميلها من بيانات HapMap المرحلة الثانية أو بيانات المرحلة الثالثة من HapMap. (يتم استخدام هذا الإعداد أيضًا بواسطة مسارات HapMap SNPs.)

إذا تم استخدام سلاسل / شبكات المكاك لتحديد أليل التجميع المرجعي لقرود المكاك في الموقع المتماثل مع SNP البشري ، فإن هذا يحدد أي مجموعة جينوم مكاك تم استخدامها ، على سبيل المثال rheMac2.

إذا تم استخدام سلاسل / شبكات إنسان الغاب لتحديد أليل التجمع المرجعي لإنسان الغاب في الموقع المتماثل مع SNP البشري ، فإن هذا يحدد أي مجموعة جينوم لإنسان الغاب تم استخدامها ، على سبيل المثال ponAbe2.

يحدد هذا الجدول الإضافي الذي يحتوي على تعليقات توضيحية لخصائص غير معتادة للمتغيرات. ينطبق هذا الإعداد فقط على الإصدارات السابقة لـ dbSNP build 132 بدءًا من الإصدار 132 ، ويتم دمج الاستثناءات في snp الرئيسيNNN لم تعد هناك حاجة إلى طاولة وطاولة إضافية.

يحدد هذا الجدول الإضافي الذي يعيّن الكلمات الأساسية الاستثنائية لأوصاف جملة واحدة.

يحدد هذا الجدول الإضافي الذي يقوم بتعيين معرفات المتغيرات لملف الإزاحات التي يتم تخزين التسلسلات المحيطة بها.

يحدد هذا الملف الإضافي الذي يحتوي على التسلسلات المرافقة لممثل كل متغير مقدم من SNP.

يعرض هذا المسار متغيرات من dbSNP build 135 بتردد Minor Allele (MAF) لا يقل عن 1٪. تأتي إزاحات ملف التسلسل المرافقة من جدول snp135Seq ، وأوصاف الخصائص غير العادية مأخوذة من جدول snp135ExceptionDesc ، وتظهر تأثيرات المتغيرات على جينات ترميز البروتين فيما يتعلق بالجدول المعروف جين (مسار جينات UCSC) افتراضيًا. إذا كانت المنطقة المعروضة أكثر من 10000000 زوج أساسي ، فلن يتم تحميل البيانات ورسمها.

VcfTabix: تنسيق المكالمة المتغير المفهرس بواسطة tabix

Variant Call Format (VCF) هو تنسيق نص مرن وقابل للتمديد موجه نحو الخطوط تم تطويره بواسطة 1000 Genomes Project لإصدارات من متغيرات النوكليوتيدات المفردة ، indels ، متغيرات رقم النسخ والمتغيرات الهيكلية التي اكتشفها المشروع. تم اعتماد التنسيق لاحقًا من قبل مشاريع كبيرة أخرى. عندما يتم ضغط ملف VCF وفهرسته باستخدام tabix ثم جعله متاحًا للوصول إلى الويب ، فإن المستعرض سيحضر فقط أجزاء الملف الضرورية لعرض العناصر في المنطقة المعروضة. بمعنى آخر ، هذا تنسيق ملف بيانات بعيد ، مثل تنسيقات BAM و bigBed و bigWig. يرجى الرجوع إلى صفحة تنسيق مسار VCF و tabix للحصول على وصف كامل لكيفية تحضير وعرض بيانات VCF.

إذا تم تضمين إعداد bigDataUrl ، فسيتم عرض البيانات الموجودة في الموقع المحدد بواسطة عنوان URL هذا. خلاف ذلك ، يمكن لجدول قاعدة البيانات الذي يحتوي على عمود واحد اسم الملف تحديد موقع ملف محلي أو عنوان URL. إذا كان جدول قاعدة البيانات يشتمل على عمود seqName ، فيمكن تحديد ملف VCF مختلف أو عنوان URL لكل تسلسل تجميع.

يمكن العثور على المثال أدناه.

إذا تضمن ملف VCF أعمدة النمط الجيني لشخصين على الأقل ، فسيتم تمكين عرض فرز النمط الفرداني افتراضيًا. يمكن استخدام هذا الخيار لتعطيله إذا رغبت في ذلك ، على سبيل المثال إذا لم يتم تقسيم الطرز الجينية على مراحل وكان جزء كبير من الأنماط الجينية متغاير الزيجوت. يمكن العثور على مزيد من المعلومات حول عرض فرز النمط الفرداني هنا.

  • مركز الوزن: بالنسبة للكائنات ثنائية الصيغة الصبغية ، يفصل هذا النوعين الفرديين عن كل عينة ويجمع ديناميكيًا جميع الأنماط الفردانية عن طريق التشابه ، مرجحًا عن طريق القرب من المتغير المركزي. سيتم رسم شجرة المجموعات في منطقة التسمية اليسرى. يعمل هذا بشكل أفضل مع الأنماط الجينية المرحلية.
  • fileOrder: يتم عرض الأنماط الجينية بالترتيب الذي تظهر به في ملف VCF.
  • ملف الشجرة عنوان url : يتم عرض الأنماط الجينية بالترتيب الذي تظهر به عنوان url ، ملف شجرة بتنسيق Newick تكون معرفات العقدة الطرفية الخاصة به هي نفس معرفات عمود النمط الجيني في ملف VCF. سيتم رسم الشجرة في منطقة التسمية اليسرى.
  • altOnly: الأليل المرجعي أبيض (غير مرئي) ، والأليل البديل أسود. هذا يؤكد أنماط الفرد مع الأليلات البديلة. (إفتراضي)
  • الوظيفة: إذا تم توفير إعداد تتبع الجينات أيضًا ، فإن الأليل المرجعي يكون أبيض (غير مرئي) والأليل البديل يكون أحمر إذا كان المتغير يغير تسلسل البروتين للجين ، والأخضر إذا كان المتغير يقع داخل الجين ولكنه لا يغير تسلسل البروتين ، الأزرق إذا كان المتغير يقع ضمن UTR لجين مشفر للبروتين أو داخل جين غير مشفر ، ولون أسود إذا كان intronic أو intergenic.
  • المرجع البديل: الأليل المرجعي أزرق ، والأليل البديل أحمر.
  • القاعدة: A أحمر ، C أزرق ، G أخضر و T أرجواني.

هذا للاستخدام مع وظيفة hapClusterColorBy ، فهو يحدد مسار الجين لاستخدامه عند تحديد التأثير الوظيفي لكل متغير.

بافتراض أن hapClusterEnabled صحيح ، فإن هذا يتحكم في شكل مجموعات الأوراق على يمين الشجرة (أي الخطوط المرسومة للإشارة إلى مجموعات من أنماط الفرد المحلية المتطابقة): مثلث للشكل & lt (افتراضي) ، مستطيل لـ [الشكل.

قائمة الحقول من ملف bigBed التي يمكن استخدامها كتسمية. لا يمكن تحديد القيمة الخاصة لا شيء إذا لم تكن هناك حاجة إلى تسميات.

قائمة الحقول من الملف المستند إلى bigBed والتي يجب استخدامها كتسمية افتراضيًا. قابل للتطبيق فقط إذا تم تعيين labelFields. إذا لم يتم تحديد defaultLabelFields ، فسيتم استخدام الحقل الأول في labelFields باعتباره الحقل الافتراضي. لا يمكن تحديد القيمة الخاصة لا شيء إذا لم يكن هناك تسمية افتراضية.

حرف واحد أو أكثر لاستخدامه كفاصل بين التسميات المتعددة. شرطة مائلة (/) بشكل افتراضي ، يمكن أن تحتوي هذه السلسلة على علامات اقتباس مزدوجة حولها إذا كان يجب أن تحتوي على مسافات بيضاء فيها.

أقصى عرض (في القواعد) للنافذة حيث سيُظهر halSnake تعدد الأشكال بين المرجع والأنواع الأخرى.

بافتراض أن hapClusterEnabled صحيحة ، فإن هذا يحدد الارتفاع بالبكسل لعرض فرز النمط الفرداني.

إذا كان هذا صحيحًا ، فلن يتم عرض المتغيرات التي يحتوي عمودها QUAL على قيمة أقل من إعداد minQual.

بافتراض أن applyMinQual صحيحة ، فهذا هو الحد الأدنى لقيمة QUAL المطلوبة لعرض المتغير.

الحد الأدنى لتردد الأليل الثانوي المطلوب لعرض متغير. بشكل افتراضي ، هذا هو 0.0 (أي عرض جميع المتغيرات).

قم بتشغيل / إيقاف تشغيل خيارات التصفية المتاحة افتراضيًا لمسارات VCF

لتشغيل / إيقاف تشغيل خيارات مرشح الجودة المتاحة افتراضيًا لمسارات VCF

لتشغيل / إيقاف تشغيل خيارات مرشح Minor Allele Frequency المتاحة افتراضيًا لمسارات VCF

يتم تخزين بيانات مسار VCF هذا في الملف البعيد "myVcf.gz". تم إقران هذا الملف بملف فهرس مُنشأ من tabix باسم "myVcf.gz.tbi" موجود في نفس الموقع البعيد.

VcfPhasedTrio: VCF + tabix مع بيانات وصفية إضافية

بعد تحضير ملف VCF كما هو مذكور في قسم VCF ، إذا كانت بياناتك تحتوي على معلومات عن الثلاثيات ، فقد ترغب في استخدام نوع المسار vcfPhasedTrio للحصول على عرض النمط الفرداني. لمزيد من المعلومات حول هذا العرض ، يرجى الاطلاع على وثائق VCF Trio للحصول على شرح كامل لنوع مسار vcfPhasedTrio.

معرف عمود VCF Genotype للعينة & quotchild & quot ، متبوعًا بشكل اختياري بحرف & quot | & quot واسم مستعار للعرض. ستصبح هذه العينة هي النمط الفرداني المركزي إذا تم تحديد الوالدين أيضًا.

قائمة مفصولة بفواصل (بدون مسافات) لمعرفات أعمدة VCF Genotype لـ & quotparents & quot ، متبوعة اختياريًا بحرف & quot | & quot واسم مستعار للعرض. هذا الإعداد اختياري ، ويدعم أحد الوالدين أو كليهما.

اجعل الشاشة تستخدم الأسماء المستعارة كتسميات افتراضية لكل حارة من النمط الفرداني بدلاً من المعرف من VCF.

يتم تخزين بيانات مسار VCF هذا في الملف البعيد "myVcf.gz". يتم إقران هذا الملف بملف فهرس مُنشأ من tabix باسم "myVcf.gz.tbi" موجود في نفس الموقع البعيد. "NA123456" هو معرف أحد أعمدة النمط الجيني في VCF ، وسيتم عرض أنماط الفرد الأصلية بالنسبة إلى تشابهها مع هذه العينة.

PgSnp: تنسيق الجينوم الشخصي SNP

ليس للمراكز. (لا تنطبق أي من الإعدادات الموجودة في هذا القسم على لوحات الوصل.)

يستخدم هذا التنسيق لعرض SNPs من الجينوم الشخصي. يتم استخدامه لمسارات متغيرات الجينوم والمتغيرات السكانية. يرجى الرجوع إلى الأسئلة الشائعة للحصول على معلومات حول كيفية إعداد مجموعات بيانات الجينوم الشخصي SNP.

مسارات نوع الجينوم الشخصي SNP هي بشكل أساسي في تنسيق "سرير 4 + 3". يتم تعبئة العمود الرابع ، الاسم ، بمتغير واحد أو أكثر (بما في ذلك عمليات الإدراج والحذف) محدد بحرف "/". يحتوي العمود الخامس على عدد المتغيرات الموجودة في عمود الاسم ، بينما يحتوي العمودان السادس والسابع على مصفوفات محددة بفواصل للترددات والدرجات على التوالي. يمكن تحميل الملفات بهذا التنسيق في MariaDB باستخدام hgLoadBed باستخدام مخطط "pgSnp.sql".

تعرض صورة المستعرض المتغيرات كمربعات مكدسة تعرض التكرار لكل متغير ، إذا كانت هذه المعلومات موجودة في الجدول. تحسب صفحة التفاصيل لكل عنصر متغير أي تغيير في الأحماض الأمينية إذا كان المتغير في منطقة تشفير.

غير مدعوم للمسارات المخصصة

الجدول الإضافي مع احتمالية تلف متغير للبروتينات من البولي فين.

غير مدعوم للمسارات المخصصة

الجدول الإضافي مع احتمال تلف متغير للبروتينات من SIFT.

مسار الجينوم الشخصي SNPs يعرض تعدد أشكال النوكليوتيدات المفردة من الجينوم المرجعي.

AltGraphX: مسارات نموذج جيني الربط البديل

يمكن عرض نماذج الجينات ذات الربط البديل في المتصفح بهذا النوع من المسارات. لا يدعم أي إعدادات تراك ديب بخلاف الإعدادات الشائعة.

نماذج الجينات البديلة للتقطيع هي عبارة عن مسار متخصص يستخدم لإظهار تغطية الجينوم.

يوفر مسار الربط البديل للمعهد السويسري لعلم الأحياء رابطًا خارجيًا عبر إعداد عنوان url. لكن المصطلح "tromer" الفعلي في القيمة سيتم ملؤه بنتائج استعلام لجدول sibTxGraph. مع وجود عدد كافٍ من الإعدادات الغامضة ، ينجز المتصفح أشياء دقيقة.

BedDetail: نص مسار سرير ممتد

هذا امتداد لتنسيق BED. تستخدم تفاصيل BED أول 4 إلى 12 عمودًا من تنسيق BED ، بالإضافة إلى حقلين إضافيين يتم استخدامهما لتحسين صفحات تفاصيل المسار. الحقل الإضافي الأول هو المعرف ، والذي يمكن استخدامه بدلاً من حقل الاسم لإنشاء روابط من صفحات التفاصيل. الحقل الإضافي الثاني هو وصف العنصر ، والذي يمكن أن يكون وصفًا طويلاً ويمكن أن يتكون من html ، بما في ذلك الجداول والقوائم.

تنسيق نوع السرير الممتد الذي يحتوي على وصف نصي مضمن في الجدول لكل عنصر. يمكن أن يختلف التنسيق بين 4 و 12 عمود سرير قياسي بالإضافة إلى عمودين إضافيين. يجب أن يتبع عدد الأعمدة (بما في ذلك الأعمدة الخاصة بـ 2 bedDetail) مصطلح "bedDetail" في إعداد النوع.

يمكن العثور على المثال أدناه.

يحتوي هذا bedDetail على تفاصيل لكل عنصر منسق لعرض HTML. بالإضافة إلى ذلك ، يحتوي كل عنصر على "معرف" متميز عن "الاسم" ويتم استخدام هذا المعرف في عنوان url للرابط الخارجي المعروض في صفحة تفاصيل العنصر.

ClonePos: مسارات تغطية الجينوم

هذا مسار تنسيق متخصص يستخدم فقط لإظهار التغطية في الجينوم البشري. لا يدعم أي إعدادات تراك ديب بخلاف الإعدادات الشائعة.

مسار متخصص يستخدم لإظهار تغطية الجينوم.

يختلف مسار التغطية للجينوم البشري في اللون بين الأسود والرمادي الفاتح ، بناءً على عمق تغطية التسلسل المستنسخ.

CtgPos: الخريطة المادية contigs المسارات

هذا مسار تنسيق متخصص يستخدم لـ "contigs الخريطة المادية" على الجينوم البشري. لا يدعم أي إعدادات تراك ديب بخلاف الإعدادات الشائعة.

مسار متخصص يستخدم لإظهار مواقع contigs على الخريطة المادية.

عادةً ما يُنشئ مسار خريطة GCR Contigs عنوان URL لـ NCBI ، ولكن في هذه الحالة ، تم حظر عنوان URL بشكل صريح.

DownloadsOnly: مسار متخصص يحتوي فقط على الملفات القابلة للتنزيل

تحتوي جميع مسارات ENCODE على دليل خاص ودعم CGI لتنزيل الملفات. يمكن أن يكون هذا مفيدًا جدًا لتنظيم الوصول إلى عدد كبير جدًا من الملفات القابلة للتنزيل المرتبطة بمسار ENCODE. هناك عدد قليل من مجموعات البيانات التي لا تصلح بسهولة للتخيل في متصفحنا ولكنها مع ذلك مكون ضروري لبيانات الترميز ككل. لذلك ، تم تطوير downloadOly type لتوفير وصول سهل إلى هذه المجموعات من الملفات القابلة للتنزيل.

مسار متخصص يوفر الوصول إلى مجموعة من الملفات القابلة للتنزيل ، وهو حاليًا ENCODE فقط. لا يتم تصور مسار النوع فقط في المستعرض.

يمكن العثور على المثال أدناه.

إعداد fileSortOrder مطلوب للتنزيلات اكتب المسارات فقط. يمكن العثور على وصف كامل في قسم المسارات المركبة من هذا المستند. يتطلب الأمر تعريف كل ملف ككائن في metaDb وكل من هذه الكائنات للإشارة إلى "مركب" والذي سيكون اسم هذا المسار واسم الدليل حيث توجد الملفات. يحدد "fileSortOrder" العمود وترتيب الفرز الافتراضي. سيتمكن المستخدم من فرز قائمة الملفات وتصفيتها.

لن يوفر المستعرض تصورًا لهذا المسار ولكنه سيوفر الوصول إلى تنزيل أي عدد من الملفات المنظمة في مجموعة واحدة. تعرض صفحة التنزيلات هذه الملفات في جدول مع عدد من الأعمدة القابلة للفرز وربما التصفية. يعتمد الكثير من العرض التقديمي والتنظيم على الإعدادات المحددة في metaDb لهذا المسار. ومع ذلك ، فقد طلب إعداد fileSortOrder ستة أعمدة محددة لتقديمها بالترتيب المطلوب.

EncodeFiveC: مسار تفاعل كروماتين خمسة سي

هذا مسار تنسيق متخصص تم استخدامه لعرض أدلة تفاعل الكروماتين / الكروماتين لمسافات طويلة. أساسًا مسار من نوع "السرير" يعرض مواقع في الجينوم. تقدم صفحة التفاصيل الخاصة بكل موقع قائمة بالمواقع الأخرى داخل الجينوم التي قد يكون لها تفاعلات وظيفية.

مسار متخصص تم استخدامه لإظهار المواقع التي قد يتفاعل فيها الكروماتين مع مواقع الكروماتين الأخرى.

يجب أن يكون لكل موقع موجود في الجدول الرئيسي للمسار مناطق مرتبطة محددة في جدول التفاعلات المسمى بهذا الإعداد. شكل جدول التفاعلات هو في الأساس "سرير 7 + 1".

يتم تقديم جدول التفاعلات في صفحة تفاصيل كل عنصر بعنوان "أهم ___ التفاعلات"

سيتم عرض مسار تفاعلات الخمسة C كعناصر ملونة. يتم رسم مناطق الكروماتين المرتبطة من جدول ثانٍ. نوع الاقترانات هو مواقع بدء النسخ.

عامل مصدر: مسارات العناصر مجتمعة

مصدر العامل ليس مسارًا جماعيًا ، ولكنه مسار مكون من مجموعة من المصادر ، والتي قد تكون في حد ذاتها مسارات مستعرض. هذا نوع متخصص من المسار المستند إلى "العنصر" بتنسيق "bed 15" ، وهو نفس التنسيق المستخدم لنوع expRatio. والغرض منه هو عرض عوامل النسخ كما تم اكتشافها في خطوط خلايا متعددة ، على الرغم من أنها قد تكون قابلة للتكيف مع أي نوع من العناصر التي تتراكم في مواقع متداخلة وستنتمي إلى واحدة من عدة فئات. ومع ذلك ، تم تصميم هذا النوع خصيصًا للجمع بين دليل ربط عامل النسخ (TF) من خطوط خلايا متعددة في مسار واحد. كمسار لنوع السرير ، فإنه يتكون من عناصر أو مناطق يوجد بها دليل على ارتباط TF. على يسار كل عنصر ، يتم عرض اسم العامل ، بينما يتم عرض قائمة مشفرة لأنواع الخلايا التي تم العثور على الدليل فيها على اليمين. بخلاف معظم المسارات المستندة إلى العناصر ، يلزم وجود جدول ثانٍ لوصف خطوط الخلايا. استخدم برنامج hgBedsToBedExp لإنشاء الجداول من مجموعة من الأسرة الأبسط ، واحدة لكل عامل نسخ / تفاعل خلية.

شكل طاولة على أساس 15 سرير مع عناصر متداخلة. هذا نوع مسار متخصص مصمم للاحتفاظ بدليل ربط عامل النسخ عبر خطوط خلوية متعددة. التنسيق هو نفسه المستخدم لتعبير ميكروأري.

يمكن العثور على المثال أدناه.

تحتاج مسارات نوع FactSource إلى جدول ثانوي يحتوي على أوصاف المصادر. هذا هو المكان الذي يتم فيه الإعلان عن اختصارات خط الخلية وربطها بخطوط الخلية الفعلية.

عند عرض تفاصيل عنصر تتبع مصدر عامل (عادةً موقع ربط TF) ، يمكن عرض معلومات إضافية حول دليل خط الخلية. يقوم هذا الإعداد بتسمية الجدول الذي سيحتوي على المعلومات الإضافية. يتم استخدامه مع إعداد inputTableFieldDisplay.

إذا كان هناك inputTrackTable معرّفًا مع المسار الخاص بك ، فيجب الإعلان عن الحقول التي سيتم عرضها مع هذا الإعداد المرتبط.

يوفر هذا الإعداد تصفية المستخدم لعناصر مصدر العوامل حسب اسم العامل. أبسط استخدام هو تضمين قائمة مفصولة بفواصل لجميع أسماء العوامل في المسار كوسيطة للإعداد. يمكن العثور على وصف كامل لهذا الإعداد في إعدادات المسار المستندة إلى سرير / سرير كبير.

طاولة سرير 6 تحتوي على مناطق حافزة لإبرازها ضمن عناصر عامل المصدر.

إذا كانت أسماء النماذج تختلف عن أسماء عناصر مصدر العامل أو لم تكن فريدة من نوعها في جدول الحافز ، فيمكن استخدام هذا الجدول لإعادة تعيين الأسماء. يحتوي هذا الجدول على تنسيق بسيط من عمودين: عامل char (255) ، حرف (255) عزر.

عند عرض تفاصيل عنصر مسار مصدر عامل يحتوي على فكرة ملزمة في جدول الحافز ، يمكن عرض تسلسل نموذج التوافق وصورة شعار التسلسل. يقوم هذا الإعداد بتسمية الجدول الذي يحتوي على مصفوفات وزن المركز التي توفر هذه المعلومات.

يمكن تقييد عرض الأشكال المميزة في مسار عاملي باستخدام هذا الإعداد. في مناطق الجينوم الكبيرة ، لا يتم تمييز الزخارف بشكل جيد في العرض ، ويتم تحسين الأداء من خلال قمع الميزة.

إذا كان مسار مصدر العوامل يحتوي على جدول متحرك ، فإن هذا الإعداد يتحكم في ما إذا كانت الأشكال سيتم رسمها بشكل افتراضي. كما أنه قابل للتكوين بواسطة المستخدم.

سيُظهر هذا المسار دليل ارتباط عامل النسخ (TF) الموجود في خطوط خلوية متعددة. يمثل كل عنصر TF معينًا ، جنبًا إلى جنب مع خطوط الخلايا التي تظهر دليلاً على الارتباط في هذا الموقع. يحتوي جدول المصدر الثانوي على تعريفات كل اختصار لخط خلية. تم الإعلان عن جدول ثالث مع inputTrackTable ويحمل تفاصيل كل سطر خلية يجب رؤيته في المستعرض. عند عرضها في تفاصيل العنصر ، ستظهر 3 حقول (نوع الخلية والمعالجة والمختبر) لكل خلية مرتبطة بموقع ربط TF المحدد.

Rmsk: كرر اخفاء المسارات

هذا مسار تنسيق متخصص يُستخدم فقط لمسار الإخفاء المتكرر. للتأكد من اكتمالها يتم وصفها بإيجاز هنا. يتم إنشاء هذه المسارات باستخدام برنامج RepeatMasker الخاص بـ Arian Smit ، والذي يقوم بفحص تسلسلات الحمض النووي بحثًا عن التكرارات المتناثرة وتسلسلات الحمض النووي منخفضة التعقيد.

تحتوي مسارات المقنع المتكرر على بيانات منسقة بشكل فريد من أجل الوظيفة الخاصة للإخفاء المتكرر.

يمكن العثور على المثال أدناه.

سيحتوي مسار القناع المتكرر على عناصر متكررة فردية مظللة بمقياس لمدى دقة عنصر متكرر مع امتداد التكرار. يقتصر عرض هذا المسار على أقل من 10 مليون دقة أساسية.

ثعبان: مسارات محاذاة مرجعية ذاتية - تجريبية

هذا مسار تنسيق متخصص يعرض مسار الالتفاف للمحاذاة ثنائية الاتجاه والمتداخلة. يمكن أن يساعد هذا التنسيق في توضيح إعادة ترتيب نوع الانعكاس التي تتماشى مع حبلا الجمع ، ثم الخيط الناقص ، ومرة ​​أخرى إلى حبلا زائد. يمكن استخدامه أيضًا لتوضيح محاذاة متداخلة ، مثل حدوث تكرار مقارنة بالجينوم المرجعي.

مسار متخصص يستخدم لإظهار مسار محاذاة الثعبان التي تمثل إعادة ترتيب الكروموسومات والازدواجية والانعكاس. نظرًا لأن هذا النوع غالبًا ما يكون عبارة عن تعيين بين نوعين أو مجموعتين من نفس النوع ، يجب أن يعلن النوع أيضًا عن هذا النوع / التجميع باسم قاعدة البيانات.

كما هو الحال مع السلاسل و netAligns ، التي تعرض عادةً التعيينات بين مجموعتين ، فإن إعداد "otherDb" ضروري أيضًا للإعلان عن الجينوم الآخر والتجميع الذي تمثله البيانات الموجودة في هذا المسار.

سيوضح مسار الثعبان هذا عمليات إعادة ترتيب الكروموسوم التي حدثت على جينوم الماوس mm9 كما رأينا عندما يتم محاذاته مع الجينوم البشري.

BigInteract: التفاعلات الزوجية

يخزن تنسيق bigInteract التفاعلات بين أزواج المناطق في الجينوم. يتم إنشاء ملفات BigInteract باستخدام برنامج bedToBigBed مع ملف AutoSQL خاص يحدد الحقول. تكون الملفات الناتجة بتنسيق ثنائي مفهرس يدعم الوصول الفعال عن بُعد ، لذلك يمكن استضافة الملف على خادم الويب الذي يمكن الوصول إليه وعرضه في UCSC. للحصول على تعريفات تنسيق bigInteract الكاملة ، يرجى الاطلاع على صفحة تعليمات bigInteract.

يستخدم هذا الإعداد عندما يكون للتفاعل اتجاه (اتجاه التأثير). يُظهر إعداد الإزاحة المصدر (offsetSource) أو الهدف (offsetTarget) أسفل نوع الطرف الآخر الذي يتم إزاحته رأسياً في الصورة. يتم رسم التفاعل بخطوط متقطعة عندما تسبق المنطقة المستهدفة منطقة المصدر (الاتجاه العكسي) في الجينوم.

يجمع إعداد الكتلة جميع التفاعلات مع نفس المصدر (مصدر المجموعة) أو الهدف (الكتلة الهدف) ويعرض كل مجموعة على أنها عرض كتلة واحدة مرتبطة في المتصفح. يوفر هذا طريقة عرض بديلة لملف التفاعل.

هذا الإعداد يقلب شاشة الرؤية الكاملة المنحنية بحيث تكون قمة المنحنيات "لأعلى" (التلال بدلاً من الوديان).

يؤدي هذا الإعداد إلى ظهور ارتباط في صفحة التفاصيل التي تظهر عند النقر على تفاعل. سيؤدي هذا الارتباط إلى إنشاء & quotmulti-region & quot عرض مستعرض الجينوم لنقاط نهاية التفاعل (أو مجموعة التفاعل). استخدم المساحة المتروكة لتحديد حشوة غير افتراضية عند حواف كل منطقة. القيمة الافتراضية هي 200 زوج أساسي.

BigLolly: مخططات Lollipop

تُستخدم الرسوم البيانية المصاصة عادةً لعرض البيانات المحلية لقاعدة واحدة تحتوي على واحد إلى ثلاث قيم بيانات مخصصة لها والتي يمكن عرضها باستخدام ارتفاع المصاصة واللون وحجم الدائرة في الجزء العلوي من المصاصة. للحصول على أمثلة ، قم بزيارة صفحة مساعدة bigLolly.

Hic: مصفوفات جهات الاتصال Hi-C

نوع المسار hic هو لعرض بيانات تفاعل الكروماتين والكروماتين عبر خرائط الحرارة. يدعم نوع المسار هذا حاليًا تنسيق ملف واحد: تنسيق ملف .hic الذي تم إنشاؤه بواسطة Aiden Lab في Baylor College of Medicine. هذا تنسيق ثنائي مفهرس يدعم الوصول عن بُعد ، لذلك يمكن استضافة الملف على أي خادم يمكن الوصول إليه عبر الويب وعرضه في UCSC. لمزيد من المعلومات حول تنسيق الملف .hic وأداة Juicer التي تنشئ هذه الملفات ، راجع الوثائق على github.

يتحكم هذا الإعداد في وضع العرض الافتراضي لمسار hic. في وضع القوس ، يتم رسم التفاعل بين منطقتين كقوس بين مركزي هاتين المنطقتين. في الوضع التربيعي ، يتم تمثيل التفاعلات بواسطة مربع في خريطة الحرارة. يمكن تحديد المناطق المتفاعلة لأي مربع بإسقاط جوانب المربع على المحور القطري لخريطة الحرارة ورؤية مكان سقوط هذه النقاط في نافذة الكروموسوم التي يتم عرضها. في وضع المثلث ، يتم رسم التفاعلات على هيئة ماس. يمكن تحديد مناطق التفاعل لأي ماسة بإسقاط جوانب الماس على المحور الأفقي لخريطة الحرارة ومعرفة مكان سقوط هذه النقاط في نافذة الكروموسوم.

يتحكم هذا الإعداد في الطريقة الافتراضية لتطبيع الدرجات الأولية من ملف .hic. يتم حساب الدرجات لجميع هذه الطرق أثناء إنشاء ملف .hic. لمزيد من المعلومات حول هذه الطرق ، راجع وثائق العصارة المرتبطة أعلاه.

يتحكم هذا الإعداد في الحجم الافتراضي للحاويات التي يتم تجميع نتائج جهات اتصال Hi-C فيها. تعتمد قائمة الدقة المتوفرة على الملف ، لكن القيم الشائعة تتضمن أرقامًا مثل 5000 و 10000. بالإضافة إلى قيمة عدد صحيح ، يمكن أيضًا توفير السلسلة "تلقائي" (تلقائي أيضًا هو الإعداد الافتراضي إذا لم يتم تحديد هذا الإعداد). في الوضع التلقائي ، سيختار المتصفح ديناميكيًا الدقة التي يبدو أنها توفر قدرًا جيدًا من التفاصيل اعتمادًا على حجم نافذة الكروموسوم التي يتم عرضها حاليًا.

يعد إعداد saturationScore جزءًا من كيفية عرض ظلال الألوان لخريطة الحرارة. ترتبط الألوان في خريطة الحرارة بدرجة كل تفاعل - تتوافق درجة تفاعل أعلى مع كثافة ألوان أعلى. ومع ذلك ، في مرحلة ما ، يتم الوصول إلى الحد الأقصى من تشبع اللون ولا تؤدي درجات التفاعل الأعلى إلى تغيير اللون أكثر من ذلك. يحدد هذا الإعداد الدرجة الافتراضية للنقطة التي يتم عندها الوصول إلى الحد الأقصى لتشبع اللون.

BigBarChart: مخططات شريطية للمتغيرات المعروضة في مناطق الجينوم

يخزن تنسيق bigBarChart قيم مجموعة من المتغيرات لكل منطقة جينومية في الملف. يتم إنشاء ملفات BigBarChart باستخدام برنامج bedToBigBed مع ملف AutoSQL خاص يحدد الحقول. تكون الملفات الناتجة بتنسيق ثنائي مفهرس يدعم الوصول الفعال عن بُعد ، لذلك يمكن استضافة الملف على خادم الويب الذي يمكن الوصول إليه وعرضه في UCSC. للحصول على تعريفات تنسيق bigBarChart الكاملة ، يرجى مراجعة صفحة تعليمات bigBarChart.

يتم إرفاق تسمية الوحدة بالقيم الموجودة في العرض والرسوم البيانية والمخططات الخاصة بالمسار.

يوفر هذا الإعداد تسمية لقائمة اختيار الفئة.

تحدد شاشة عرض المسار BarChart أحد الأحجام الثلاثة (صغير أو متوسط ​​أو كبير) لعرض الرسوم البيانية الشريطية ، بناءً على حجم المنطقة الجينومية في النافذة الحالية. بالنسبة للبيانات الكثيفة ، من المفيد تقليل أحجام المخطط الشريطي ، حتى عندما تكون في مناطق جينومية صغيرة نسبيًا. يحدد هذا الإعداد حجم أكبر مخطط شريطي للقيمة المحددة. عند عدم الضبط ، تكون القيمة الافتراضية هي & quotlarge & quot.

يوفر هذا الإعداد طريقة لاختيار عتبات الأساس التي تحدد أحجام المخطط الشريطي (المخططات الصغيرة أو المتوسطة أو الكبيرة). حجم نافذة basepair الافتراضي هو 50000 و 500000 قاعدة ، وهي مخصصة لمخطط واحد لكل جين في جينومات الفقاريات. يمكن استخدام هذا الإعداد لتخصيص أحجام الرسم البياني بمرونة استنادًا إلى حجم النافذة الأساسية التي يتم تصورها عند كتابة تعليق توضيحي بشكل مكثف للتسلسل.

كبير حجم النافذة & لتر كبير
واسطة حجم النافذة & gt = largeMax and & lt small
صغيرحجم النافذة و GT = صغير

في هذا المثال ، تُستخدم المخططات الشريطية عند عرض المخططات الشريطية على 30.000 أساسًا من الجينوم الفيروسي الأساسي ، وتظهر المخططات الكبيرة في نوافذ تصل إلى 499 قاعدة ، ومتوسطة في النوافذ من 500 إلى 7999 في الحجم ، وصغيرة عندما يتم عرض 8000 قاعدة أو أكثر في نافذة المتصفح.

يوفر هذا الإعداد تسمية لمعلومات صفحة التفاصيل حول قيم المخطط الشريطي المعروضة. هذه عادةً قيم موجزة ، مشتقة من العديد من العينات (غالبًا القيمة المتوسطة).

هذا الإعداد عبارة عن قائمة تسميات للمتغيرات الفئوية (الأشرطة). مطلوب لهذا النوع من المسارات.

هذا الإعداد عبارة عن قائمة ألوان ، واحدة لكل فئة (شريط). يتم تحديد الألوان كقيم RGB (255،255،255 أو #FFFFFF) أو بالاسم (أسماء ألوان HTML الستة عشر المحددة في HTML 4.01). ألوان HTML المسماة:

يحدد ملف مصفوفة البيانات الذي يوفر قيم البيانات لجميع العينات. تُستخدم مع barChartSampleUrl لإنشاء مخطط مربع في صفحة التفاصيل.

يحدد ملفًا مفصولاً بعلامات جدولة يوفر فئات للعينات في ملف barChartMatrixUrl. يُستخدم لإنشاء مخطط مربع في صفحة التفاصيل.

يحدد ملفًا مفصولاً بعلامات جدولة يوفر تسميات وألوانًا اختيارية للفئات (الأشرطة). يمكن أن يحل هذا الإعداد محل إعدادات barChartBars و barChartColors ، وهو مفيد بشكل خاص للمسارات التي تحتوي على عدد كبير من الفئات.

مجموعات المسار الرئيسية المحددة مسبقًا

تنتمي جميع المسارات إلى مجموعة من عدة مجموعات. تنتمي المسارات المحورية إلى المجموعة التي تشمل محورها. تنتمي المسارات الأخرى إلى إحدى المجموعات المحددة مسبقًا. بالنسبة إلى hg19 ، يتم تحديد المجموعات التالية:

  • الخريطة - "التعيين والتسلسل"
  • phenDis - "جمعيات النمط الظاهري والأمراض"
  • الجينات - "الجينات وتوقع الجينات"
  • rna - "mRNA و EST"
  • التعبير - "التعبير"
  • التنظيم - "التنظيم"
  • compGeno - "علم الجينوم المقارن"
  • نياندرتال - "Neandertal Assembly and Analysis"
  • varRep - "التباين والتكرار"

إذا لم يتم تعيين مجموعة لمسار مدمج ، فسينتهي المسار في قسم المسارات التجريبية في الجزء السفلي.

إعدادات Supertrack

تسمى الحاوية الهرمية الأولى المسار الفائق ، والتي يمكن اعتبارها مجلدًا يحتوي على مسارات أخرى مغلقة افتراضيًا ، ما لم تتم إضافة عرض الإعداد. يدعم المستعرض حاليًا مستوى واحدًا فقط من مجلدات المسار الفائق. بشكل عام ، تكون المسارات الفرعية للمسار الفائق من أنواع مختلفة. إذا كان جميع الأطفال من نفس النوع ، فمن الأفضل غالبًا استخدام تجميع المسار المركب الموضح أدناه. إذا كان كل الأطفال عبارة عن مسارات شعر مستعار أو شعر مستعار ، فقد يكون من المفيد استخدام تجميع "حاوية متعدد الوصلات" تراكب إشارة. تعرض مسارات تراكب الإشارة بيانات الإشارة من عدة مسارات فرعية على هيئة أغشية شفافة ملونة ، مما يجعل من الممكن رؤية بيانات العديد من المسارات معًا في عرض مكثف.راجع قسم multiWig لمزيد من المعلومات.

يمكن أن تحتوي المسارات الفائقة على مسارات مركبة وحاويات متعددة الشكل ، ولكن ليس العكس. من خلال المسارات الفائقة والمسارات المركبة والشخصيات المتعددة للحاويات ، سيرث الأطفال الإعدادات من آبائهم ، ولكن يمكنهم تجاوز الإعدادات الأصلية داخل مقاطعهم الصوتية.

للإعلان عن مسار فائق ، ما عليك سوى إضافة هذا الإعداد إلى تعريف المسار الذي سيحتوي على بعض الإعدادات القياسية. لتعيين مسار فائق لعرضه كإعداد افتراضي ، أضف الكلمة show ، superTrack on show ، إلى نهاية العبارة. لكي لا يتم عرض المسار الفائق افتراضيًا ، استخدم تشغيل superTrack فقط. قد يكون من المفيد التفكير في مقطع الإعلان الأصلي للمسار الفائق كمفتاح إضاءة مغلق افتراضيًا ، ويمكن قلبه عن طريق إضافة عرض.

يجب أن تحدد جميع المسارات التي تدعي العضوية في المسار العالي رؤيتها الخاصة في مقاطع صوتية أقل من خلال الإعلان عن إعدادات مثل superTrack1 الأصلية وأيضًا من خلال وجود خط رؤية كثيف منفصل. إذا لم يتم تحديد إعداد رؤية لمسار ، يتم تعيين الإعداد الافتراضي للإخفاء. يمكن أن يتسبب هذا في حدوث ارتباك إذا حاول أحدهم عن طريق الخطأ تعيين الرؤى فقط في الجزء العلوي من مقطع العرض العلوي ، غير مسموح به ، وتركها خارجًا لكل طفل.

لا تخلط بين السطر الأصل وكيفية استخدامه في المركبات. على سبيل المثال ، في المسارات الفائقة ، لا تتبع مثال الوالدين superTrack1 [إيقاف / تشغيل] ، حيث يعمل [off / on] فقط مع المسارات المركبة. عند محاولة تصحيح أخطاء إعدادات الرؤية ، قد يكون من المفيد قراءة الملاحظة حول الوراثة الموجودة أدناه.

يتم الإعلان عن العضوية في مسار فائق أو مركب أو مجمع بواسطة الطفل ، وليس المسار الفائق نفسه بسطر مثل superTrack1 الرئيسي.

لا تخلط بين السطر الأصل وكيفية استخدامه في المركبات. على سبيل المثال ، في المسارات الفائقة ، لا تتبع مثال المسار المركب الأصلي 1 [إيقاف / تشغيل] ، والذي سيعمل فقط مع المسارات المركبة.

قد ينتمي أي عدد من الأطفال إلى مسار فائق واحد ، ولكن عشرة هو رقم مقترح لاعتبارات قابلية الاستخدام. من الناحية الأسلوبية ، عادةً ما يتم وضع مسافة بادئة لمقاطع الأطفال في trackDB مباشرة أسفل مقطع الوالد. ومع ذلك ، فإن هذا أقل شيوعًا مع المسارات الفائقة ، نظرًا لأن الأطفال غالبًا ما يكونون مبعثرون في أماكن أخرى داخل ملف trackDb ، أو أن أطفال المسار الفائق هم أنفسهم مركبات تحتوي على مسافة بادئة إضافية مما يجعل تطبيق المسافة البادئة للمسار الفائق غير عملي.

يجب أن تحدد جميع المسارات التي تدعي العضوية في المسار العالي رؤيتها الخاصة في مقاطع أقل من خلال إعلان إعدادات منفصلة مثل الرؤية كثيفة. عند محاولة تصحيح أخطاء إعدادات الرؤية ، قد يكون من المفيد قراءة الملاحظة حول الوراثة الموجودة أدناه.

تم الإعلان عن المسار المسمى & quotMy Folder & quot باعتباره مسارًا فائقًا ويحتوي على طفلين يدعيان العضوية في الخطوط الأم. لاحظ أن المسار الأول ، المسار myFirstTrack ، يكون مرئيًا بشكل افتراضي مع كثافة الرؤية (لأن المسار الفائق نفسه ، myFolder ، يحتوي على إعداد شبيه بمفتاح الإضاءة لعرض جميع محتويات المسار الفائق). المسار الثاني ، تتبع mySecondTrack ، غير معروض ، مع إخفاء الرؤية وسيتطلب النقر فوق مربع في صفحة إعداد المسار لعرضه.

ملاحظة: لا تخلط بين السطر الأصل وكيفية استخدامه في المركبات. على سبيل المثال ، في المسارات الفائقة ، لا تتبع مثال الوالدين superTrack1 [إيقاف / تشغيل] ، والتي ستعمل فقط مع المسارات المركبة. راجع دليل البدء السريع لتنظيم Track Hubs في مجموعات للحصول على مزيد من الأمثلة.

المسارات المركبة

تعد المسارات المركبة مستوى آخر من التسلسل الهرمي وتهدف إلى تجميع مسارات متشابهة جدًا (تسمى "المسارات الفرعية") معًا بحيث يمكنهم جميعًا مشاركة إعدادات التكوين نفسها. في أبسط أشكاله ، يحمل المركب مسارات من نفس النوع (مثل bigBed). في البداية ، يتم تكوين كل المسارات داخل المجموعة بشكل مماثل. عادةً ما تكون بعض المسارات الفرعية فقط مرئية بشكل افتراضي ، وسيكون لها نفس وضع العرض (على سبيل المثال ، كثيف) والإعدادات الاختيارية (على سبيل المثال ، حدود العرض). بينما تغطي الإعدادات الافتراضية المجموعة الكاملة من المسارات ذات الصلة ، يمكن في معظم الحالات تكوين المسارات الفرعية الفردية بواسطة المستخدم بشكل مستقل عن الإعدادات المركبة. ومع ذلك ، بمجرد إجراء إعدادات المسار الفرعي الفردية ، يمكن تجاوزها بخيارات جديدة يتم إجراؤها على المستوى المركب. قد يكون من المفيد قراءة "ملاحظة حول الميراث" الموجودة أدناه.

حاليًا يمكن فقط تنظيم أنواع المسارات التالية في مركب: المسارات القائمة على العناصر (bed ، bigBeg ، broadPeaks ، إلخ) ، المسارات المستندة إلى الإشارات (شعر مستعار ، bigWig ، إلخ) ، مسارات أخرى قائمة على الملفات عن بُعد (bams ، vcf ، وما إلى ذلك) ، والسلاسل / الشبكات ، والمسارات من نوع genePred ، و psl ، و wigMaf.

المسارات المركبة

تعد المسارات المركبة مستوى آخر من التسلسل الهرمي وتهدف إلى تجميع مسارات متشابهة جدًا (تسمى "المسارات الفرعية") معًا بحيث يمكنهم جميعًا مشاركة إعدادات التكوين نفسها. في أبسط أشكاله ، يحمل المركب مسارات من نفس النوع (مثل bigBed). في البداية ، يتم تكوين كل المسارات داخل المجموعة بشكل مماثل. عادةً ما تكون بعض المسارات الفرعية فقط مرئية بشكل افتراضي ، وسيكون لها نفس وضع العرض (على سبيل المثال ، كثيف) والإعدادات الاختيارية (على سبيل المثال ، حدود العرض). بينما تغطي الإعدادات الافتراضية المجموعة الكاملة من المسارات ذات الصلة ، يمكن في معظم الحالات تكوين المسارات الفرعية الفردية بواسطة المستخدم بشكل مستقل عن الإعدادات المركبة. ومع ذلك ، بمجرد إجراء إعدادات المسار الفرعي الفردية ، يمكن تجاوزها بخيارات جديدة يتم إجراؤها على المستوى المركب. قد يكون من المفيد قراءة "ملاحظة حول الميراث" الموجودة أدناه.

للإعلان عن مركب ، ما عليك سوى إضافة هذا الإعداد إلى تعريف المسار ، إلى جانب بعض الإعدادات القياسية. تتبع مقاطع المسار الفرعي دائمًا فورًا بعد تأخير المسار المركب ويتم وضع مسافة بادئة منه.

لاحظ أنه نظرًا لأن الأطفال من المركبات يرثون إعدادات الوالدين ، فسيتم العثور على العديد من إعدادات trackDb على المستوى المركب مقارنة بمستوى المسار الفائق.

يتم الإعلان عن العضوية في مركب من خلال تابع المسار الفرعي ، وليس المركب نفسه ، من خلال هذا الإعداد. قد ينتمي أي عدد من المسارات الفرعية إلى مركب واحد ، لكن أداء العرض يتدهور بشكل كبير بعد بضع مئات. اضبط الإعداد الرئيسي على "تشغيل" للإشارة إلى ما إذا كان يجب أن يكون المسار الفرعي مرئيًا (محددًا ، محددًا) بشكل افتراضي. إعدادات الرؤية في المسارات الفرعية المركبة موروثة مباشرة من الأصل. لذلك ، سيتم تجاهل أي خطوط رؤية تمت إضافتها على مستوى المسار الفرعي للمركب.

عندما يقدم مسار مركب بسيط قائمة قصيرة من المسارات الفرعية ، فقد يكون من الملائم للمستخدم أن يكون لديه طريقة سهلة لتحديدها أو إلغاء تحديدها جميعًا. قم بتضمين هذا الإعداد لعرض "الكل" (زر زائد وناقص) لراحة المستخدم. إذا كانت القائمة تحتوي على أكثر من 10 مسارات فرعية ، فقد تكون الطرق الأخرى أكثر فائدة لتنظيم واختيار المسارات الفرعية (الموضحة أدناه).

بشكل افتراضي ، يتم عرض تسمية المركز الفردي للمسار المركب فقط عند عرض المسارات الفرعية معًا في وضع كثافة المتصفح. إذا تم تعيين centerLabelsDense على "تشغيل" ، فسيعرض المتصفح تسمية مركزية لكل مسار فرعي.

عندما يكون لديك العديد من المسارات الفرعية في مسار مركب ، فقد يكون من المفيد في صفحة إعداد المسار ، والمعروفة أيضًا بصفحة تكوين hgTrackUi ، إعادة ترتيب المسارات الفرعية. تتمثل إحدى طرق إعادة ترتيب العديد من المسارات الفرعية في استخدام إعداد SortOrder ، كما هو موضح أدناه ، أو عن طريق السماح للمستخدم بسحب المسارات الفرعية وإفلاتها في طلب جديد في صفحة إعداد المسار. سيعمل إعداد مسارات السحب آند دروب الفرعية على تمكين السحب بالنقر فوق علامة الاختيار الموجودة بجوار المسار الفرعي في صفحة التكوين. وبالتالي يمكن إعادة ترتيب المسارات بالترتيب النهائي المطلوب ، والذي سيظهر بعد ذلك عند تصفح المسارات. ومع ذلك ، يمكن أيضًا إعادة ترتيب ترتيب المسارات في صورة متصفح hgTracks عن طريق سحب بيانات المسار المعروضة وإفلاتها مباشرةً. ومع ذلك ، فإن إعادة ترتيب المسارات الفرعية في صورة المتصفح في hgTracks لن تنعكس مرة أخرى على صفحة تكوين hgTrackUi. ملاحظة: لن يعمل هذا الإعداد بشكل صحيح إذا تم تحديد "الحاوية متعددة الأشعار".

عندما يكون لديك العديد من المسارات الفرعية في مسار مركب ، فقد يكون من المفيد قصر العرض على تلك التي تحتوي على بيانات في نافذة العرض الحالية فقط. ينتج عن إعداد المسار هذا مربع اختيار في صفحة تكوين المسار يسمح للمستخدم بتمكين هذه الميزة أو تعطيلها. إذا تم تحديد "تشغيل" ، يتم تشغيل الميزة افتراضيًا (يتم تحديد مربع الاختيار).

بالنسبة للمركبات الكبيرة ، خاصة تلك التي قد يكون كل مسار فرعي فيها متناثرًا ، يمكن تحقيق تحسينات جوهرية في الأداء من خلال إنشاء ملف فهرس لتقاطعات العناصر في جميع المسارات الفرعية (& quotmultiBed & quot). يعد هذا الملف وملف المصادر المصاحب إعدادات اختيارية لميزة hideEmptySubtracks. توجد تعليمات إنشاء هذه الملفات في صفحة تعليمات MultiBed (TBD).

ملاحظة: هذه الإعدادات مطلوبة لاستخدام ميزة hideEmptySubtracks مع مركبات العرض المتعدد.

يُستخدم هذا الإعداد جنبًا إلى جنب مع إعداد hideEmptySubtracksMultiBedUrl الموضح أعلاه.

يُستخدم هذا الإعداد جنبًا إلى جنب مع إعداد hideEmptySubtracks لتخصيص التسمية التي تسبق مربع اختيار التحديد في صفحة تكوين المسار. الصياغة الافتراضية هي & quot إخفاء المسارات الفرعية الفارغة & quot. تعد الصياغة المخصصة مفيدة لتمييز المسارات المتأثرة في التراكيب متعددة العرض (على سبيل المثال & quot إخفاء القمم الفارغة & quot؛ إخفاء المسارات الفرعية للقمة الفارغة & quot).

يظهر المركب مع مقطعين فرعيين. جميع المسارات الفرعية من النوع bigWig وجميعها لها حدود عرض افتراضية من 0 إلى 0.2. لاحظ أن المسار الفرعي الأول محدد بشكل افتراضي ، ولكن الثاني ليس (الإعداد الرئيسي). ومع ذلك ، سيعرض المتصفح زرين (إعداد allButtonPair) يسمحان للمستخدم بتحديد جميع المسارات الفرعية ، أو إلغاء تحديدها جميعًا ثم التحقق من تلك التي تهمه فقط.

المجموعات الفرعية

داخل المسار المركب ، يمكن استخدام نمطي تجميع مختلفين للسماح للمستخدم بتحديد المسارات لعرضها في المستعرض. يصف هذا القسم تكوين "المجموعات الفرعية" تمت مناقشة "طرق العرض" في قسم لاحق.

يمكن استخدام المجموعة الفرعية لاختيار مجموعات من المسارات الفرعية للعرض بناءً على خصائص معينة للبيانات. على سبيل المثال ، إذا تم تعريف "الخلية" و "الجسم المضاد" كمجموعات فرعية داخل مسار مركب ، فسيكون المستخدم قادرًا على تحديد المسارات الفرعية بناءً على أنواع الخلايا والأجسام المضادة المحددة لعرضها في المستعرض. يمكن تحديد ما يصل إلى 9 أنواع من المجموعات الفرعية للمركب. ومع ذلك ، لتقليل التعقيد ، يوصى بشدة بتحديد مجموعتين فرعيتين فقط لمسار مركب معين. سيتم تقديمها في مصفوفة X / Y بسيطة يسهل على المستخدم فهمها والتنقل فيها. من الممكن تحديد المزيد من المجموعات الفرعية بأبعاد "abc" الإضافية التي سيتم تقديمها للمستخدم كمربعات حوار متعددة التحديدات منسدلة ، ولكن يجب تجنب استخدامها أو تقليلها.

يمكن الإعلان عن ما يصل إلى 9 مجموعات فرعية ، واحدة في كل سطر. يجب أن يشتمل إعلان كل مجموعة فرعية على علامة مفصولة بمسافات بيضاء ، وعنوان ، وأزواج عضوية واحدة أو أكثر من العلامات / العنوان مرتبطة بعلامة تساوي "=".

  • العلامة: تُستخدم في الكود لتحديد الفئات الفرعية وفرزها بناءً على عضويتهم. يجب أن تكون أسماء العلامات أبجدية رقمية ، وتبدأ بحرف ، ولا تحتوي على نقطة ، وأن يتم تشكيلها بحيث ينتج ترتيب الفرز المطلوب للمقاطع الفرعية للأعضاء.
  • العنوان: تسمية المجموعة الفرعية كما تظهر في مصفوفة التحديد التي يتم عرضها للمستخدم ، على سبيل المثال ، "الجسم المضاد". يجب استبدال المسافات داخل العناوين بـ "_". يُسمح بكمية محدودة من HTML في العناوين ، مثل إدخال الأحرف اليونانية باستخدام كود HTML. يجب اختبار أي استخدام لـ HTML لضمان عرضه بشكل صحيح.

نظرًا لأن إعدادات المجموعة الفرعية غالبًا ما تكون طويلة ، فمن المستحسن استخدام حرف متابعة السطر "" لتقسيم الإعداد على عدة أسطر لتسهيل القراءة.

تعلن المسارات الفرعية نفسها عن عضويتها في مجموعة مع إعداد المجموعات الفرعية. يجب أن يعلن كل مسار فرعي عن عضويته في جميع المجموعات الفرعية المكونة له. لاحظ أنه يتم الإعلان عن العضوية عن طريق أزواج من العلامات: يتم إقران علامة المجموعة (مثل gTag1) بعلامة عضو تلك المجموعة (مثل mTag1b) مثل gTag1 = mTag1b (الخلية = K562).

من أجل تحديد نوع واجهة المستخدم المطلوبة لتحديد المسارات الفرعية بناءً على المجموعات ، هناك حاجة إلى إعدادات إضافية على المستوى المركب. بالنسبة إلى مصفوفة مربعات أحادية أو ثنائية الأبعاد ، قم بتعريف الأبعاد X و Y. يمكن الإعلان عن الأبعاد الإضافية (تسمى "abc") باستخدام هذا الإعداد على أنها dimA و dimB وما إلى ذلك.

لاحظ أن ترتيب المجموعات الفرعية في البعد هو نفسه تمامًا الترتيب الذي تظهر به في إعداد المجموعة الفرعية # ، بغض النظر عما إذا كانت قائمة المسارات الفرعية مرتبة حسب العلامات. يرجى أيضًا ملاحظة أنه إذا كان المحور لن يستخدم مصفوفة X و Y ، فيجب أن يكون dimX هو البعد الأول المحدد بدلاً من dimA. أيضًا ، سيمنع إعداد allButtonPair on عرض المصفوفة.

بالنسبة إلى أبعاد "abc" ، سيتم عرض صفوف مربعات الاختيار افتراضيًا. ومع ذلك ، يمكن أن تكون واجهة المستخدم هذه محيرة ، خاصةً إذا تم دمجها مع مصفوفة أحادية أو ثنائية الأبعاد. بدلاً من ذلك ، يوصى بتنظيم أبعاد "abc" على أنها اختيارات متعددة قائمة منسدلة ، يشار إليها غالبًا باسم مربعات "التصفية" نظرًا لتشابهها مع الإعداد الذي تمت مناقشته أعلاه. قم بتعريف مربعات تصفية المسار الفرعي باستخدام إعداد التصفية المركب. قد تعمل مركبات المرشح مع أو بدون مصفوفة X / Y ، ولكنها مقيدة بأبعاد "abc".

بشكل افتراضي ، يكون مربع التصفية الخاص بتحديد المسارات الفرعية متعدد التحديد ، مما يعني أنه يُسمح بأكثر من خيار واحد. من الممكن قصر هذا على خيار واحد عن طريق إضافة الخيار "= one" إلى تعريف مربع التصفية. قد يكون هذا منطقيًا عندما يكون هناك خياران فقط. يكون اختيار "الكل" متاحًا دائمًا ، بينما يعد اختيار أي شيء حالة غير صالحة. يرجى ملاحظة أنه إذا كان المحور لن يستخدم مصفوفة X و Y ، فيجب أن يكون dimX هو البعد الأول المحدد بدلاً من dimA.

هناك تعقيد آخر في عملية الاختيار وهو تحديد خيارات المجموعة الفرعية التي يتم تحديدها افتراضيًا. في حالة المصفوفة X / Y يمكن تحديد ذلك من خلال ما هي المسارات الفرعية التي يتم فحصها حاليًا. لكن ، أبعاد "abc" يجب أن يتم الإعلان عنها صراحةً باستخدام إعداد البعد & lt؟ & gtchecked.

ليس للمراكز. تستخدم حاليًا بواسطة ENCODE فقط

في ENCODE ، غالبًا ما تستند المجموعات الفرعية إلى مصطلحات البيانات الوصفية المعلنة في جدول metaDb والمحددة في "المفردات الخاضعة للرقابة" ، والتي يتم تخزينها كملف ra. في هذه الحالة ، يمكن ربط تسميات هذه المصطلحات ، كما تظهر في صفحة تكوين المسار ، بتعريفات المفردات المضبوطة. يمكن أن تكون هذه الروابط مفيدة للغاية ، حيث قد يشمل مصطلح التعريف وثائق البروتوكول وأدلة التحقق من الصحة. من أجل إنشاء الروابط ، يجب ربط علامة كل مجموعة فرعية بمصطلح metaDb الفعلي.

TODO: حاليًا لا يتم استخدام الملف المعلن في هذا الإعداد ، حيث يتم العثور دائمًا على ملف cv.ra في موقعه القياسي.

عند الإعلان عن مجموعات فرعية ، من المفيد غالبًا فرز قائمة المسارات الفرعية حسب تلك المجموعات الفرعية. من خلال تضمين إعداد SortOrder ، يتم تنظيم المجموعات الطويلة من المسارات الفرعية والتنقل فيها بسهولة بواسطة المستخدم. إذا لم يكن هناك سوى عدد قليل من المسارات الفرعية في المركب ، فقد يكون الفرز ذا قيمة قليلة وقد يكون السحب والإندروب خيارًا أفضل. يمكن حاليًا تحديد المجموعات الفرعية فقط في SortOrder ، ولكن من المتوقع أن يتوسع هذا ليشمل التسميات القصيرة والطويلة أيضًا. سيحدث الفرز على قيم العلامات المحددة في إعدادات المجموعة الفرعية # والمجموعات الفرعية. بالفرز على العلامات ، يمكن تحديد الطلبات غير الأبجدية الرقمية.

ليس للمراكز. تستخدم حاليًا بواسطة ENCODE فقط

تحتوي بعض مجموعات المسارات المركبة على أدلة خاصة بها للملفات القابلة للتنزيل و CGI خاص للوصول إلى هذه الملفات. من أجل رؤية واجهة CGI لدليل التنزيل ، يحتاج المركب إلى كائن لكل ملف محدد في metaDb. يحتاج مقطع trackDb للمركب أيضًا إلى تحديد إعداد fileSortOrder. يتم تعريف الإعداد على أنه مجموعة من أزواج المتغيرات = القيمة ، والتي تحدد ترتيب الفرز الافتراضي في متغيرات metaDb. جزء "var" من كل زوج هو مصطلح محدد في metaDb لجميع كائنات الملف في الدليل. قد يكون "var" أيضًا "نوع الملف" أو "حجم الملف" ، والتي لم يتم تعريفها في metaDb. "val" هو العنوان الذي سيراه المستخدم كرأس العمود لجدول الملفات القابل للفرز. يمكن أن تحتوي هذه القيمة و "_" للمسافات وأكواد HTML المحدودة والأحرف الخاصة. كالعادة ، نشجعك على التجربة. يجب استخدام حرف التتابع "" لتقسيم هذا الإعداد الطويل إلى أسطر قابلة للقراءة.

يوضح هذا المثال مركبًا مكونًا من مسار فرعي واحد ومجموعتين فرعيتين. يحدد إعداد الأبعاد الأبعاد X و Y ، والتي ستعرض مصفوفة ثنائية الأبعاد على صفحة تكوين المركب. لاحظ أن عنوان المجموعة الفرعية cellLine يحتوي على مسافة فارغة مليئة بـ "_". يشتمل سطر الخلية الثاني ، "CD14 +" ، على ترميز HTML لـ "+" في عنوانه ، وتشارك المجموعتان الفرعيتان في ترتيب الفرز الافتراضي للمقاطع الفرعية ، ولكن لكل منهما أوامر فرز غير قياسية. في المجموعة الفرعية cellLine ، يقوم GM12878 بالفرز أولاً عن طريق بدء علامته بـ "A". تحتوي الأجسام المضادة على أرقام في عناوينها ، لكن العلامات توسع الرقم بـ "0" لتضمين المسافات. هذا يضمن أنواع H3K4me3 قبل H3K36me3.

في هذا المثال الثاني المركب ، يتم عرض مسار فرعي وثلاث مجموعات فرعية. كما في المثال السابق ، يحدد إعداد الأبعاد الأبعاد X و Y ، مما ينتج عنه مصفوفة ثنائية الأبعاد لخيارات "Antibody" و "Cell Line". تم الإعلان عن مجموعة فرعية ثالثة "معالجة" كبُعد "أ" ، حيث سيتمكن المستخدم من تحديد المسارات الفرعية لهذا البعد من خلال مربع تصفية متعدد التحديد منسدلة. تشارك جميع المجموعات الفرعية الثلاث في ترتيب الفرز الافتراضي للمقاطع الفرعية ، ويتم فرز مجموعة المعالجة الفرعية بترتيب عكسي افتراضيًا. يفرز العلاج "بلا" قبل كل الآخرين (بترتيب عكسي) ببدء العلامة بحرف "Z". لاحظ أنه بالنسبة لهذا البعد "أ" ، سيتم تحديد المعالجة "بلا" افتراضيًا. من خلال إعلان الإعدادات المناسبة ، يمكن أن يكون استخدام المجموعات الفرعية لتنظيم مركب قويًا للغاية.

يوضح هذا المثال أنه يجب ربط المجموعات الفرعية والأبعاد والمفردات والبيانات الوصفية المتحكم بها (في حالة ENCODE) معًا حتى يعمل المركب بشكل كامل. علاوة على ذلك ، فإن المصطلحات الفعلية و "العلامات" الآلية والعناوين المرئية للمستخدم لها قيود وأدوار مختلفة لتلعبها في تأسيس هذا التماسك. تُستخدم علامات المجموعات الفرعية لتنظيم المسارات الفرعية ، بينما تنظم الأبعاد ذات الحروف صفحة التكوين لتحديد مجموعات فرعية من المسارات الفرعية بسهولة أكبر. بالنسبة لمسارات ENCODE ، قد يتم تمثيل المجموعات الفرعية على أنها "مصطلحات" بيانات وصفية (متميزة عن العلامات) التي غالبًا ما يتم تحديدها بعناية بواسطة مفردات مضبوطة. في المثال أعلاه ، يتم استخدام العلامة "ab" لتنظيم المسارات الفرعية في مجموعات فرعية ولكنها مرتبطة أيضًا بالبعد X. وهذا يضمن ظهور الأجسام المضادة كبُعد أفقي في المصفوفة ثنائية الأبعاد على صفحة التكوين واختيار الجسم المضاد سيحدد المسارات الفرعية المرتبطة. بالطبع لا يرى المستخدم الجسم المضاد كـ "ab" ولكن "جسم مضاد".للمضي قدمًا ، فإن المصطلح كما هو محدد في المفردات المضبوطة هو "الجسم المضاد" ، بحيث بالنسبة لجميع الجداول والملفات المرتبطة بهذا المسار المركب ، يجب أن تحتوي كائنات metaDb على var "جسم مضاد" وسيتم العثور على جسم مضاد معين (مثل H3K4me3) في المفردات الخاضعة للرقابة مع وثيقة التحقق من الصحة. يمكن أن تكون جميع العلاقات مربكة ، لكن إعدادات trackDb ، إذا تم إجراؤها بشكل صحيح ، يمكن أن تربط كل هذه العناصر معًا في حزمة متماسكة لطيفة.

يوضح هذا المثال مركبًا مكونًا من مسار فرعي واحد ومجموعتين فرعيتين. يحدد إعداد الأبعاد الأبعاد X و Y ، والتي ستعرض مصفوفة ثنائية الأبعاد على صفحة تكوين المركب. لاحظ أن عنوان المجموعة الفرعية cellLine يحتوي على مسافة فارغة مليئة بـ "_". يشتمل سطر الخلية الثاني ، "CD14 +" ، على ترميز HTML لـ "+" في عنوانه ، وتشارك المجموعتان الفرعيتان في ترتيب الفرز الافتراضي للمقاطع الفرعية ، ولكن لكل منهما أوامر فرز غير قياسية. في المجموعة الفرعية cellLine ، يقوم GM12878 بالفرز أولاً عن طريق بدء علامته بـ "A". تحتوي الأجسام المضادة على أرقام في عناوينها ، لكن العلامات توسع الرقم بـ "0" لتضمين المسافات. هذا يضمن أنواع H3K4me3 قبل H3K36me3.

في هذا المثال الثاني المركب ، يتم عرض مسار فرعي وثلاث مجموعات فرعية. كما في المثال السابق ، يحدد إعداد الأبعاد الأبعاد X و Y ، مما ينتج عنه مصفوفة ثنائية الأبعاد لخيارات "Antibody" و "Cell Line". تم الإعلان عن مجموعة فرعية ثالثة "معالجة" كبُعد "أ" ، حيث سيتمكن المستخدم من تحديد المسارات الفرعية لهذا البعد من خلال مربع تصفية متعدد التحديد منسدلة. تشارك جميع المجموعات الفرعية الثلاث في ترتيب الفرز الافتراضي للمقاطع الفرعية ، ويتم فرز مجموعة المعالجة الفرعية بترتيب عكسي افتراضيًا. يفرز العلاج "بلا" قبل كل الآخرين (بترتيب عكسي) ببدء العلامة بحرف "Z". لاحظ أنه بالنسبة لهذا البعد "أ" ، سيتم تحديد المعالجة "بلا" افتراضيًا. من خلال إعلان الإعدادات المناسبة ، يمكن أن يكون استخدام المجموعات الفرعية لتنظيم مركب قويًا للغاية.

الآراء

بالإضافة إلى المجموعات الفرعية ، يمكن تقسيم مركب واحد إلى "عروض" متعددة. تذكر أن المركب يجب أن يتكون من مسارات فرعية من نفس النوع. ومع ذلك ، يمكن دمج أنواع مختلفة من المسارات الفرعية في نفس المسار المركب إذا كانت في "عروض" منفصلة. في حين أن طرق العرض تشبه المجموعات الفرعية من نواح كثيرة ، إلا أنها يمكن أن تحمل إعداداتها الخاصة. هذا ضروري لأن العروض داخل المركب قد تكون لأنواع مختلفة لها إعدادات تكوين مميزة خاصة بها ، على سبيل المثال bigBeds و bigWigs.

عادةً ما يتم استخدام مؤسسة "العرض" (أو "العرض المتعدد") عند تخزين نفس البيانات الأساسية بتنسيقات ودرجات متعددة. على سبيل المثال ، قد تتضمن مجموعة من طرق العرض محاذاة تسلسل قراءة قصيرة (نوع bam) ، وإشارات تمثل تراكم القراءات المتوافقة (اكتب bigWig) ، والقمم (اكتب bigBed) التي يتم استدعاؤها في المناطق التي يكون فيها دليل النتيجة التجريبية هو تعتبر كبيرة. يمكن رؤية هذه "العروض" الثلاثة لنفس البيانات التجريبية بشكل أكثر إفادة كمجموعة متماسكة ضمن مسار مركب متعدد الرؤية.

يتم إعلان المشاهدات كمجموعة فرعية ومقطع مسار منفصل. يحتوي المركب الذي يحتوي على طرق عرض متعددة على طرق عرض كأطفال فقط ، وسيكون لكل طريقة عرض مسار فرعي واحد أو أكثر كأطفال. يجب تحديد المستويات الثلاثة مع المسافة البادئة لجعل التسلسل الهرمي واضحًا.

ملاحظة حول الميراث. سترث المسارات الفرعية الإعدادات من والديها (من المركبات ومن العروض). هذا صحيح عندما يكون الإعداد قابلاً للتوريث ، وهذا هو الحال عمومًا. الاستثناءات الواضحة هي الإعدادات ذات الصلة فقط بالمستوى الأعلى. يتبع الوراثة نموذج "الأقرب إلى المنزل" حيث يكون الإعداد على مستوى المسار الفرعي الأسبقية ، متبوعًا بإعداد مستوى العرض ، وأخيراً إعداد المستوى المركب. ينطبق هذا الوراثة على كل من إعدادات trackDb الافتراضية والخيارات التي يقوم بها المستخدم. تتضمن الإعدادات التي أجراها المستخدم عنصر توقيت أيضًا: سيؤدي التغيير إلى إعداد على مستوى الوالدين إلى تجاوز جميع الإعدادات من نفس النوع لأطفاله. إذا قام المستخدم بعد ذلك بإعداد إعداد مسار فرعي ، فسيتجاوز الإعداد الموروث لهذا المسار الفرعي.

الشذوذ داخل مخطط الوراثة هو إعداد "الرؤية" (وضع العرض). على عكس الإعدادات الأخرى ، تكون الرؤية مقيدة بشكل تراكمي من مستوى المسار الفائق. أي ، إذا كان الوالد لديه رؤية "كثيفة" وكانت رؤية الطفل "حزمة" ، فسيتم عرض الطفل على أنه "كثيف". إذا تم تغيير الوالد لاحقًا إلى وضع العرض "الكامل" ، فسيتم عرض الطفل الآن في وضع "الحزمة". على مستوى trackDb ، تكون الرؤية الافتراضية دائمًا مقيدة بشكل تراكمي. ومع ذلك ، عندما يغير المستخدم صراحةً رؤية المسار الفرعي ليكون أكبر مما ورث من الوالدين ، فإن رؤية هذا المسار الفرعي سوف تتجاوز الميراث. في حين أنه قد يكون من الصعب شرح التفاصيل الدقيقة للوراثة ، إلا أنها غالبًا ما تكون بديهية في الممارسة. في المسارات الفرعية المركبة ، يتم توريث إعدادات الرؤية مباشرة من المركب الأصلي ، وبالتالي ، سيتم تجاهل أي خطوط رؤية تمت إضافتها على مستوى المسار الفرعي للمركب. لاحظ أيضًا أنه يجب الإشارة إلى السطر الأصلي باعتباره myComposite الأصل إذا كان أحدهم يرغب في أن يكون المسار الفرعي الفرعي في مركب مرئيًا (محددًا ، محددًا) بشكل افتراضي.

يتم دائمًا الإعلان عن طريقة عرض كمجموعة فرعية وفي مقطع مسار بحد ذاته. يعتبر إعلان المجموعة الفرعية مثل الإعلانات السابقة ، ولكن يجب أن يكون لدى المجموعة الفرعية للعرض طريقة عرض العلامة وأن يتم إعلانها على أنها المجموعة الفرعية الأولى. لاحظ أن مقطع العرض يتبع المقطع المركب بمستوى واحد من المسافة البادئة. ستتبع المسارات الفرعية وجهة نظرهم بمستوى إضافي من المسافة البادئة.

يعلن المسار الفرعي عن عضويته في طريقة عرض كعضوية مجموعة فرعية وبإعداد رئيسي يشير إلى اسم مسار العرض. لاحظ أن المسار يمكن أن يكون له أحد الوالدين فقط. عندما يكون أصل المسار الفرعي عبارة عن طريقة عرض ، فإن المسار المركب يكون له ضمني الجد.

إذا كانت المسارات الفرعية في طريقة العرض قابلة للتكوين ، فسيكون للعرض عناصر تحكم التكوين الخاصة بها في مربع أسفل القائمة المنسدلة لرؤية العرض. يتم إخفاء هذا المربع المليء بعناصر تحكم التكوين افتراضيًا بحيث لا تكون واجهة المستخدم مزدحمة للغاية. يجب على المستخدم فتح الصندوق أولاً قبل رؤية محتوياته. إذا كان هناك عرض واحد فقط مع إعدادات التكوين ، أو إذا كان العرض هو الأكثر أهمية ، فيمكن فتح المربع افتراضيًا. استخدم هذا الإعداد في مقطع العرض الخاص بالإعدادات لجعل مربع التكوين افتراضيًا مفتوحًا.

تكون المسارات قابلة للتكوين افتراضيًا إذا كان نوع المسار الخاص بها يدعم ذلك ، وتكون العروض والتركيبات قابلة للتكوين إذا كان نوع المسار الخاص بأطفالها يدعم ذلك. أخيرًا ، يمكن تكوين المسارات الفرعية الفردية افتراضيًا إذا كان نوع المسار الخاص بها يدعمها. في بعض الأحيان يكون من المستحسن إيقاف تشغيل التكوين. قد يتم إعادة تشغيل التكوين عند إيقاف تشغيله على مستوى أعلى. على سبيل المثال ، قد يكون هذا مفيدًا في حالة وجود مركب متعدد العرض حيث يكون المستوى المركب قابلاً للتكوين عادةً ، لكنك تريد فقط واحدة من طرق العرض وليس كل العناصر الفرعية في هذا العرض قابلة للتكوين. على الرغم من أنه نادرًا ما تكون هناك حاجة إلى هذا الإعداد ، إلا أنه يمكن أن يساعد في منع المستخدم من عرض بياناتك بطرق غير مناسبة.

يحتوي المركب على وجهتي نظر ، أحدهما معروض ، جنبًا إلى جنب مع مسار فرعي واحد ينتمي إلى هذا العرض. لاحظ أن طريقة العرض لا تشارك في إعداد الأبعاد ، حيث إنها بُعد ضمني يتحكم فيه صف من مربعات حوار الرؤية أعلى صفحة التكوين المركب. لاحظ أن طريقة العرض تشارك في إعداد SortOrder مثل المجموعات الفرعية الأخرى. في هذا المثال ، يحتوي عرض القمم على مسارات فرعية كبيرة الحجم تشترك جميعها في الإعدادات الافتراضية لتصفية النقاط المحددة على مستوى العرض. يمكن تحديد أي إعداد مشترك للشجرة بأكملها تقريبًا على المستوى المركب ، ويمكن تعيين أي إعداد مشترك للعرض على مستوى العرض وأي إعداد خاص بمسار فرعي واحد يجب تعيينه على هذا المستوى. تذكر الوراثة ، يمكننا أن نرى أن المسار الفرعي المعروض يرث نوع المسار الخاص به من العرض ، لكن الرؤية الافتراضية الخاصة به محدودة بواسطة المركب. أي أنه يرث الرؤية المجمعة من العرض لكن المركب سيظهر جميع المسارات الفرعية المرئية كثيفة.

شيء إضافي يجب ملاحظته هو أن هذا المسار المركب هو "نوع السرير 3". لا تحتاج المركبات إلى نوع لتعريف تنسيق البيانات الخاص بها ، نظرًا لأن جميع البيانات مرتبطة بالأقسام الفرعية. علاوة على ذلك ، تحتوي المركبات متعددة العروض دائمًا على تنسيقات بيانات متعددة. لكن "النوع" يتحكم أيضًا في خيارات التكوين التي قد يتم تقديمها للمسار. عادةً ما يكون لمركب المستوى الواحد نفس النوع مثل جميع المسارات الفرعية ويقدم خيارات تكوين المستخدم في المستوى الأعلى. ولكن غالبًا ما يتم إعطاء المركب متعدد العروض "سرير من النوع 3" ، ويوفر خيارات تكوين المستخدم على مستوى العرض. توجد استثناءات لهذا النمط ولكنها نادرة.

المسارات الإجمالية أو المتراكبة: multiWig

في بعض الحالات ، ترتبط البيانات من مسارات متعددة ارتباطًا وثيقًا بحيث يكون من المنطقي مشاهدتها كمسار واحد. المثال الأول لهذا هو مسار تراكب الإشارة (أي "multiWig"). تعرض مسارات تراكب الإشارة بيانات الإشارة من عدة مسارات فرعية مجمعة بعدة طرق مختلفة ، مما يجعل من الممكن رؤية بيانات العديد من المسارات معًا في عرض مكثف. طريقة التراكب الافتراضية لـ multiWigs هي بمثابة ورق شفاف ملون ، حيث يتم رسم جميع الرسوم البيانية فوق بعضها البعض بطريقة تجعل المناطق المتداخلة بلون مختلف. خيار آخر هو التراكب الصلب ، حيث لا تزال جميع الرسوم البيانية تُرسم متداخلة مع بعضها البعض ، ولكن بدون شفافية. يتم تكديس خيار ثالث حيث يتم تكديس قيم المسارات الفرعية فوق بعضها البعض دون تداخل بحيث يكون الارتفاع الإجمالي للتذبذب هو مجموع كل القيم الموجودة في الأقواس الفرعية. تتجاوز قيمة مسار التراكب مجرد تكثيف الصورة. أحيانًا تكون هذه هي الطريقة الأكثر فاعلية لتحديد العلاقات المخفية في البيانات الأساسية. ومع ذلك ، لا ينبغي الإفراط في استخدام مسار التراكب. يمكن لمحاولات تراكب عدد كبير جدًا من المسارات الفرعية إخفاء معلومات مهمة حيث تصبح المناطق التي تحتوي على العديد من الإشارات ذات الطبقات داكنة جدًا بحيث يتعذر تفسيرها. قد يكون أكثر من ثمانية مسارات فرعية في تراكب واحد أقل من مثالي. كما هو الحال مع المركبات ، من المهم أن يكون لمسارات multWig نفس أبعاد البيانات ، أي يجب أن يكون ارتفاع الإشارة 100 قابلاً للتفسير بنفس الطريقة لمجموعة المسارات بأكملها. في حين أن هذا صحيح بالنسبة للمركب أو العرض ، إلا أنه مهم بشكل خاص لمسارات التراكب. لا يمكنك تراكب إشارة من 0-1 بشكل معقول مع إشارة أخرى من 0-1000.

يتم الإعلان عن مسارات تراكب الإشارة مثل التراكيب البسيطة. ومع ذلك ، بدلاً من الإعداد "المركب" ، فإنهم يعلنون عن أنفسهم على أنهم "حاوية" من "النوع multiWig". مثل المواد المركبة البسيطة ، يجب أن تكون جميع أنواع المسارات الفرعية متطابقة ويجب الإعلان عن الحاوية نفسها على أنها من نفس النوع (مثل "bigWig"). كما هو الحال مع المركب أيضًا ، يجب أن يكون لوالد الحاوية إعدادات مشتركة لجميع الأطفال. على عكس المركبات ، لا يمكن أن تحتوي الحاويات على مجموعات فرعية ولا طرق عرض. بالإضافة إلى ذلك ، يتم تكوين جميع المسارات الفرعية داخل الحاوية بحيث لا يوجد تكوين مستقل للمقاطع الفرعية الفردية. حتى عندما يقوم المستخدم بتعيين طريقة التراكب على لا شيء ويتم عرض المسارات الفرعية كإشارات منفصلة ، فلا يزال يتم تكوينها كمجموعة.

يتم الإعلان عن العضوية في مسار الحاوية على مستوى المسار الفرعي. يجب تحديد المسارات الفرعية بمسافة بادئة أسفل أصل الحاوية.

من المهم الإعلان عن طريقة التجميع ، وإلا فإن هذه المجموعة من المسارات تظهر كمركب ، مع قيود إضافية. من بين الخيارات الأربعة ، يكون الإعداد المفضل هو شفاف متراكب. سيؤدي الإعداد المكدس إلى رسم الرسوم البيانية في الوضع المكدس. لا يجب استخدام الإعداد solidOverlay إذا كان هناك أكثر من مسارين ، ولا يجب أن يكون أي منها هو الإعداد الافتراضي. طريقة التجميع هي خيار قابل للتكوين ، ومع ذلك ، قد يرغب المستخدم في تعيينها مؤقتًا على لا شيء لرؤية التفاصيل الدقيقة مخفية في وضع التراكب.

المسارات الفرعية في التراكب لها ألوان فردية. استخدم هذا الإعداد لإظهار اللون المرتبط بكل منها على صفحة تكوين المسار.

هذه الحاوية مخصصة لتراكب شفاف لمسارات الإشارة مع عرض مسارين فرعيين. المسارات من النوع "bigWig" ، على الرغم من أن المسار الفرعي الأول هو شعر مستعار. هذه الخلطات مسموح بها. لاحظ أن الباروكة لها نطاق أكبر قليلاً من الآخرين. تكون أبعاد الإشارة قريبة بدرجة كافية في هذه الحالة ، وتشير حدود العرض الافتراضية المطبقة على جميع المسارات الفرعية إلى أن أي إشارة أعلى من 10 يتم تفسيرها على أنها قوية. لاحظ أن كل مسار فرعي يجب أن يحدد لونه ، وفي هذا المثال ، سيظهر هذا اللون في صفحة تكوين المسار وكذلك في الصورة. لاحظ أيضًا أن المسار الفرعي الأول يعلن عن جدول متميز عن اسم المسار الخاص به. عادةً ما يكون اسم الجدول (أو جذر الملف البعيد) هو نفسه اسم المسار. اسم المسار هو مفتاح فريد. ولكن غالبًا ما يتم عرض جدول أو ملف بيانات بعيد كمسار فردي أو مسار فرعي ، بالإضافة إلى جزء من مسار تراكب إشارة. يشير تعيين اسم الجدول هنا إلى وجود مسار يسمى "myFirstWig" ويعرض نفس البيانات المستخدمة في مسار التراكب هذا.

هذه الحاوية مخصصة لتراكب شفاف لمسارات الإشارة مع عرض مسارين فرعيين. المسارات من نوع "bigWig". لاحظ أن المسار الفرعي الأول له نطاق أكبر قليلاً من المسارات الأخرى. تكون أبعاد الإشارة قريبة بدرجة كافية في هذه الحالة ، وتشير حدود العرض الافتراضية المطبقة على جميع المسارات الفرعية إلى أن أي إشارة أعلى من 10 يتم تفسيرها على أنها قوية. لاحظ أن كل مسار فرعي يجب أن يحدد لونه ، وفي هذا المثال ، سيظهر هذا اللون في صفحة تكوين المسار وكذلك في الصورة.

المسارات المخصصة

المسارات المخصصة هي مسارات يتم تحميلها في المتصفح من خلال hgCustom CGI. على عكس المسارات المستضافة محليًا ، أو حتى مسارات Data Hub ، فإنها لا تحتوي على مقطع trackDb.ra لتحديد تنسيقها وسلوكها في المستعرض. ومع ذلك ، فإنهم سيدعمون معظم الإعدادات كمسار مستضاف محليًا من نفس النوع. هناك عدد قليل من الإعدادات الإضافية اللازمة لدعم المسارات المخصصة بشكل كامل.

مليء باسم الجينوم / التجميع ديسيبل.

يستخدم مرة واحدة فقط ، لتطبيق تعويض على بيانات نوع السرير لمسار مخصص.

داخلي فقط & ndash لم يتم تعيين المستخدم. مليئة بجميع خطوط نمط trackDb.ra من إدخال hgCustom.

داخلي فقط & ndash لم يتم تعيين المستخدم. ممتلئ إذا تم تحميل المسارات المخصصة عبر URL.

داخلي فقط & ndash لم يتم تعيين المستخدم.

لست متأكدًا من كيفية تمييزه عن tdbType.

داخلي فقط & ndash لم يتم تعيين المستخدم. مليئة بعدد أعمدة السرير كما هو محدد في hgCustom CGI.

داخلي فقط & ndash لم يتم تعيين المستخدم. مليئة بأول عنصر سرير في السرير قائمة في hgCustom CGI.

داخلي فقط & ndash لم يتم تعيين المستخدم. مليء بالاسم إذا كان ملف سلة المهملات يحتوي على وصف HTML للمسار المخصص.

داخلي فقط & ndash لم يتم تعيين المستخدم. مليء بعنوان URL الذي أدخله المستخدم للمسار

داخلي فقط & ndash لم يتم تعيين المستخدم. مليئة بالموضع من hgCustom الإدخال.

داخلي فقط & ndash لم يتم تعيين المستخدم. مليئة باسم المصنع المخصص كما هو محدد في hgCustom CGI.

داخلي فقط & ndash لم يتم تعيين المستخدم. مليئة بقطعة السرير slCount في hgCustom CGI.

داخلي فقط & ndash لم يتم تعيين المستخدم. مليء باسم ملف المهملات الذي يحتوي على بيانات maf كما تم تحميلها في hgCustom CGI.

داخلي فقط & ndash لم يتم تعيين المستخدم. مهمل: مليء بالحد الأدنى لحجم الفهرس لـ db الذي لن "يتجانس" مع chromNames.

داخلي فقط & ndash لم يتم تعيين المستخدم. مليء بخط "المسار" كما أدخله المستخدم في hgCustom CGI.

داخلي فقط & ndash لم يتم تعيين المستخدم.

يحمل النوع الذي يجب إدخاله في tdb- & gttype.

داخلي فقط & ndash لم يتم تعيين المستخدم. مليء باسم ملف المهملات الذي يحتوي على بيانات wib الثنائية كما تم تحميلها في hgCustom CGI.

داخلي فقط & ndash لم يتم تعيين المستخدم. مليء باسم ملف سلة المهملات الذي يحتوي على بيانات شعر مستعار كما تم تحميله في hgCustom CGI.


كيف تعلق على ملف .broadpeak مع 9 أعمدة؟ - مادة الاحياء

ATACProc - خط أنابيب لمعالجة بيانات ATAC-seq

ديفلوبر: سوريا بهاتاشاريا

المشرفون: د. فرحات آي ود. باندورانجان فيجاياناند

معهد لا جولا للمناعة ، كاليفورنيا 92037 ، الولايات المتحدة الأمريكية

ATACProc هو خط أنابيب لتحليل بيانات ATAC-seq. حاليًا ، يتم دعم مجموعات البيانات التي تتضمن أحد الجينومات المرجعية الأربعة ، وهي hg19 و hg38 و mm9 و mm10. الميزات الهامة لخط الأنابيب هذا هي:

يدعم البيانات المنسقة بنهاية واحدة أو مزدوجة fastq أو BAM.

يولد ملخص المحاذاة وإحصائيات مراقبة الجودة.

مكالمات الذروة باستخدام MACS2 ، لعدة عتبات FDR (0.01 و 0.05)

إنشاء مسارات BigWig الأولية والتغطية الطبيعية لتصور البيانات في متصفح الجينوم UCSC.

تحليل معدل الاكتشاف غير القابل للإنتاج (IDR) (https://github.com/nboley/idr) بين مجموعة من مكالمات الذروة أو حتى مجموعة من ملفات محاذاة الإدخال (BAM) (في هذه الحالة ، يتم تقدير القمم أولاً) المقابلة لـ مجموعة من مكررات ATAC-seq البيولوجية أو التقنية.

الجديد في الإصدار 2.0: دعم تجاهل القراءات التي تقع في مناطق الجينوم المدرجة في القائمة السوداء

الجديد في الإصدار 2.0: دعم استخراج القراءات الحرة للنيوكليوسوم (NFR) ، واحد أو أكثر من المناطق التي تحتوي على النواة (يُشار إليها على أنها + 1M) ، لتحليل بصمة TF.

الجديد في الإصدار 2.0: التوافق مع الحزمة ATAQV (https://github.com/ParkerLab/ataqv) لتوليد إحصائيات موجزة عبر مجموعة من العينات.

الإصدار 2.1 - يوليو 2020

تغيير طفيف في صيغة إزالة picard المكررة ، وفقًا لإصدار أداة picard 2.8.14 نوصي باستخدام هذه الإصدارات (أو الإصدارات الأحدث)

الإصدار 2.0 - نوفمبر 2019

تم تضمين بصمة TF ، والتجاهل الاختياري للمناطق الجينومية المدرجة في القائمة السوداء ، وتحليل الحافز

إحصائيات موجزة محدثة تتضمن دعم حزمة ATAQV (https://github.com/ParkerLab/ataqv)

حزمة R المهملة ATACseqQC (https://bioconductor.org/packages/release/bioc/html/ATACseqQC.html) والعمليات المقابلة ، ويرجع ذلك أساسًا إلى تعقيد الوقت وقضايا الموثوقية.

تم إصدار الإصدار الأول من خط أنابيب ATAC-seq ، والذي يدعم إنشاء مقاييس مراقبة الجودة ، ومكالمات الذروة ، ومسارات الإشارة للتصور في متصفح الجينوم UCSC.

كما يدعم IDR بين مجموعة من القمم / المحاذاة لمجموعة من التكرارات.

أوراق / روابط لفهم مراقبة الجودة من سلسلة ATAC:

https://github.com/crazyhottommy/ChIP-seq-analysis (مفيد جدًا يحتوي على العديد من الأوراق والروابط لفهم بيانات ChIP-seq و ATAC-seq)

فهم ذروة الاتصال

فهم بصمة TF

فهم تحليل IDR

يجب تثبيت الحزم / المكتبات التالية قبل تشغيل خط الأنابيب هذا:

بيئة R (استخدمنا 3.4.3)

يجب على المستخدم أيضًا تثبيت حزم R التالية ، عن طريق تشغيل الأمر التالي داخل موجه R:

install.packages (c ("optparse" ، "ggplot2" ، "data.table" ، "plotly"))

أدوات PICARD (استخدمنا إصدار 2.8.14 سابقًا كنا نستخدم الإصدار 2.7.1) https://broadinstitute.github.io/picard/

الأدوات المساعدة "bedGraphToBigWig" و "bedSort" و "bigBedToBed" و "hubCheck" و "fetchChromSizes" - للتحميل من مستودع UCSC http://hgdownload.soe.ucsc.edu/admin/exe/linux.x86_64/

هومر (نوصي باستخدام أحدث إصدار) http://homer.ucsd.edu/homer/

حزمة اتاكف (https://github.com/ParkerLab/ataqv). يحتاج المستخدم إلى تنزيل ملف إصدار GitHub (.tar.gz) في مكان مناسب ، واستخراجه ، وتوفير المسار المقابل في ملف التكوين (المذكور أدناه).

يحتاج المستخدم الأول إلى تثبيت الوحدة RGT باستخدام الأوامر التالية:

مجلد rgtdata سيتم إنشاؤه داخل الدليل الرئيسي. الخطوة التالية هي تكوين هذا المجلد عن طريق كتابة الأوامر التالية:

بعد ذلك ، يحتاج المستخدم إلى إعداد بيانات تكوين التصميم ، من خلال تنفيذ الأوامر التالية (يفضل تشغيلها في بيئة qsub / الكتلة)

يجب على المستخدم تضمين مسار المكتبات / الحزم المذكورة أعلاه داخل متغير مسار النظام الخاص بهم. بدلاً من ذلك ، يجب ذكر تثبيت PATHS لبعض هذه الحزم في ملف تكوين منفصل (موضح أدناه)

يجب تثبيت الحزم / المكتبات التالية لتنفيذ كود IDR

IDRCode (https://drive.google.com/file/d/0B_ssVVyXv8ZSX3luT0xhV3ZQNWc/view؟usp=sharing). يجب على المستخدم فك ضغط الأرشيف وتخزينه في مكان مناسب. يتم توفير مسار هذا الحساب لتنفيذ كود IDR.

يجب على المستخدم أولاً استنساخ خط الأنابيب هذا في مكان مناسب ، باستخدام الأمر التالي:

يحتوي نموذج البرنامج النصي "pipeline_exec.sh" على أوامر تنفيذ أساسية ، لاستدعاء "pipeline.sh" القابل للتنفيذ الرئيسي (الموجود داخل المجلد "bin"). يحتوي الملف القابل للتنفيذ على خيارات سطر الأوامر التالية:

إدخالات في ملف التكوين (المعلمة الأولى)

يتبع ملف التكوين معلمة التنسيق = القيمة

ويتم تعبئتها بالقيود التالية:

وصف ناتج خط أنابيب ATAC-seq

داخل المجلد OutDir (محدد بواسطة خيار التكوين -d) الملفات التالية (f) والمجلدات (F) موجودة:

تلخيص مجموعة عينات ATAC-seq

لنفترض أن الدليل "/ home / sourya / Results" يحتوي بداخله على المجلدات التالية: 1 ، 2 ، 3 ، 4 ،. كل مناظر لإخراج معالجة عينات ATAC-seq الفردية.

للحصول على قائمة ملخصة لمقاييس الأداء لهذه العينات ، استخدم البرنامج النصي تحليل / ResSummary.r، باستخدام الصيغة التالية.

أمر لتنفيذ رموز IDR

يدعم خط الأنابيب الحالي تحليل IDR إما بين قائمة ملفات الذروة ATAC-seq أو بين قائمة ملفات المحاذاة (BAM). في الحالة الثانية ، يتم أولاً تحليل ملفات BAM وتقسيمها إلى عينات فرعية لتحتوي على عدد متساوٍ من القراءات (الحد الأدنى لعدد القراءات الواردة في المدخلات) ، وبعد ذلك ، يتم تقدير القمم من ملفات BAM (القائمة على عينات فرعية) باستخدام MACS2. ثم يتم تطبيق هذه القمم لتحليل IDR.

يوضح البرنامج النصي "sample_IDRScript.sh" المضمن في هذه الحزمة استدعاء الوظيفتين التاليتين (كلاهما مضمنان في المجلد "IDR_Codes"):

وصف ناتج تحليل IDR

في دليل الإخراج المحدد "OutDir" المذكور في البرنامج النصي IDR ، توجد الملفات التالية (f) والمجلدات (F):

لأية استفسارات ، يرجى إنشاء مشكلة GitHub ، أو بدلاً من ذلك ، مراسلتنا عبر البريد الإلكتروني:


مناقشة

تُستخدم تجارب ChIP-seq بشكل متزايد للتحقيق في كيفية تنظيم TFs المرتبطة بالحمض النووي المرتبطة بالتسلسل التعبير الجيني. في هذا التقرير ، نقدم "zingers": أربع فئات من TFBSs تعرض إثراءًا كبيرًا لموقع الربط ، بشكل غير متوقع قريب من الذروة القصوى ، عبر تجارب ربط ChIP-seq لـ TFs الأخرى. ضمن تجارب TF ChIP-seq الفردية ، لوحظ ما يصل إلى 45 ٪ من القمم التي تفتقر إلى نموذج ربط TF الكنسي وتحتوي على شكل زنجر ، بمتوسط ​​12 ٪ (متوسط ​​9 ٪). على الرغم من التحيز إلى قمم الدرجات المنخفضة في بيانات TF ChIP-seq الأخرى ، فإن نفس المناطق المرتبطة بالزنجر تميل إلى أن تكون قممًا عالية الدرجات داخل مجموعات البيانات ChIPped لـ Zinger TF مما يشير إلى أن هذه المناطق مرتبطة على الأرجح بـ Zinger TF. تُشتق قمم الزنجر من 257،631 منطقة (أحياء) في الجينوم ، 36٪ منها يُلاحظ بشكل متكرر عبر مجموعات البيانات الخاصة بـ TFs المتنوعة ، في تناقض حاد مع الأحياء التي تحتوي فقط على شكل ChIPped TF ، والذي يتكرر بشكل غير متكرر نسبيًا. يتم أيضًا ملاحظة بعض المناطق التي تفتقر إلى كل من شكل ChIPped TF وتصميم الزنجر بشكل متكرر. يتم وضع كل من عزر الزنجر والأحياء غير المحددة بالقرب من المناطق الهيكلية المحددة من خلال وجود مجمعات مجموعة cohesin و polycomb. سيكون حساب مساهمة المناطق المرتبطة بـ Zinger في الدراسات العالمية للتسلسلات التنظيمية بمثابة اعتبار للتحليل المستقبلي لبيانات ChIP-seq.

لا يزال يتعين حل فهم الآلية الكيميائية الحيوية الأساسية التي يتم من خلالها ملاحظة المناطق المرتبطة بـ Zinger عبر مجموعات البيانات المتنوعة هذه. ومع ذلك ، بناءً على النتائج الواردة في هذا التحقيق ، نقدم نموذج "محطة التحميل" بما يتوافق مع حالة فهمنا (الشكل 6). يُقترح بروتينات Cohesin / polycomb و zinger للمشاركة في ترسيم وتثبيت التفاعلات بين الأجزاء للحمض النووي التي ترتبط بها TFs. في هذه "المحطات" ، قد يكون ChIPped TF موجودًا عبر تفاعلات مباشرة (الشكل 6 ب) أو غير مباشرة (الشكل 6 ج) مع الحمض النووي ، وإما في رابطة الدول المستقلة- أو عبر- الترتيبات مع Zinger TFBS. في تجربة ChIP ، بافتراض الارتباط التساهمي لـ ChIPped TF والحمض النووي المترابط ، يمكن أن تظهر أنماط إثراء الزخرفة التي لوحظت في هذا التقرير ، بما في ذلك وجود أو عدم وجود زخارف لكل من ChIPped TF و zinger. بدلاً من ذلك ، أو ربما في تركيبة ، قد توجد مناطق تحتوي على الزنجر (الشكل 6 د) حيث توجد العديد من البروتينات (على مستوى سكان الخلية). قد تحتوي مثل هذه المناطق على نطاق متنوع من الحواتم وبالتالي يكون من المرجح أن يتم استعادتها في تجارب ChIP-seq ، خاصة مع الأجسام المضادة متعددة النسيلة. ضمن هذا النموذج ، قد "تزور" فرق العمل مناطق cohesin و zinger المميزة ، مما يؤدي إلى استعادة منخفضة ولكن متسقة للقراءات في تجربة ChIP-seq. يراعي النموذج الاكتشاف المتكرر لقمم الزنجر ، وقرب القمم من مناطق تفاعل التماسك ، ولماذا قد تكون أشكال الزنجر موجودة في التسلسل حتى عندما يكون شكل ChIPped TF غائبًا.

نموذج لحساب إثراء الزنجر عبر مجموعات بيانات ChIP-seq. تم تقديم نموذج محطة تحميل TF متوافق مع الإثراء الملحوظ لأشكال الزنجر عبر بيانات وخطوط خلوية TF ChIP-seq متنوعة. يمثل الشكل البيضاوي الأزرق الداكن ChIPped TF ، ويمثل الشكل البيضاوي الأرجواني الزنجر ، وتمثل الأشكال البيضاوية الملونة المتبقية TFs أو البروتينات أو المجمعات الأخرى التي تتعامل مع الحمض النووي ، وتمثل الحلقة الحمراء بروتينات مجموعة cohesin و polycomb. الخيوط الرمادية هي الكروماتين. (أ) نظرة عامة على محطة التحميل. قد تتفاعل بروتينات متعددة داخل منطقة محلية ، والتي قد تتشتت منها TFs للبحث عن مناطق تنظيمية أخرى. Zingers والمكونات الهيكلية مثل بروتينات مجموعة cohesin و polycomb هي السمات الرئيسية. تقدم اللوحات B و C و D سيناريوهات محددة يمكن بموجبها استعادة مقاطع محطة تحميل DNA في تجربة ChIP-seq. (ب) الربط المباشر. يرتبط ChIPped TF مباشرة بـ TFBS ، بينما يوجد شكل زنجر في عبر (علوي) أو في رابطة الدول المستقلة (أدنى). (ج) الربط غير المباشر. يوجد ChIPped TF بسبب تفاعل غير مباشر ، يتضمن بروتين وسيط. شكل الزنجر موجود مرة أخرى في عبر (علوي) أو في رابطة الدول المستقلة (أدنى). (د) أحداث غير محددة. توجد العديد من البروتينات في محطة التحميل ، مما يوفر وفرة من الحواتم ، وبالتالي زيادة احتمالية استردادها في تجربة ChIP-seq.

من منظور ميكانيكي أوسع ، تتوافق آلية محطة التحميل مع نظرية "القفز والتخطي" لكيفية قيام TFs بالبحث في النواة بكفاءة للوصول إلى TFBSs الخاصة بهم [27]. نموذج محطة التحميل المقترحة مدعوم في الأدبيات الحديثة. فور وآخرون.[23] اقترح دورًا لل cohesin في تثبيت مجمعات البروتين والحمض النووي الكبيرة. بينما كانت هذه المخطوطة قيد المراجعة ، Taipale وآخرون.[28] نشرت دراسة باستخدام خط خلية LoVo مما يشير إلى أن cohesin يشارك في إبقاء الكروماتين مفتوحًا أثناء انقسام الخلية لتسهيل انتقال TFs مرة أخرى إلى تلك المناطق بمجرد اكتمال الانقسام.

يجب تقييم محتوى Zinger لكل مجموعة بيانات ChIP-seq ، بما يتوافق مع الجهود المتزايدة لإجراء تقييم نقدي لهذه البيانات [12] ، [29] ، [30]. على سبيل المثال ، تتجاوز مجموعة بيانات STAT1 (GM12878) ChIP-seq 30٪ من القمم بزخارف زنجر قريبة من الذروة القصوى ، بينما تحدث أشكال STAT1 فقط عند تردد الخلفية. نقترح نهجًا عامًا لدراسة محتوى الزنجبيل. لكل مجموعة بيانات ChIP-seq ، يجب مسح مناطق الذروة بحثًا عن وجود شكل ChIPped TF بالقرب من الذروة Max. يجب مقارنة القمم التي تفتقر إلى شكل ChIPped TF بأحياء Zinger المتكررة (ملف إضافي 12: Dataset S1). يعطي جزء مجموعة البيانات المتداخلة بين الأحياء نظرة ثاقبة للخصوصية الإجمالية للتجربة.


بيانات الشرح

تتوفر التعليقات التوضيحية المختلفة على صفحة مجموعات البيانات Isophonics ولكن يُنصح بمتابعة القراءة أدناه لفهم التعليقات التوضيحية وكيفية اشتقاقها.

تنقسم التعليقات التوضيحية المنشورة هنا إلى أربع فئات: الأوتار ، والمفاتيح ، والتجزئة الهيكلية ، والنغمات / الأشرطة. الهدف هو السماح باسترجاع معلومات الموسيقى التي تحركها الموسيقى من خلال الجمع بين العديد من الميزات المرتبطة ارتباطًا جوهريًا. بالطبع ، يمكنك أيضًا استخدام التعليقات التوضيحية لميزة موسيقية واحدة بشكل منفصل.

ننشر جميع البيانات بطريقتين مختلفتين جوهريًا ، وهما تنسيق نص عادي (بامتداد .lab أو .txt ، اعتمادًا على نوع البيانات) و RDF. بيانات RDF ليست سهلة القراءة للإنسان ، ولكنها تسمح باستخدام البيانات في سياق ويب دلالي أوسع. لاحظ أنه بينما يتم توفير البيانات النصية كملفات منفصلة لكل أغنية وكل ميزة ، لا يوجد سوى ملف RDF واحد لكل أغنية. شريطة أن يكون لديك ملف الصوت الأصلي ، يمكن فتح ملف RDF مباشرةً في Sonic Visualiser ، وسيتم عرض جميع التعليقات التوضيحية لتلك الأغنية.

نحن فخورون بنشر هذه البيانات ، ولكن يرجى العلم أنها لن تكون "صحيحة" تمامًا ، وذلك لعدة أسباب:

  • الموسيقى دائمًا ما تكون غامضة ، وسيسمع الأشخاص المختلفون أشياء مختلفة في نفس الموسيقى ، لذلك يمكن أن تعكس التسمية فقط الحقيقة المتصورة لشخص أو مجموعة من الأشخاص ،
  • الوسيط الذي نقدم فيه التعليقات التوضيحية ليس مثاليًا ، وربما يستمر تحسين بناء الجملة والطريقة التي يتم بها شرح ميزاتنا بشكل عام ، وأخيرًا
  • قد تحدث أخطاء مطبعية وأخطاء أخرى بسبب التفسير الخاطئ للمضيف التوضيحي (التي تتجاوز الاختلاف في الإدراك كما هو مذكور أعلاه).

تأتي التعليقات التوضيحية مع "تسميات الثقة" (انظر أدناه ، وفي ملفات RDF الفردية) ، لإخبارك إلى أي مدى نعتقد أن هذا المصدر "الخطأ المطبعي" الأخير ملائم.

تجد أدناه ملاحظات أكثر تحديدًا لأنواع التعليقات التوضيحية الفردية للملفات النصية. يجب أن تكون ملفات RDF تشرح نفسها للمستخدم الخبير.

الحبال

يجب الالتزام بتركيب كريس هارت المفصل في أطروحة الدكتوراه لعام 2010 [2] (التي تحل محل ورقة اقتراح ISMIR لعام 2005 [3]). ملفات .lab هي ملفات نصية محددة بمسافات بيضاء بثلاثة أعمدة ، تتوافق مع وقت البداية ووقت الإزاحة وتسمية الوتر ، على التوالي. حكم ثقتنا:

  • البيتلز: تم التحقق منه عدة مرات بواسطة كريستوفر هارت ومجتمع MIR ، استخدمه بثقة.
  • Zweieck ، الملكة: راجعه ماتياس ، استخدمه بثقة معتدلة.
  • كارول كينج: لم يتم فحصها بعناية ، استخدمها بحذر.

الانقسامات

هذه عبارة عن تقسيمات هيكلية ، وآيات وضع العلامات ، والجوقات ، والامتناع ، وما إلى ذلك. ملفات .lab عبارة عن ملفات نصية ذات مسافات بيضاء بثلاثة أعمدة ، تتوافق مع وقت البداية ، ووقت الإزاحة ، وتسمية المقطع ، على التوالي. يبدأ كل جزء من حدود الشريط ، ويجب أن تكون حدود القسم موثوقة تمامًا. عادةً ما يتم التعامل مع الأجزاء (مثل الآية) التي يتم تكرارها جزئيًا (ربما لاحقًا في الأغنية) ولكنها تظهر على أنها جزء واحد ، أي لا توجد أقسام فرعية. ومع ذلك ، فإن التسمية ليست متسقة للغاية حتى الآن (لاحظ تسميات "الصمت") ، لذا فإن استخدام التسميات لتقييم ما إذا كانت الخوارزمية تكتشف بشكل صحيح أن جزأين "متماثلان" قد يسبب الحزن. عموما استخدم بعناية.

تشير هذه التسميات إلى مناطق الدرجة اللونية في الأغنية. ملفات .lab هي ملفات نصية محددة بمسافات بيضاء بثلاثة أعمدة ، تتوافق مع وقت البداية ووقت الإزاحة وتسمية المفتاح ، على التوالي. بشكل عام ، استخدم بحذر ، خاصة مفاتيح البيتلز: سيتم دائمًا تعليق المفتاح الرئيسي ، ولكن قد يتم حذف التغييرات الرئيسية في بعض الملفات.

  • الملكة ، زفايك ، كارول كينغ: فحصه ماتياس ماوخ ، استخدمه بثقة معتدلة.
  • البيتلز: غالبًا ما يتم إعطاء المفتاح الرئيسي فقط. قد يكون المفتاح الوحيد أو قد لا يكون كذلك. استخدم بعناية.

يدق

تأتي ملفات الإيقاع كملفات .txt ذات مسافات بيضاء ، والتي يشير العمود الأول إلى وقت الضرب ، والعمود الثاني هو موضع القياس. يمكن اشتقاق ملصقات الشريط من ذلك باستخدام الأوقات التي يكون فيها موضع المقياس "1" فقط.

  • البيتلز: فحصه ماثيو ديفيز. استخدم بثقة معتدلة.
  • زفايك: فحصته هيلينا دو تويت وماتياس ماوخ. استخدم بثقة معتدلة.

صوتي

استخدمنا الصوت كما هو موفر على الأقراص المضغوطة التالية:

  • كارول كينج: نسيج ، تسجيلات أودي ، 4931802003
  • الملكة: Greatest Hits I، Parlophone، 0777 7 8950424
  • الملكة: Greatest Hits II، Parlophone، CDP 7979712
  • الملكة: Greatest Hits III، Parlophone، 7243 52389421
  • The Beatles: Please Me، CDP 7 46435 2
  • البيتلز: مع البيتلز ، CDP 7 464362
  • The Beatles: A Hard Day’s Night ، CDP 7 464372
  • البيتلز: البيتلز للبيع ، CDP 7 46438 2
  • البيتلز: مساعدة !، CDP 7 46439 2
  • البيتلز: روح المطاط ، CDP 746440 2
  • البيتلز: مسدس ، CDP 7 46441 2
  • البيتلز: الرقيب. فرقة Pepper’s Lonely Hearts Club ، CDP 7 46442 2
  • The Beatles: Magical Mystery Tour، CDP 748062 2
  • The Beatles: The Beatles (the white Album)، CDS 7 46443 8
  • البيتلز: Abbey Road ، CDP 7 46446 2
  • The Beatles: Let It Be، CDP 7 46447 2
  • Zweieck: Zwielicht (الاتصال للحصول على معلومات أو للشراء)

كيف تعلق على ملف .broadpeak مع 9 أعمدة؟ - مادة الاحياء

أمثلة على ملفات الإدخال تحت البيانات. يوجد مثال على البرنامج النصي هنا: example.sh

يشرح المتغيرات في MAF (https://docs.gdc.cancer.gov/Data/File_Formats/MAF_Format/) مع تعليق OncoKB. يدعم كلا من python2 و python3.
احصل على مزيد من التفاصيل حول سطر الأوامر باستخدام python MafAnnotator.py -h.

نوصي بمعالجة ملفات VCF بواسطة vcf2maf باستخدام الأشكال الإسوية OncoKB قبل استخدام MafAnnotator هنا.

لا يزال بإمكانك استخدام تنسيق MAF للتعليق على التعديلات غير النمطية ، مثل MSI-H و TMB-H و EGFR vIII. يرجى الاطلاع على المزيد من الأمثلة هنا.

احصل على مزيد من التفاصيل حول سطر الأوامر باستخدام python CnaAnnotator.py -h.

تقدم OncoKB للإعلان عن البديل البنيوي. لكن في التعليقات التوضيحية ، نقوم فقط بتوضيح الاندماج الوظيفي. تنسيق الاندماج للحذف داخل الجين هو GENE-intragenic أو GENE-GENE. بالنسبة لعمليات الاندماج الأخرى ، يُرجى استخدام GENEA-GENEB أو GENEA-GENEB Fusion.

احصل على مزيد من التفاصيل حول سطر الأوامر باستخدام python FusionAnnotator.py -h.

البيانات السريرية (تجمع بين MAF + CNA + Fusion)

يمكنك إعادة جميع التعليقات التوضيحية على مستوى العينة / المريض باستخدام شرح البيانات السريرية.

احصل على مزيد من التفاصيل حول سطر الأوامر باستخدام python ClinicalDataAnnotator.py -h.

علق باستخدام HGVSp_Short أو HGVSp أو HGVSg أو التغيير الجيني

يدعم OncoKB MafAnnotator شرح التعديل باستخدام تنسيق HGVSp أو HGVSp_Short أو HGVSg أو Genomic Change. الرجاء تحديد نوع الاستعلام مع المعلمة -q. القيم المقبولة هي HGVSp_Short و HGVSp و HGVSg و Genomic_Change (غير حساس لحالة الأحرف). يرجى الاطلاع على البيانات / example.sh للحصول على أمثلة.
إذا لم تحدد نوع الاستعلام ، سيحاول MafAnnotator معرفة نوع الاستعلام بناءً على الرؤوس.

بالنسبة إلى HGVSp_Short ، يأخذ مضيف التعليقات التغيير من العمود HGVSp_Short أو Alteration
بالنسبة إلى HGVSp ، يأخذ مضيف التعليقات التغيير من العمود HGVSp أو Alteration
بالنسبة إلى HGVSg ، يأخذ مضيف التعليقات التغيير من العمود HGVSg أو Alteration
بالنسبة إلى Genomic_Change ، يأخذ المعلق التوضيحي التغيير الجيني من الأعمدة Chromosome و Start_Position و End_Position و Reference_Allele1 و Tumor_Seq_Allele2.

التعليق التوضيحي باستخدام Genomic_Change بطيء نسبيًا. نحتاج إلى وضع تعليق توضيحي على المتغير أولاً باستخدام GenomeNexus (https://www.genomenexus.org/) ثم الحصول على تعليق توضيحي واحدًا تلو الآخر. هناك خطة لتحسين هذه الطريقة. إذا كنت تعلق على الكثير من البيانات ، فالرجاء إعطاء الأولوية لاستخدام نوع استعلام آخر إن أمكن.

علق باستخدام جينومات مرجعية مختلفة (GRCh37 ، GRCh38)

يدعم OncoKB MafAnnotator شرح التغيير باستخدام الجينوم المرجعي GRCh37 و GRCh38.

سيحصل المعلق على الجينوم المرجعي من عمود ملف MAF NCBI_Build أو Reference_Genome.
إذا لم يكن هناك جينوم مرجعي محدد في الملف ، فسنستخدم الجينوم المرجعي الافتراضي من خلال المعلمة -r.

يمكنك تحديد جينوم المرجع الافتراضي باستخدام المعلمة -r (ينطبق هذا فقط على MafAnnotator.py).
القيم المقبولة هي GRCh37 و GRCh38 (حساسة لحالة الأحرف).

إذا لم يتم تحديد كلا القيمتين ، فسيستخدم مضيف التعليقات الجينوم المرجعي الافتراضي OncoKB وهو GRCh37.



تعليقات:

  1. Voodooshakar

    هل يجب أن تفهم أنها كتبت؟

  2. Barra

    استجاب بسرعة :)

  3. Faumi

    It will be the last drop.



اكتب رسالة