معلومة

12.3: علم الجينوم والبروتيوميات - علم الأحياء

12.3: علم الجينوم والبروتيوميات - علم الأحياء


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

بدأت دراسة الأحماض النووية باكتشاف الحمض النووي ، وتقدمت إلى دراسة الجينات والشظايا الصغيرة ، وانتشرت الآن في مجال علم الجينوم. علم الجينوم هو دراسة الجينوم بأكمله ، بما في ذلك المجموعة الكاملة من الجينات ، وتسلسل النوكليوتيدات وتنظيمها ، وتفاعلاتها داخل الأنواع ومع الأنواع الأخرى. أصبح التقدم في علم الجينوم ممكنًا بفضل تقنية تسلسل الحمض النووي. تمامًا كما أدت تكنولوجيا المعلومات إلى خرائط Google التي تمكننا من الحصول على معلومات مفصلة حول المواقع في جميع أنحاء العالم ، يتم استخدام المعلومات الجينومية لإنشاء خرائط مماثلة للحمض النووي للكائنات المختلفة.

رسم خرائط الجينوم

رسم خرائط الجينوم هو عملية العثور على موقع الجينات على كل كروموسوم. الخرائط التي يتم إنشاؤها قابلة للمقارنة مع الخرائط التي نستخدمها للتنقل في الشوارع. الخريطة الجينية هي توضيح يسرد الجينات وموقعها على الكروموسوم. تقدم الخرائط الجينية الصورة الكبيرة (على غرار خريطة الطرق السريعة بين الولايات) وتستخدم العلامات الجينية (على غرار المعالم). الواسمات الجينية هي جين أو تسلسل على كروموسوم يُظهر ارتباطًا جينيًا مع سمة مثيرة للاهتمام. تميل العلامة الجينية إلى أن تكون موروثة مع الجين المعني ، وأحد مقاييس المسافة بينهما هو تكرار إعادة التركيب أثناء الانقسام الاختزالي. أطلق علماء الوراثة الأوائل على تحليل الارتباط هذا.

تدخل الخرائط المادية في التفاصيل الدقيقة للمناطق الأصغر من الكروموسومات (على غرار خارطة الطريق التفصيلية) (الشكل 10.3.1). الخريطة المادية هي تمثيل للمسافة المادية ، في النيوكليوتيدات ، بين الجينات أو العلامات الجينية. كل من خرائط الارتباط الجيني والخرائط المادية مطلوبة لبناء صورة كاملة للجينوم. إن وجود خريطة كاملة للجينوم يجعل من السهل على الباحثين دراسة الجينات الفردية. تساعد خرائط الجينوم البشري الباحثين في جهودهم لتحديد الجينات المسببة للأمراض البشرية والمتعلقة بأمراض مثل السرطان وأمراض القلب والتليف الكيسي ، على سبيل المثال لا الحصر. بالإضافة إلى ذلك ، يمكن استخدام خرائط الجينوم للمساعدة في تحديد الكائنات الحية ذات السمات المفيدة ، مثل الميكروبات التي لديها القدرة على تنظيف الملوثات أو حتى منع التلوث. قد تؤدي الأبحاث التي تنطوي على رسم خرائط الجينوم النباتي إلى طرق تنتج غلات محاصيل أعلى أو إلى تطوير نباتات تتكيف بشكل أفضل مع تغير المناخ.

توفر الخرائط الجينية المخطط التفصيلي ، وتوفر الخرائط المادية التفاصيل. من السهل أن نفهم سبب أهمية كلا النوعين من تقنيات رسم خرائط الجينوم لإظهار الصورة الكبيرة. يتم استخدام المعلومات التي تم الحصول عليها من كل تقنية في تركيبة لدراسة الجينوم. يتم استخدام رسم الخرائط الجينومية مع الكائنات الحية النموذجية المختلفة المستخدمة في البحث. لا يزال رسم خرائط الجينوم عملية مستمرة ، ومع تطوير تقنيات أكثر تقدمًا ، من المتوقع حدوث المزيد من التقدم. يشبه رسم خرائط الجينوم إكمال لغز معقد باستخدام كل جزء من البيانات المتاحة. يتم إدخال معلومات الخرائط التي تم إنشاؤها في المختبرات في جميع أنحاء العالم في قواعد البيانات المركزية ، مثل المركز الوطني لمعلومات التكنولوجيا الحيوية (NCBI). تُبذل الجهود لجعل الوصول إلى المعلومات أسهل للباحثين وعامة الناس. تمامًا كما نستخدم أنظمة تحديد المواقع العالمية بدلاً من الخرائط الورقية للتنقل عبر الطرق ، يسمح لنا NCBI باستخدام أداة عارض الجينوم لتبسيط عملية استخراج البيانات.

المفهوم في العمل

الوراثة المندلية في الإنسان عبر الإنترنت (OMIM) عبارة عن كتالوج عبر الإنترنت يمكن البحث فيه عن الجينات البشرية والاضطرابات الوراثية. يعرض موقع الويب هذا رسم خرائط الجينوم ، ويفصل أيضًا التاريخ والبحث عن كل سمة واضطراب. انقر فوق الارتباط للبحث عن السمات (مثل استخدام اليدين) والاضطرابات الوراثية (مثل مرض السكري).

تسلسل الجينوم الكامل

على الرغم من حدوث تقدم كبير في العلوم الطبية في السنوات الأخيرة ، لا يزال الأطباء مرتبكين بسبب العديد من الأمراض ويستخدم الباحثون تسلسل الجينوم الكامل للوصول إلى جوهر المشكلة. تسلسل الجينوم الكامل هو عملية تحدد تسلسل الحمض النووي للجينوم بأكمله. تسلسل الجينوم الكامل هو نهج القوة الغاشمة لحل المشكلات عندما يكون هناك أساس وراثي في ​​جوهر المرض. تقدم العديد من المختبرات الآن خدمات لتسلسل الجينوم بأكمله وتحليله وتفسيره.

في عام 2010 ، تم استخدام تسلسل الجينوم الكامل لإنقاذ صبي صغير كانت أمعائه تعاني من عدة خراجات غامضة. خضع الطفل لعدة عمليات في القولون دون راحة. أخيرًا ، كشف تسلسل الجينوم الكامل عن وجود خلل في المسار الذي يتحكم في موت الخلايا المبرمج (موت الخلية المبرمج). تم استخدام زرع نخاع العظم للتغلب على هذا الاضطراب الوراثي ، مما أدى إلى علاج للصبي. كان أول شخص يتم تشخيصه بنجاح باستخدام تسلسل الجينوم الكامل.

كانت الجينومات الأولى التي تم تسلسلها ، مثل تلك التي تنتمي إلى الفيروسات والبكتيريا والخميرة ، أصغر من حيث عدد النيوكليوتيدات من جينومات الكائنات متعددة الخلايا. جينومات الكائنات الحية النموذجية الأخرى ، مثل الفأر (موس العضلات) ذبابة الفاكهة (ذبابة الفاكهة سوداء البطن) والديدان الخيطية (أنواع معينة انيقة) معروفة الآن. يتم إجراء قدر كبير من الأبحاث الأساسية في الكائنات الحية النموذجية لأن المعلومات يمكن تطبيقها على كائنات أخرى. الكائن النموذجي هو نوع تمت دراسته كنموذج لفهم العمليات البيولوجية في الأنواع الأخرى التي يمكن أن يمثلها الكائن الحي النموذجي. على سبيل المثال ، ذبابة الفاكهة قادرة على استقلاب الكحول مثل البشر ، لذلك تمت دراسة الجينات التي تؤثر على الحساسية للكحول في ذباب الفاكهة في محاولة لفهم التباين في الحساسية للكحول لدى البشر. يساعد وجود تسلسل جينوم كامل في جهود البحث في هذه الكائنات الحية النموذجية (الشكل 10.3.2).

نُشر أول تسلسل للجينوم البشري في عام 2003. ويزداد عدد الجينومات الكاملة التي تم تسلسلها باطراد ، وهي تشمل الآن مئات الأنواع وآلافًا من الجينوم البشري الفردي.

تطبيق علم الجينوم

أدى إدخال تسلسل الحمض النووي ومشاريع تسلسل الجينوم الكامل ، ولا سيما مشروع الجينوم البشري ، إلى توسيع نطاق تطبيق معلومات تسلسل الحمض النووي. يتم الآن استخدام علم الجينوم في مجموعة متنوعة من المجالات ، مثل علم الجينوميات ، وعلم الجينوم الصيدلاني ، وجينوميات الميتوكوندريا. إن أكثر تطبيقات علم الجينوم شيوعًا هو فهم الأمراض وإيجاد علاجات لها.

توقع مخاطر المرض على المستوى الفردي

يتضمن التنبؤ بمخاطر المرض فحص وتحديد الأفراد الأصحاء حاليًا من خلال تحليل الجينوم على المستوى الفردي. يمكن التوصية بالتدخل في تغييرات نمط الحياة والأدوية قبل ظهور المرض. ومع ذلك ، فإن هذا النهج هو الأكثر قابلية للتطبيق عندما تنشأ المشكلة من طفرة جينية واحدة. تمثل هذه العيوب حوالي 5 في المائة فقط من الأمراض الموجودة في البلدان المتقدمة. معظم الأمراض الشائعة ، مثل أمراض القلب ، متعددة العوامل أو متعددة الجينات ، مما يشير إلى خاصية نمطية تحددها جينات أو أكثر ، وكذلك عوامل بيئية مثل النظام الغذائي. في أبريل 2010 ، نشر العلماء في جامعة ستانفورد تحليل الجينوم لفرد سليم (ستيفن كوايك ، عالم في جامعة ستانفورد ، الذي حصل على تسلسل الجينوم الخاص به) ؛ توقع التحليل ميله إلى الإصابة بأمراض مختلفة. تم إجراء تقييم للمخاطر لتحليل النسبة المئوية لمخاطر Quake لـ 55 حالة طبية مختلفة. تم العثور على طفرة جينية نادرة أظهرت أنه معرض لخطر الإصابة بنوبة قلبية مفاجئة. وتوقع أيضا أن يكون لديه 23 في المائة من مخاطر الإصابة بسرطان البروستاتا و 1.4 في المائة للإصابة بمرض الزهايمر. استخدم العلماء قواعد البيانات والعديد من المنشورات لتحليل البيانات الجينومية. على الرغم من أن التسلسل الجيني أصبح ميسور التكلفة بشكل أكبر وأصبحت الأدوات التحليلية أكثر موثوقية ، لا تزال القضايا الأخلاقية المحيطة بالتحليل الجينومي على مستوى السكان بحاجة إلى المعالجة. على سبيل المثال ، هل يمكن استخدام هذه البيانات بشكل شرعي لتحصيل رسوم أكثر أو أقل للتأمين أو للتأثير على التصنيفات الائتمانية؟

دراسات الارتباط على مستوى الجينوم

منذ عام 2005 ، أصبح من الممكن إجراء نوع من الدراسة يسمى دراسة الارتباط على مستوى الجينوم ، أو GWAS. GWAS هي طريقة تحدد الاختلافات بين الأفراد في تعدد أشكال النوكليوتيدات المفردة (SNPs) التي قد تكون متورطة في التسبب في الأمراض. هذه الطريقة مناسبة بشكل خاص للأمراض التي قد تتأثر بتغير جيني واحد أو أكثر في جميع أنحاء الجينوم. من الصعب للغاية تحديد الجينات المرتبطة بمثل هذا المرض باستخدام معلومات تاريخ العائلة. تعتمد طريقة GWAS على قاعدة بيانات جينية قيد التطوير منذ عام 2002 تسمى مشروع HapMap الدولي. قام مشروع HapMap بتسلسل جينومات عدة مئات من الأفراد من جميع أنحاء العالم وحدد مجموعات من النيوكلوتايد. تتضمن المجموعات SNPs الموجودة بالقرب من بعضها البعض على الكروموسومات بحيث تميل إلى البقاء معًا من خلال إعادة التركيب. حقيقة أن المجموعة تبقى معًا تعني أن تحديد SNP علامة واحدة هو كل ما هو مطلوب لتحديد جميع SNPs في المجموعة. تم تحديد عدة ملايين من تعدد الأشكال ، ولكن تحديدها في الأفراد الآخرين الذين لم يتم تسلسل الجينوم الكامل لديهم أسهل بكثير لأنه لا يلزم تحديد سوى علامة SNPs.

في تصميم مشترك لـ GWAS ، يتم اختيار مجموعتين من الأفراد ؛ مجموعة واحدة مصابة بالمرض والمجموعة الأخرى لا. يتم مطابقة الأفراد في كل مجموعة في خصائص أخرى لتقليل تأثير المتغيرات المربكة التي تسبب اختلافات بين المجموعتين. على سبيل المثال ، قد تختلف الأنماط الجينية لأن المجموعتين مأخوذة في الغالب من أجزاء مختلفة من العالم. بمجرد اختيار الأفراد ، وعادة ما تكون أعدادهم ألفًا أو أكثر حتى تنجح الدراسة ، يتم الحصول على عينات من الحمض النووي الخاص بهم. يتم تحليل الحمض النووي باستخدام أنظمة مؤتمتة لتحديد الفروق الكبيرة في نسبة تعدد الأشكال الخاصة بين المجموعتين. غالبًا ما تفحص الدراسة مليون أو أكثر من النيوكلوتايد في الحمض النووي. يمكن استخدام نتائج GWAS بطريقتين: يمكن استخدام الاختلافات الجينية كعلامات للتعرض للمرض لدى الأفراد غير المشخصين ، ويمكن أن تكون الجينات المحددة المحددة أهدافًا للبحث في المسار الجزيئي للمرض والعلاجات المحتملة. كان أحد فروع اكتشاف ارتباطات الجينات بالأمراض هو تكوين الشركات التي توفر ما يسمى بـ "الجينوميات الشخصية" التي ستحدد مستويات المخاطر للأمراض المختلفة بناءً على مكمل النيوكليوتيد SNP للفرد. العلم وراء هذه الخدمات مثير للجدل.

نظرًا لأن GWAS تبحث عن الارتباطات بين الجينات والأمراض ، فإن هذه الدراسات توفر بيانات لأبحاث أخرى في الأسباب ، بدلاً من الإجابة على أسئلة محددة بأنفسهم. لا يعني الارتباط بين الاختلاف الجيني والمرض بالضرورة وجود علاقة السبب والنتيجة. ومع ذلك ، قدمت بعض الدراسات معلومات مفيدة حول الأسباب الجينية للأمراض. على سبيل المثال ، حددت ثلاث دراسات مختلفة في عام 2005 جينًا لبروتين يشارك في تنظيم الالتهاب في الجسم المرتبط بالعمى المسبب لمرض يسمى التنكس البقعي المرتبط بالعمر. فتح هذا إمكانيات جديدة للبحث في سبب هذا المرض. تم تحديد عدد كبير من الجينات المرتبطة بمرض كرون باستخدام GWAS ، وقد اقترح بعضها آليات افتراضية جديدة لسبب المرض.

علم الجينات الصيدلية

يتضمن علم الصيدلة الجينومي تقييم فعالية الأدوية وسلامتها على أساس المعلومات من التسلسل الجيني للفرد. يمكن استخدام معلومات تسلسل الجينوم الشخصي لوصف الأدوية الأكثر فعالية والأقل سمية على أساس التركيب الجيني للمريض الفردي. يمكن أن توفر دراسة التغييرات في التعبير الجيني معلومات حول ملف النسخ الجيني في وجود الدواء ، والتي يمكن استخدامها كمؤشر مبكر على احتمالية التأثيرات السامة. على سبيل المثال ، يمكن أن تؤدي الجينات المشاركة في النمو الخلوي وموت الخلايا المتحكم فيه ، عند الاضطراب ، إلى نمو الخلايا السرطانية. يمكن أن تساعد الدراسات على مستوى الجينوم أيضًا في العثور على جينات جديدة متورطة في سمية الأدوية. قد لا تكون التواقيع الجينية دقيقة تمامًا ، ولكن يمكن اختبارها بشكل أكبر قبل ظهور الأعراض المرضية.

Metagenomics

تقليديا ، تم تدريس علم الأحياء الدقيقة مع الرأي القائل بأنه من الأفضل دراسة الكائنات الحية الدقيقة في ظل ظروف الاستزراع البحت ، والتي تتضمن عزل نوع واحد من الخلايا وزراعته في المختبر. نظرًا لأن الكائنات الحية الدقيقة يمكن أن تمر عبر عدة أجيال في غضون ساعات ، فإن ملفات تعريف التعبير الجيني الخاصة بها تتكيف مع بيئة المختبر الجديدة بسرعة كبيرة. من ناحية أخرى ، تقاوم العديد من الأنواع الاستزراع بمعزل عن غيرها. لا تعيش معظم الكائنات الحية الدقيقة ككيانات منعزلة ، بل تعيش في مجتمعات ميكروبية تُعرف باسم الأغشية الحيوية. لكل هذه الأسباب ، فإن الثقافة النقية ليست دائمًا أفضل طريقة لدراسة الكائنات الحية الدقيقة. Metagenomics هي دراسة الجينومات الجماعية لأنواع متعددة تنمو وتتفاعل في مكانة بيئية. يمكن استخدام علم الميتاجينوميات لتحديد الأنواع الجديدة بسرعة أكبر ولتحليل تأثير الملوثات على البيئة (الشكل 10.3.3). يمكن الآن أيضًا تطبيق تقنيات الميتاجينوميات على مجتمعات حقيقيات النوى الأعلى ، مثل الأسماك.

إنشاء وقود حيوي جديد

يتم استخدام معرفة جينوم الكائنات الحية الدقيقة لإيجاد طرق أفضل لتسخير الوقود الحيوي من الطحالب والبكتيريا الزرقاء. المصادر الرئيسية للوقود اليوم هي الفحم والنفط والخشب والمنتجات النباتية الأخرى مثل الإيثانول. على الرغم من أن النباتات هي موارد متجددة ، لا تزال هناك حاجة لإيجاد المزيد من مصادر الطاقة المتجددة البديلة لتلبية متطلبات الطاقة لسكاننا. يعد عالم الميكروبات أحد أكبر الموارد للجينات التي تشفر إنزيمات جديدة وتنتج مركبات عضوية جديدة ، ولا تزال غير مستغلة إلى حد كبير. يمتلك هذا المورد الجيني الواسع القدرة على توفير مصادر جديدة للوقود الحيوي (الشكل 10.3.4).

جينوم الميتوكوندريا

الميتوكوندريا هي عضيات داخل الخلايا تحتوي على الحمض النووي الخاص بها. يتطور الحمض النووي للميتوكوندريا بمعدل سريع وغالبًا ما يستخدم لدراسة العلاقات التطورية. ميزة أخرى تجعل دراسة جينوم الميتوكوندريا مثيرة للاهتمام وهي أنه في معظم الكائنات متعددة الخلايا ، يتم تمرير الحمض النووي للميتوكوندريا من الأم أثناء عملية الإخصاب. لهذا السبب ، غالبًا ما يستخدم علم جينوم الميتوكوندريا لتتبع علم الأنساب.

علم الجينوم في تحليل الطب الشرعي

تم استخدام المعلومات والأدلة التي تم الحصول عليها من عينات الحمض النووي التي تم العثور عليها في مسرح الجريمة كدليل في قضايا المحكمة ، واستخدمت العلامات الجينية في تحليل الطب الشرعي. أصبح التحليل الجينومي مفيدًا أيضًا في هذا المجال. في عام 2001 ، نُشر أول استخدام لعلم الجينوم في الطب الشرعي. لقد كان جهدًا تعاونيًا بين مؤسسات البحث الأكاديمي ومكتب التحقيقات الفيدرالي لحل الحالات الغامضة للجمرة الخبيثة (الشكل 10.3.5) التي تم نقلها بواسطة خدمة البريد الأمريكية. تم تحويل بكتيريا الجمرة الخبيثة إلى مسحوق معدي وإرسالها بالبريد إلى وسائل الإعلام واثنين من أعضاء مجلس الشيوخ الأمريكي. أصاب المسحوق الموظفين الإداريين وعمال البريد الذين فتحوا الرسائل أو تعاملوا معها. توفي خمسة أشخاص ، وأصيب 17 آخرون من البكتيريا. باستخدام علم الجينوم الميكروبي ، قرر الباحثون استخدام سلالة معينة من الجمرة الخبيثة في جميع الرسائل البريدية. في النهاية ، تم تتبع المصدر لعالم في مختبر الدفاع البيولوجي الوطني في ولاية ماريلاند.

علم الجينوم في الزراعة

يمكن لعلم الجينوم أن يقلل من التجارب والإخفاقات التي ينطوي عليها البحث العلمي إلى حد معين ، مما قد يؤدي إلى تحسين جودة وكمية غلات المحاصيل في الزراعة (الشكل 10.3.6). يساعد ربط السمات بالجينات أو التوقيعات الجينية على تحسين تربية المحاصيل لتوليد أنواع هجينة تتمتع بأكثر الصفات المرغوبة. يستخدم العلماء البيانات الجينية لتحديد السمات المرغوبة ، ثم ينقلون تلك السمات إلى كائن حي مختلف لإنشاء كائن حي جديد معدل وراثيًا ، كما هو موضح في الوحدة السابقة. يكتشف العلماء كيف يمكن لعلم الجينوم أن يحسن نوعية وكمية الإنتاج الزراعي. على سبيل المثال ، يمكن للعلماء استخدام السمات المرغوبة لإنشاء منتج مفيد أو تحسين منتج موجود ، مثل جعل محصول حساس للجفاف أكثر تحملاً لموسم الجفاف.

البروتيوميات

البروتينات هي المنتجات النهائية للجينات التي تؤدي الوظيفة المشفرة بواسطة الجين. تتكون البروتينات من الأحماض الأمينية وتلعب أدوارًا مهمة في الخلية. جميع الإنزيمات (باستثناء الريبوزيمات) هي بروتينات وتعمل كمحفزات تؤثر على معدل التفاعلات. البروتينات هي أيضًا جزيئات تنظيمية ، وبعضها هرمونات. تساعد بروتينات النقل ، مثل الهيموجلوبين ، في نقل الأكسجين إلى أعضاء مختلفة. الأجسام المضادة التي تدافع ضد الجسيمات الغريبة هي أيضًا بروتينات. في حالة المرض ، يمكن أن تتأثر وظيفة البروتين بسبب التغيرات على المستوى الجيني أو بسبب التأثير المباشر على بروتين معين.

البروتين هو المجموعة الكاملة من البروتينات التي ينتجها نوع من الخلايا. يمكن دراسة البروتينات باستخدام معرفة الجينوم لأن الجينات ترمز إلى mRNAs ، وترميز mRNAs البروتينات. تسمى دراسة وظيفة البروتينات البروتينات. تكمل البروتيوميات علم الجينوم وتكون مفيدة عندما يريد العلماء اختبار فرضياتهم القائمة على الجينات. على الرغم من أن جميع الخلايا في كائن متعدد الخلايا لها نفس مجموعة الجينات ، فإن مجموعة البروتينات المنتجة في أنسجة مختلفة مختلفة وتعتمد على التعبير الجيني. وبالتالي ، فإن الجينوم ثابت ، لكن البروتين يختلف ويصبح ديناميكيًا داخل الكائن الحي. بالإضافة إلى ذلك ، يمكن تقطيع الحمض النووي الريبي بدلاً من ذلك (قص ولصق لإنشاء مجموعات جديدة وبروتينات جديدة) ، ويتم تعديل العديد من البروتينات بعد الترجمة. على الرغم من أن الجينوم يوفر مخططًا ، إلا أن البنية النهائية تعتمد على عدة عوامل يمكن أن تغير تطور الأحداث التي تولد البروتين.

تجري دراسة الجينومات والبروتينات للمرضى الذين يعانون من أمراض معينة لفهم الأساس الجيني للمرض. يعتبر السرطان من أبرز الأمراض التي تتم دراستها باستخدام الأساليب البروتينية (الشكل 10.3.7). تُستخدم الأساليب البروتينية لتحسين الفحص والكشف المبكر عن السرطان ؛ يتم تحقيق ذلك من خلال تحديد البروتينات التي يتأثر تعبيرها بعملية المرض. يُطلق على البروتين الفردي اسم المرمز الحيوي ، بينما تسمى مجموعة البروتينات ذات مستويات التعبير المتغيرة توقيع البروتين. لكي يكون المرقم الحيوي أو توقيع البروتين مفيدًا كمرشح للفحص المبكر واكتشاف السرطان ، يجب إفرازه في سوائل الجسم مثل العرق أو الدم أو البول ، بحيث يمكن إجراء فحوصات واسعة النطاق بطريقة غير باضعة . المشكلة الحالية في استخدام المؤشرات الحيوية للكشف المبكر عن السرطان هي ارتفاع معدل النتائج السلبية الكاذبة. النتيجة السلبية الخاطئة هي نتيجة اختبار سلبية يجب أن تكون إيجابية. بعبارة أخرى ، لا يتم اكتشاف العديد من حالات السرطان ، مما يجعل المؤشرات الحيوية غير موثوقة. بعض الأمثلة على المؤشرات الحيوية للبروتين المستخدمة في الكشف عن السرطان هي CA-125 لسرطان المبيض و PSA لسرطان البروستاتا. قد تكون بصمات البروتين أكثر موثوقية من المؤشرات الحيوية لاكتشاف الخلايا السرطانية. تُستخدم البروتيوميات أيضًا لتطوير خطط علاج فردية ، والتي تتضمن التنبؤ بما إذا كان الفرد سيستجيب لعقاقير معينة أم لا والآثار الجانبية التي قد يعاني منها الفرد. تُستخدم البروتيوميات أيضًا للتنبؤ بإمكانية تكرار المرض.

طور المعهد الوطني للسرطان برامج لتحسين اكتشاف وعلاج السرطان. تعد تقنيات البروتينات السريرية للسرطان وشبكة أبحاث الاكتشاف المبكر جهودًا لتحديد بصمات البروتين الخاصة بأنواع مختلفة من السرطانات. تم تصميم برنامج البروتينات الطبية الحيوية لتحديد بصمات البروتين وتصميم علاجات فعالة لمرضى السرطان.

ملخص

يشبه رسم خرائط الجينوم حل لغز كبير ومعقد بقطع من المعلومات الواردة من المختبرات في جميع أنحاء العالم. توفر الخرائط الجينية مخططًا تفصيليًا لموقع الجينات داخل الجينوم ، وتقدير المسافة بين الجينات والعلامات الجينية على أساس تكرار إعادة التركيب أثناء الانقسام الاختزالي. توفر الخرائط المادية معلومات مفصلة حول المسافة المادية بين الجينات. تتوفر المعلومات الأكثر تفصيلاً من خلال تعيين التسلسل. يتم دمج المعلومات من جميع مصادر الخرائط والتسلسل لدراسة الجينوم بأكمله.

تسلسل الجينوم الكامل هو أحدث الموارد المتاحة لعلاج الأمراض الوراثية. يستخدم بعض الأطباء تسلسل الجينوم الكامل لإنقاذ الأرواح. يحتوي علم الجينوم على العديد من التطبيقات الصناعية ، بما في ذلك تطوير الوقود الحيوي والزراعة والأدوية ومكافحة التلوث.

الخيال هو العائق الوحيد لتطبيق علم الجينوم. يتم تطبيق علم الجينوم في معظم مجالات علم الأحياء. يمكن استخدامه للطب الشخصي ، والتنبؤ بمخاطر المرض على المستوى الفردي ، ودراسة التفاعلات الدوائية قبل إجراء التجارب السريرية ، ودراسة الكائنات الحية الدقيقة في البيئة بدلاً من المختبر. كما يتم تطبيقه على توليد أنواع وقود حيوي جديدة ، وتقييم الأنساب باستخدام الميتوكوندريا ، والتقدم في علوم الطب الشرعي ، والتحسينات في الزراعة.

علم البروتينات هو دراسة مجموعة البروتينات الكاملة التي يتم التعبير عنها بواسطة نوع معين من الخلايا في ظل ظروف بيئية معينة. في الكائن متعدد الخلايا ، سيكون للأنواع المختلفة من الخلايا بروتينات مختلفة ، وسوف تختلف باختلاف التغيرات في البيئة. على عكس الجينوم ، يكون البروتين ديناميكيًا ويخضع لتدفق مستمر ، مما يجعله أكثر تعقيدًا وفائدة من معرفة الجينوم وحده.

قائمة المصطلحات

المرقم الحيوي
بروتين فردي يتم إنتاجه بشكل فريد في حالة مرضية
الخريطة الجينية
مخطط تفصيلي للجينات وموقعها على كروموسوم يعتمد على ترددات إعادة التركيب بين العلامات
علم الجينوم
دراسة الجينومات بأكملها ، بما في ذلك المجموعة الكاملة من الجينات ، وتسلسل النيوكليوتيدات وتنظيمها ، وتفاعلاتها داخل الأنواع ومع الأنواع الأخرى
الميتاجينوميات
دراسة الجينومات الجماعية لأنواع متعددة تنمو وتتفاعل في مكانة بيئية
كائن نموذجي
أحد الأنواع التي تمت دراستها واستخدامها كنموذج لفهم العمليات البيولوجية في الأنواع الأخرى التي يمثلها الكائن النموذجي
علم الجينات الصيدلية
دراسة التفاعلات الدوائية مع الجينوم أو البروتين ؛ وتسمى أيضًا علم الجينوم السمي
خريطة البدنية
تمثيل للمسافة المادية بين الجينات أو العلامات الجينية
توقيع البروتين
مجموعة من البروتينات المفرطة أو ناقصة التعبير المميزة للخلايا في نسيج مريض معين
البروتينات
دراسة وظيفة البروتينات

بروتينات الجينوم الأساسية

لقد أضفنا مؤخرًا اختبار البروتينات الجديد المثير والقوي ، SOMAscan ، من SomaLogic. المركز الأساسي هو مزود الخدمة الحصري لمنصة اكتشاف العلامات الحيوية للبروتين 1310 في منطقة بوسطن / لونغوود الطبية.

SOMAscan (SomaLogic) عبارة عن منصة اكتشاف البروتينات والعلامات الحيوية الشبيهة بالبروتين عالي الحساسية والقائمة على aptamer والتي تحدد في نفس الوقت 1،310 بروتينًا بشريًا في جميع أنواع مستخلصات البروتين من سوائل الجسم مثل المصل والبلازما والبول واللعاب و CSF والكيس السوائل والأنسجة والخلايا والغسيل والنماذج الحيوانية والإكسوسومات.

خدمات

خدمات علم الجينوم
  • مجموعة لوحات صفيف جينوم HT جينشيب - نظام GeneChip HT الجديد مصمم لإكمال المشاريع الكبيرة لما يصل إلى 96 عينة في كل شوط ، بما في ذلك الإنسان والفأر والجرذ
  • مصفوفات جينات خرطوشة الجينوم الكاملة
  • نحن نقدم خدمات التضخيم لكمية محدودة من الحمض النووي الريبي (RNA) والحمض النووي الريبي (RNA) المتدهور جزئيًا (FFPE)
الخدمات البروتينية
  • تعدد إرسال عالٍ وعالي الحساسية يعتمد SOMAscan-1310 على اكتشاف العلامات الحيوية للبروتين
  • التقدير النسبي بواسطة & microLC / MS / MS
  • ITRAQ - نظام علامات الببتيد متساوي الضغط 8-plex الذي يمكّنك من تصنيف جميع الأمينات الأولية ، بغض النظر عن فئة الببتيد
  • SILAC - وضع العلامات على النظائر المستقرة للأحماض الأمينية في زراعة الخلايا وهو نهج حيوي
  • GIST - تقنية قياسية داخلية عالمية ، تقنية وضع العلامات على مستوى الببتيد بعد الهضم
  • ICAT - التنميط البروتيني القائم على علامة التقارب المشفرة بالنظائر
  • تحديد البروتين بواسطة LC-MALDI و LC / MS / MS
  • Coomassie & amp ؛ حزام جل مطلي بالفضة
  • تحديد تعديلات البروتين والببتيد
  • مواقع الفسفرة
  • تعديلات البروتين مثل الأسيتيل والميثلة والتواجد في كل مكان
  • بقعة كوماسي البروتينات النقية فقط
  • التنميط البروتيني للعينات البيولوجية المعقدة (مصل ، بول ، CSF ، نسيج خزعات ، مستخلصات خلوية ، غسل ، لعاب ، إلخ).
  • التنميط بواسطة & microLC / MS
  • تجزئة البروتين متعدد الأبعاد بواسطة & microLC
خدمات تحليل البيانات والمعلوماتية الحيوية

بالإضافة إلى ذلك ، يقدم المركز نواة معلوماتية حيوية كاملة لإدارة البيانات وتحليلها بالإضافة إلى تطوير برامج جديدة والقدرة على إجراء مجموعة متنوعة من فحوصات الجينوم والإنتاجية العالية.


تحليل الجينوميات والبروتيوميات لخلايا كبد الفئران الأولية المستزرعة

يعد استخدام النماذج الحيوانية في الأبحاث الصيدلانية طريقة مكلفة ومضللة في بعض الأحيان لتوليد بيانات السمية وبالتالي التنبؤ بسلامة الإنسان. وبالتالي، في المختبر تلعب أنظمة الاختبار ، مثل خلايا الكبد الأولية للجرذان ، وتقنيات الجينوميات والبروتينات النامية ، دورًا متزايد الأهمية في أبحاث السموم. تم فحص تحليل التعبير الجيني والبروتيني في سلسلة زمنية (تصل إلى 5 أيام) لخلايا كبد الفئران الأولية المزروعة على أطباق مغلفة بالكولاجين. بعد 24 ساعة على وجه الخصوص ، هناك تنظيم تنازلي كبير للعديد من إنزيمات المرحلة الأولى والمرحلة الثانية المهمة (على سبيل المثال ، السيتوكروم P450 ، الجلوتاثيون-س- ترانسفيراز ، سلفوترانسفيرازات) المشاركة في التمثيل الغذائي للأجانب الحيوية ، والإنزيمات المضادة للأكسدة (على سبيل المثال ، الكاتلاز ، ديسموتاز الفائق ، الجلوتاثيون بيروكسيداز). غالبًا ما يتم تنظيم إنزيمات الاستجابة في المرحلة الحادة (على سبيل المثال ، بروتين ربط LPS ، α-2-macro-globulin ، ferritin ، مثبط بروتين سيرين B ، هابتوجلوبين) ، والذي من المحتمل أن يكون نتيجة للإجهاد الخلوي الذي تسببه الخلية إجراء العزل (نضح) نفسه. كانت الملاحظة الموازية هي زيادة التعبير عن العديد من الجينات الهيكلية (على سبيل المثال ، β-actin ، α-tubulin ، vimentin) ، ربما بسبب أنواع أخرى من الخلايا المتكاثرة في الثقافة ، مثل الخلايا الليفية أو بدلاً من ذلك عن طريق نزع التمايز في خلايا الكبد.

في الختام ، التفسير الدقيق للبيانات المستمدة من هذا في المختبر يشير النظام إلى أنه يمكن استخدام خلايا الكبد الأولية بنجاح في دراسات السمية قصيرة المدى حتى 24 ساعة. ومع ذلك ، تحتاج ظروف الاستنبات إلى مزيد من التحسين لتقليل التغييرات الهائلة في التعبير الجيني والبروتيني لخلايا الكبد المزروعة على المدى الطويل للسماح بالتطبيقات العملية كنظام اختبار سمية طويل الأجل.


الإجراءات التجريبية

تم تطوير تنسيقات البيانات هذه منذ عام 2014 وكانت عملية مفتوحة عبر المكالمات الجماعية والمناقشات في الاجتماعات السنوية لـ PSI. تم تقديم كلا مواصفات النسق إلى عملية وثيقة PSI [31] للمراجعة. الهدف العام من هذه العملية ، على غرار مراجعة المخطوطة العلمية التكرارية ، هو أن يتم تقييم جميع المعايير الرسمية بدقة. تتم معالجة هذه العملية بواسطة محرر PSI والمراجعين الخارجيين الذين يمكنهم تقديم ملاحظات حول مواصفات التنسيق. بالإضافة إلى ذلك ، هناك مرحلة للتعليقات العامة ، مما يضمن مشاركة وجهات نظر غير متجانسة من المجتمع. في وقت كتابة هذا التقرير ، تم الانتهاء من عملية مراجعة PSI لكل من التنسيقات والإصدار 1.0 من كلاهما مستقر.

يستخدم كلا التنسيقين مصطلحات وتعريفات للمفردات المضبوطة كجزء من PSI-MS CV [32] ، وتستخدم أيضًا في تنسيقات بيانات PSI الأخرى. تتوفر جميع الوثائق ذات الصلة ، بما في ذلك المواصفات التفصيلية لتنسيق الملف ونماذج الملفات ، على http://www.psidev.info/probam وعلى http://www.psidev.info/probed.

نظرة عامة على تنسيقات proBAM و proBed

تم تصميم تنسيقات البروتينات الجينية proBAM و proBed لتخزين التمثيل الجينومي لبيانات البروتينات (الشكل 1). كما ذكرنا أعلاه ، كلا التنسيقين متوافقان بشكل كبير مع نظرائهما في الجينوميات الأصلية ، وبالتالي يستفيدون بالفعل من عدد كبير من الأدوات الحالية التي طورها مجتمع الجينوميات.

نظرة عامة على تنسيقات معايير بروتيوجينوميكس proBAM و proBed. يمكن إنشاء كل من proBAM و proBed من التنسيقات القياسية للبروتيوميات الراسخة التي تحتوي على معلومات تعريف الببتيد والبروتين (mzTab و mzIdentML ، المربع الأزرق) ، المشتقة من ملفات طيف بيانات MS المقابلة (mzML ، صندوق بني). تنسيقات proBAM و proBed (صندوق أخضر) تحتوي على معلومات مماثلة متعلقة بـ PSM ورسم خرائط الجينوم ، ومع ذلك يحتوي proBAM على مزيد من التفاصيل ، بما في ذلك المعلومات الأنزيمية (البروتياز) ، والمفتاح في تجارب البروتينات (نوع الإنزيم ، والانشقاقات الخاطئة ، والمصطلح الإنزيمي ، وما إلى ذلك) وتفاصيل الخرائط (CIGAR ، العلم ، إلخ.). بالإضافة إلى ذلك ، فإن proBAM قادر على الاحتفاظ بمجموعة كاملة من نتائج تحديد البروتينات المستندة إلى MS ، مما يتيح مزيدًا من التحليل النهائي بالإضافة إلى التصور المرتكز على الجينوم ، لأنه أيضًا الغرض من proBed (صندوق أرجواني)

نظرة عامة على proBAM

تم تصميم تنسيق BAM في الأصل لإجراء محاذاة لقراءات قصيرة من DNA أو RNA لجينوم مرجعي [22 ، 23]. يتكون ملف BAM عادةً من قسم رأسي يخزن البيانات الوصفية وقسم محاذاة يخزن بيانات التعيين (الشكلان 1 و 2 ملف إضافي 1: الجدول S1A). يمكن أن تتضمن البيانات الوصفية معلومات حول هوية العينة ، والمعلمات التقنية في توليد البيانات (مثل المكتبة ، والنظام الأساسي ، وما إلى ذلك) ، ومعالجة البيانات (مثل أداة الخرائط المستخدمة ، ووضع العلامات المكررة ، وما إلى ذلك). تتضمن المعلومات الأساسية مكان محاذاة القراءات ومدى جودة المحاذاة وجودة القراءات. تم تصميم الحقول أو العلامات المحددة لتمثيل هذه المعلومات أو ترميزها. يرث تنسيق proBAM كل هذه الميزات. في هذه الحالة ، يتم استبدال قراءات التسلسل بـ PSM (راجع مستند مواصفات proBAM للحصول على التفاصيل الكاملة ، http://www.psidev.info/probam#proBAM_specs).

مجالات تنسيق proBAM و proBed. يحتوي ملف proBed على 12 عمودًا أصليًا من BED (يتم تمييزها بواسطة ملف صندوق جريء) و 13 عمودًا إضافيًا من بروبد. يحتوي سجل محاذاة proBAM على 11 عمودًا أصليًا من BAM (تم تمييزها بواسطة ملف صندوق جريء) و 21 عمودًا خاصًا بـ proBAM ، باستخدام تنسيق TAG: TYPE: VALUE. يمثل كل صف في الجدول عمودًا في proBAM و proBed. تم تلوين الصفوف لتعكس فئات المعلومات المقدمة في التنسيقين (راجع أسطورة اللون في الجزء السفلي ، لم يتم تضمين قسم الرأس بتنسيق proBAM هنا). تمثل الصفوف التي لا تحتوي على أي لون خلفية في جدول proBAM أعمدة BAM الأصلية التي لم يتم استخدامها في proBAM ولكن يتم الاحتفاظ بها للتوافق. يشير الصف الأخير في جدول proBAM إلى الأعمدة المخصصة التي يمكن استخدامها

تجدر الإشارة إلى أنه نظرًا لأن العلامات المستخدمة في BAM عادةً ما يكون لها معاني متعارف عليها ، فإننا لم نحاول إعادة توظيف أي منها ولكن بدلاً من ذلك أنشأنا أخرى جديدة لاستيعاب أنواع بيانات البروتينات المحددة مثل درجات PSM وحالات الشحن والبروتين PTM (الشكل 1 ب). . 2 and proBAM specification document section 4.4.1 for full description on PSM-specific tags). We also envisioned that additional fields and tags may be necessary to hold additional aspects of proteomics data. We thus designed a “Z?” tag as an extension anchor. Analogously to proBed, the format can also accommodate peptides (as groups of PSMs with the same peptide sequence).

ProBed overview

The original BED format (https://genome.ucsc.edu/FAQ/FAQformat.html#format1), developed by the UCSC, provides a flexible way to define data lines that can be displayed as annotation tracks. proBed is an extension to the original BED file format [28]. In BED, data lines are formatted in plain text with white-space separated fields. Each data line represents one item mapped to the genome. The first three fields (corresponding to genomic coordinates) are mandatory and an additional nine fields are standardized and commonly interpreted by genome browsers and other tools, totaling 12 BED fields, re-used here. The proBed format includes a further 13 fields to describe information primarily on peptide-spectrum matches (PSMs) (Figs. 1 and 2 Additional file 1: Table S1B). The format can also accommodate peptides (as groups of PSMs with the same peptide sequence), but in that case, some assumptions need to be taken in some of the fields (see proBed specification document section 6.8 for details, http://www.psidev.info/probed#proBed_specs).

Distinct features of proBAM and proBed and their use cases

The proBAM and proBed formats differ in similar ways as their genomic counterparts do, although representing analogous information. In fact, proBAM and proBed are complementary and have different use cases. Figure 3 shows two examples of proBAM and proBed visualization tracks of the same datasets. An IGV and Ensembl visualization are presented including multiple splice-junction peptides (Fig. 3a) and a novel translation initiation event in the HDGF gene locus (Fig. 3b), respectively.

Visualization of proBAM and proBed files in genome browsers. أ IGV visualization: proBAM (green box) and proBed (red box) files coming from the same dataset (accession number PXD001524 in the PRIDE database). proBed files are usually loaded as annotation tracks in IGV whereas proBAM files are loaded in the mapping section. ب Ensembl visualization: proBAM (green box) and proBed (red box) files derived from the same dataset (accession number PXD000124) illustrating a novel translational event. The N-terminal proteomics identification result points to an alternative translation initiation site (TIS) for the gene HDGF at a near-cognate start-site located in the 5’-UTR of the transcript (blue box)

Similar to the designed purposes of SAM/BAM, the basic concepts behind the proBAM format are: (1) to provide genome coordinates as well as detailed mapping information, including CIGAR, flag, nucleotide sequences, etc. (2) to hold richer proteomics-related information and (3) to serve as a well-defined interface between PSM identification and downstream analyses. Therefore, the proBAM format contains much more information about the peptide-gene mapping statuses as well as PSM-related information, when compared to proBed. Peptide and nucleotide sequences are inherently embedded in proBAM, which can be useful for achieving improved visualization by tools such as IGV. This feature enables intuitive display of the coverage of a region of interest, peptides at splice junctions, single nucleotide/amino acid variation, and alternative spliced isoforms (Fig. 3), among others. Therefore, proBAM can hold the full MS proteomics result set, whereupon further downstream analysis can be performed: gene-level inference [33], basic spectral count based quantitative analysis, reanalysis based on different scoring systems, and/or false discovery rate (FDR) thresholds.

The proBed format, on the other hand, is more tailored for storing only the final results of a given proteogenomics analysis, without providing the full details. The BED format is commonly used to represent genomic features. Thus, proBed stores browser track information at the PSM and/or peptide level mainly for visualization purposes. As a key point, proBed files can be converted to BigBed [34], a binary format based on BED, which represents a feasible way to store the same information present in BED as compressed binary files, and is the final routinely used format as annotation tracks. It should be noted that a proBAM to proBed conversion should be possible and vice versa. However, “null” values for some of the Tags would be logically expected for the mapping from proBed to proBAM.

Software implementations

Both proBAM and proBed are fully compatible out-of-the-box with existing tools designed for the original SAM/BAM and BED files. Therefore, existing popular tools in the genomics community can readily be applied to read, merge and visualize these formats (Table 1). As mentioned already, several stand-alone and web genome browsers are available to visualize these formats, e.g. UCSC browser, Ensembl, Integrative Genomics Viewer, and JBrowse. For visualizing MS/MS identification results, an integrated proteomics data visualization tool, PDV (Table 1), currently accepts proBAM and matched spectrum file as input.

Routinely used command line tools such as SAMtools allow to manipulate (index, merge, sort) alignments in proBAM. Bedtools, seen as the “Swiss-army knife” tools for a wide range of genomic analysis tasks, allows similar actions to both formats, including, among others, intersection, merging, count, shuffling, and conversion functionality. Conversion from proBAM to CRAM format is also enabled by tools as SAMtools, Scramble, or Picard. With the UCSC “bedToBigBed” converter tool (http://hgdownload.soe.ucsc.edu/admin/exe/), one can also convert the proBed to bigBed. In this context, it is important to note that bedToBigBed version 2.87 is highlighted in the proBed format specification as the reliable version that can be used to create bigBed files coming from proBed (version 1.0) files.

There is also software specifically written for proBAM and proBed, supporting all the proteomics-related features. In fact, proteogenomics data encoded in the PSI standard formats mzIdentML and mzTab can be converted into proBAM and proBed, although it should be noted that the representation for proteogenomics data in mzIdentML has only been formalized recently [35]. In this context, first of all, the open-source Java library ms-data-core-api, created to handle different proteomics file formats using the same interface, can be used to write proBed [36]. A Java command line tool, PGConverter (https://github.com/PRIDE-Toolsuite/PGConverter), is also able to convert from mzIdentML and mzTab to proBed and bigBed. Analogously, several tools are available to write proBAM files, such as the Bioconductor proBAMr package. An additional R package, called proBAMtools, is also available to analyze fully exported MS-based proteomics results in proBAM [33]. proBAMtools was specifically designed to perform various analyses using proBAM files, including functions for genome-based proteomics data interpretation, protein and gene inference, count-based quantification, and data integration. It also provides a function to generate a peptide-based proBAM file coming from a PSM-based one.

ProBAMconvert is another intuitive tool that enables the conversion from mzIdentML, mzTab, and pepXML (another popular proteomics open format) [37] to both peptide- or PSM-based proBAM and proBed (http://probam.biobix.be) [38]. It is available as a command line interface (CLI) and a graphical user interface (GUI for Mac OS X, Windows and Linux). As with CLI, it is also wrapped in a Bioconda package (https://bioconda.github.io/recipes/probamconvert/README.html) and in a Galaxy tool, available from the public test toolshed (https://testtoolshed.g2.bx.psu.edu/view/galaxyp/probamconvert). The PGConverter tool also allows the validation of proBed files. For proBAM files, a validator is available that checks the validity of the original SAM/BAM format (https://github.com/statgen/bamUtil), although additional proteogenomics data verification still needs to be implemented.


الملخص

The biology and disease oriented branch of the Human Proteome Project (B/D-HPP) was established by the Human Proteome Organization (HUPO) with the main goal of supporting the broad application of state-of the-art measurements of proteins and proteomes by life scientists studying the molecular mechanisms of biological processes and human disease. This will be accomplished through the generation of research and informational resources that will support the routine and definitive measurement of the process or disease relevant proteins. The B/D-HPP is highly complementary to the C-HPP and will provide datasets and biological characterization useful to the C-HPP teams. In this manuscript we describe the goals, the plans, and the current status of the of the B/D-HPP.


Mr. Sandipan Ray. Sandipan Ray received his M.Sc. Degree in Biotechnology from the University of Calcutta, India in 2009. Presently, he is working as a senior research fellow at the Department of Biosciences and Bioengineering, IIT Bombay, India. He has published quite a few peer-reviewed research articles and reviews in the field of clinical proteomics and emerging proteomics technologies. He is a member of the Human Proteome Organisation (HUPO), US-HUPO, and Proteomics Society, India (PSI). He is actively involved in the development of Virtual Proteomics Lab and other related E-Learning resources at IIT Bombay. His current research interests include serum proteome analysis of Falciparum and Vivax Malaria to decipher disease pathogenesis, host immune response and identify surrogate protein markers.

Ms. Nicole Rachel Koshy. Nicole completed her Masters in Bioinformatics from CMS college of Science and Commerce, Coimbatore in 2008 and went on to pursue her M.S. in Biotechnology from the University of Houston — Clear Lake, Texas in the U.S. She worked on the virtual proteomics laboratory project at the IIT — Bombay and contributed to the bioinformatics module of experiments. She has also worked on a number of publications for the Virtual proteomics laboratory and is currently working at a Biotechnology company in Mumbai, India.

Mr. Panga Jaipal Reddy. Jaipal Reddy obtained his B.Sc. Degree from Osmania University and completed his Masters in Biochemistry from the University of Pune, India in 2008. Presently, he is working as a junior research fellow in Department of Biosciences and Bioengineering, IIT Bombay, India. He is the author of few scientific publications in reputed journals. He has participated in the development of Virtual Proteomics Lab and other related E-Learning resources at IIT Bombay. His current research interests include understanding the regulation of Z-ring assembly and identification of drug targets using proteomics.

Dr. Sanjeeva Srivastava. Dr. Srivastava completed his Ph.D from the University of Alberta, Canada in 2006 and postdoctoral research from Harvard Institute of Proteomics, Harvard Medical School, USA in 2009. He has taught few proteomics courses at the Cold Spring Harbor Laboratory, New York. Presently, he is an Assistant Professor of Department of Biosciences and Bioengineering, IIT Bombay, India. Current research in this group centers on using high-throughput proteomics for biomarker discovery in cancer and other diseases, to study protein–protein interactions and drug target discovery. Additionally, multi-dimensional Omics data are employed for in silico studies and models. The group has developed E-learning resources such as Virtual Laboratory as a community resource and is collaborating actively both across India and internationally to advance this knowledge frontier for the benefit of global health. He is recipient of several awards, including the National Young Scientist Award (Canada), Young Scientist Awards (India) and the Apple Research Technology Support Award (UK). He serves as Editor-in-Chief for the peer reviewed International Journal of Genomics and Proteomics, and Associate Editor for Current Pharmacogenomics and Personalized Medicine and several other international journals.


الملخص

Forensic DNA profiling currently allows the identification of persons already known to investigating authorities. Recent advances have produced new types of genetic markers with the potential to overcome some important limitations of current DNA profiling methods. Moreover, other developments are enabling completely new kinds of forensically relevant information to be extracted from biological samples. These include new molecular approaches for finding individuals previously unknown to investigators, and new molecular methods to support links between forensic sample donors and criminal acts. Such advances in genetics, genomics and molecular biology are likely to improve human forensic case work in the near future.


Body of the article

Since the 1950s and until recently, it was believed that mutations in a single gene confer vulnerability to multiple infectious diseases. Concomitantly, common infections have been presumed to be associated with the inheritance of mutations in multiple susceptibility genes. In recent work towards a unified genetic theory of disease [1-3], Prof. JL Casanova identified and characterized many new genetic defects that predispose otherwise healthy individuals to a single type of infection [4]. This novel causal relationship has modified the paradigm that dominated the field for several decades. Single-gene inborn errors of immunity in children may confer severe and selective vulnerability to specific infectious illnesses, whereas corresponding infections in adults usually involve more complex gene patterns. Several diseases have been studied including mycobacterial diseases, invasive pneumococcal disease, chronic mucocutaneous candidiasis, severe flu, Kaposi sarcoma and herpes simplex encephalitis (HSE).

Herpes simplex encephalitis

Herpes simplex virus (HSV-1) encephalitis (HSE) is a severe infection of the central nervous system (CNS)[5]. Although HSV-1 is widespread and typically innocuous in human populations, HSE is the most common form of sporadic viral encephalitis in Western countries, where it is estimated to occur in approximately two to four per million individuals per year. Peaks of HSE incidence occur between theages of 6 months to3 years during primary infection with HSV-1. The virus reaches the CNS via a neurotropic route involving the trigeminal and olfactory nerves [6,7]. The mortality rate, which used to be as high as 70%, has declined significantly thanks to treatment with the anti-viral acyclovir [8-10]. In spite of the treatment, up to 60% of patients suffer from long-term neurological sequelae of varying severity [7,11].

Genomic studies, exome sequencing

Exome sequencing, the targeted sequencing of the protein-coding portion of the human genome, has been shown to be a powerful and efficient method for detection of disease variants underlying Mendelian disorders. In the human genome, exons represent about 1% [12]. It is estimated that the protein coding regions of the human genome constitute about 85% of the disease-disposing mutations [13]. Robust sequencing of the complete coding region (exome) has the potential to be clinically relevant in genetic diagnosis as understanding of the functional consequences in sequence variation improves [13]. Currently exome sequencing is discovering inborn errors of immunity in children that confer severe and selective vulnerability to certain infectious diseases [14,15].

Childhood HSE has not been associable with known immunodeficiencies and its pathogenesis remained elusive until identified the first five genetic aetiologies of this condition were identified [16-21]. Autosomal recessive UNC-93B deficiency abolishes Toll-like receptor 3 (TLR3), TLR7, TLR8, and TLR9 signalling [16], whereas autosomal dominant TLR3 deficiency specifically affects TLR3 signalling[21]. Recently an autosomal recessive form of complete TLR3 deficiency has been described as a compound heterozygous for two loss-of-function TLR3 alleles [17]. Moreover an autosomal dominant deficiency in TNF receptor-associated factor 3 (TRAF3) [19], a Toll/IL1R (TIR) domain-containing adaptor inducing IFN-β (TRIF) deficiency [20] and TANK-binding kinase (TBK1)�iciency [18] have been described.

All of these genetic defects involve the Toll-like receptor 3 (TLR3) signalling pathway and these studies suggested that childhood HSE may result from impaired interferon (IFN)-α/β and IFN-λ production in response to the stimulation of TLR3 by dsRNA intermediates of HSV-1 in the CNS ( Fig. 1 ). However, the study of proteins implicated in the TLR3-IFN pathway for HSE patients revealed that only a small fraction of children with HSE carry mutations in UNC93B1, TLR3, TRAF3, TRIF or TBK1 [16-21]. A larger proportion of patients display an impaired production of IFN type I and III upon TLR3 stimulation of their fibroblasts. Conversely, the study of IFN type I and III production after TLR3 activation in SV40-fibroblasts of HSE patients has shown that 30%, of a total of 89 patients analysed, have IFN type I and III production which is normal. This suggested that in spite of the importance of the TLR3 pathway in HSE immunity, genetic defect(s) responsible for the susceptibility to HSV-1 in the CNS could be due to TLR3-independent pathways, or other TLR3, IFN-dependent pathways that are activated after the initial TLR3 activation.

A simplified diagram of the TLR-mediated and interferon (IFN)-mediated immunity in response to viruses. TLR3 is located in the endoplasmic reticulum (ER) and in endosomes, where it recognizes double-stranded RNA produced during the replication of most viruses. Activation of TLR3 induces activation of IRF-3 and NF- κ B via the TRIF adaptor, and the production of IFN-α/& # x003b2 and/or - λ. UNC-93B is required for the trafficking of TLR3, TLR7, TLR8 and TLR9 from the ER to the endosomal compartment. Proteins of the TLR3 pathway for which genetic mutation have been identified and associated with susceptibility to Herpes simplex virus-1 encephalitis (TLR3, TRIF, UNC-93B, TRAF3 and TBK1) are depicted in blue.

Formulating a Proteomics Approach

Conventional attempts to define disease-related genetic defects involving single proteins commonly try to screen large numbers of patient samples to validate single gene defects. This often has the major obstacle that sufficient numbers of patient samples are difficult to obtain. Since TLR3-dependent pathways are clearly involved in HSV-1 susceptibility, it was considered that it might be possible to use a combination of proteomics and systems biology methods to look for other networks and/or proteins[22]. The basic idea behind this strategy is that the increasing amount of available systems biology information has changed the situation. Using only small numbers of healthy controls and patient samples with appropriate functional stimulation, it might now be possible to detect disease-related functional networks by monitoring large numbers of proteins simultaneously, even if the underlying genetic defect in any individual patient cannot be statistically validated by such a study. If successful, definition of such functional networks could already have important diagnostic and therapeutic implications.

In the case of HSE, a large volume of previous biochemical experiments on several hundred patients and healthy individuals provided a strong base of knowledge, well established, highly reproducible sample preparation methods and related experimental tests of cellular response for the proteomics experiments. These previous studies also made it clear that there was a potential problem that is not often considered in present proteomics studies: what constitutes a normal, healthy response? Monitoring the abundance of key proteins (IFN-beta, IFN-lambda, IL6, NF㮫 and IRF3), cell survival after Vesicular stomatitis virus (VSV) infection, and viral replication [16-21], suggested that several different phenotypes could be distinguished and indicated that there were highly reproducible variations of up to 50 fold in the amounts of IFN type I and III produced by control cells from different healthy individuals in response to dsRNA ( Fig 2 ). In short, for these kinds of proteomics experiments highly reproducible sample preparation for “normal” cell samples that span the range of possible response over the human population seem to be required. Put differently, proteomics experiments should probably only be undertaken in the context of a large base of previous characterization of healthy population variation. With this background in mind, the goal was set out to obtain an initial test of four propositions. (1) Is the variation over population seen by biochemical tests for a few proteins expressed in larger numbers of proteins? (2) Are there proteomics signatures that are characteristic despite population variation? (3) Can significant differences between healthy and patient cells be detected despite population variation? (4) Are the differences of potential genetic, diagnostic or therapeutic interest? Positive results were obtained for all four propositions, but indicated some new challenges for proteomics and bioinformatics (see below).

Production of IFN-β by SV40-fibroblasts after poly(I:C) stimulation (25 μg/ml) for 24 hoursas assessed by ELISA. C1-C5 are the positive healthy controls and UNC93B1 -/- is the UNC-93B-deficientpatient. Mean values ± SD were calculated from three independent experiments.

A Short Summary of the Biological Findings

The SILAC measurements of differential protein abundance were conducted for six samples: three healthy controls from different individuals that showed weak (C3), medium (C1) and strong (C2) production of IFNs in response to dsRNA that was intended to sample population variation, a healthy control without dsRNA stimulation (C2NS), a patient with an UNC-93B-/- defect that abolishes TLR3 pathway response (UNC) and a patient with an unknown genetic defect (P). As described in the original publication [22], common functional pathways in healthy individuals implicated in transmigration of immune cells, apoptosis and oxidative stress that were abrogated in HSE patients were discovered. Furthermore, a set of new proteins for further investigation of possible disease aetiologies was identified ( Fig.3 ) and evidence was obtained that manipulation of one of these (SOD2) could have therapeutic benefits. The observation of changes in proteins involved in mitochondrial oxidative stress systems (SOD2, PPIF) opened a new, additional perspective apart from nuclear-directedTLR3 pathways that is consistent with other recent studies of response to viral infections [23-25]. For the patient with an unknown gene defect and without the fibroblastic phenotype, a lack of ICAM-1 upregulation, strong upregulation of SOD2, and upregulation of a variety of proteins previously associated with TLR3 pathways, delineated a new cellular phenotype which will help to dissect his genetic aetiology. The details of these results and of their context relative to the biological literature are contained in the original publication, to which the reader is referred – in the following we note some new features of the experimental results that have important consequences for future proteomics studies.

Illustration of the potential biological significance in immunity against HSE for proteins upregulated after TLR3 activation.

New Challenges for Proteomics and Bioinformatics

(1) Population variation is a crucial issue for proteomics

Comparison of the SILAC ratios between the different healthy samples indicated related response with correlation values in the ranges usually accepted as biologically relevant ( Fig. 4A ). Correlation with the unstimulated sample was in all cases very small. However, in agreement with the large differences in IFN production, the response to dsRNA showed large variation in the overall magnitude of SILAC ratios between different healthy individuals ( Fig. 4B ). The SILAC ratios revealed that the strong variation in response levels over the population previously detected with small numbers of proteins using western blotting is in fact reflected in the abundance changes for large numbers of proteins. Although the H/L distributions remained approximately Gaussian, for the healthy cells with the strongest response (C2), several hundred proteins showed 2-fold changes in abundance.

(A) Correlation of log2(H/L) between healthy samples (C1, C2, C3) and the healthy, non-stimulated sample (C2NS). (B) Cumulative proportion of proteins with the indicated H/L ratios for all six samples.

(2) Sets of “Most Significant” Proteins are Dependent on Population Variation

Even though similar functional networks were involved, the identity and rank order of proteins with the “most significant” abundance changes differed strongly between different individuals. For example, seven annexins were recorded for all samples. For the healthy samples the general trend for abundance changes was C2 > C1 > C3 in parallel to the changes in IFNs, but the rank order of individual annexins showed C1: ANXA5 > ANXA1 > ANXA7 C2: ANXA7 > ANXA6 > ANXA11 C3: ANXA11 > ANXA7 > ANXA4 ( Fig. 5A ). This feature complicates the choice of “most significant” proteins for subsequent analysis of functional networks using systems biology tools such as GeneGo. Because the H/L distributions remained approximately Gaussian ( Fig. 4B ), a Significance B formulation was used[26] to select the most significant changes for each sample type ( Fig. 5B ). However, for samples such as C1 and C2 the distribution of H/L is ليس dominated by experimental noise (C2NS), but rather by cellular response ( Fig. 4B ). Consequently proteins excluded from the C2 most significant set in fact showed substantially stronger abundance changes than proteins accepted for the C1 or C3 data sets ( Fig. 5B ). As an alternative that was the same for all data sets, a Significance B* factor was calculated relative to the signal intensity/scatter of the unstimulated C2NS data set ( Fig. 5C ), i.e. relative to real experimental noise. The disadvantage of this was that, because of the large differences in cellular response, the number of proteins accepted for network analysis was heavily dominated by C2, e.g. at Significance B* < 1e -5 , the C3/C1/C2 significant data sets included 15/351/842 proteins. Conversely, use of Significance B < 0.05 led to exclusion of large numbers of proteins from the C1 and C2 data sets that had large abundance changes with high reliability relative to real experimental noise. As a compromise, Significance B < 0.05 and H/L cut offs was used to select approximately equal numbers of “most significant” proteins from each sample type [22]. This 𠇎qual sampling” was successful in identifying relevant functional networks using GeneGo. However, only a minority of the “most significant” proteins were common to all three healthy individuals, even though other proteins in the union over the healthy samples satisfied the stringent cutoff Significance B* < 1e -5 . In the context of small numbers of samples it might be possible to use dosage of the stimulation (amount of dsRNA) to attain similar response levels for different cell samples, but for higher throughput analyses of larger numbers of samples, new computational approaches are needed.

Heat maps showing alternative strategies for selection of “most significant” protein sets for subsequent functional network searches using GeneGo. (A) SILAC ratios recorded for 7 different annexins over the six simple types. The number of ratio counts for individual proteins ranged from 6 to 243 per sample. (B) Proteins retained with a Significance B < 0.05 filter applied to each sample independently. (C) Proteins retained with a Significance B* < 0.001 filter applied across all samples. Boxed regions: proteins deleted that had |log2(S)| equal to or greater than “significant” proteins retained in other samples.

Such population variation has been seen in other recent proteomics studies. For example, measurements for 90 genetically different strains of yeast showed that most variation in protein abundance was due to variability in translation and/or protein stability rather than in transcript levels [27]. Similarly, a recent study of four patients with acute myeloid leukemia, five patients with acute lymphoid leukemia and 8 healthy controls compared the basal abundances of 639 different proteins using alignment-based quantitation of LC-MS/MS data sets [28] and found population variation similar to that shown in Fig. 5 .

(3) Current systems biology tools need adaptation to analysis of population variation

The ultimate goal of a population-wide, network-based analysis of function would be to identify common networks across the population and to specify for different individuals the extent to which a common stimulation engages the different networks. Such networks will not be easy to define since they are likely to be highly intertwined (buffered networks in the terminology of complex adaptive systems theory [29]) and the “output” of any sub-network may be diverse and may include: changes in protein abundance, post-translational state and subcellular spatial distribution [30,31] (from proteomics), changes in abundance of metabolites, co-factors, etc. (metabolomics) and genetic changes (epigenetics, micro-RNAs, etc.). The conceptual model of similar networks turned on to different degrees in different individuals that are reflected in protein abundance changes ( Fig. 6A ) is a testable model. Across the space of أناcell samples from different individuals, all proteins ك that belong to network ي have a vector of measured H/L ratios of the form: V → k = a jk ( n 1 j , n 2 j , … , n ij ) in which أjk represents an amplitude for “unit engagement” of the network يfor each protein ك و ناي جاي represents the amplitude to which the network is engaged in each individual أنا. That is, in a multidimensional space with H/L ratios for different cell samples as the orthogonal axes, there is an axis described by the vector (ن1ي,ن2ي, …,ناي جاي) that is the same for all proteins ك in network ي ( Fig. 6B ).

(A) Model of abundance changes for four networks with intrinsic abundance changes أjk for different proteins for unit turn-on of the network. For three cell samples from healthy individuals each network is turned on to different degrees. These results in changes in the set of “most significant” proteins selected with Significance B filters (dashed lines) and their rank order for each cell sample. (B) Relationships in the 3D space of SILAC ratios [log2(S1), log2(S2), log2(S3)] for proteins from a single network. The red/blue spheres and axis indicate increased/decreased abundance. The relative amplitude to which the network is turned on in the different cell samples is given by the axis log2(S1):log2(S2):log2(S3) = 1:1:1 for equal activation in all cell samples. (C) Putative network for proteins involved in redox responses following stimulation of the healthy samples with dsRNA. سجل2(S1):log2(S2):log2(S3) = 0.42:0.91:0.13. (D) Putative network for proteins involved in nuclear processes following stimulation of the healthy samples with dsRNA. سجل2(S1):log2(S2):log2(S3) = 0.69:0.73:0.26.

The model implies the need to search for correlation amongst functionally related proteins (systems biology functional correlations) in functional data (H/L ratios) for high dimensional spaces (many individual samples) – a feature that seems not to be available in current publicly accessible systems biology tools. There are strong indications of such relations in the present data ( Fig. 6C, D ), but new, more sophisticated analysis and statistical validation is required.


معلومات الكاتب

الانتماءات

Institute of Biological Sciences, Faculty of Science, University of Malaya, 50603, Kuala Lumpur, Malaysia

Saiful Anuar Karsani & Nor Afiza Saihen

Oral Cancer Research and Co-ordinating Centre & Faculty of Dentistry, University of Malaya, 50603, Kuala Lumpur, Malaysia

Oral Cancer Research Team, 2nd Floor Outpatient Centre, Sime Darby Medical Centre, Cancer Research Initiatives Foundation (CARIF), 47500 Subang Jaya, Selangor, Malaysia

Department of Clinical Oral Biology, Faculty of Dentistry, Universiti Kebangsaan Malaysia, 50300, Kuala Lumpur, Malaysia

Department of Oral and Maxillofacial Surgery, Faculty of Dentistry, University of Malaya, 50603, Kuala Lumpur, Malaysia

University of Malaya Centre for Proteomics Research (UMCPR), University of Malaya, 50603, Kuala Lumpur, Malaysia


The Clark Lab

We study the process of Adaptive Evolution, during which species adopt novel traits to overcome challenges. We retrace the evolutionary histories of genomic elements to determine the changes underlying adaptation and to discover previously unknown genetic networks. These discoveries have already led to advances in human health, species conservation, and molecular biology. To meet these goals we have developed a suite of computational and experimental approaches employing comparative genomics and proteomics. Ultimately, our research program develops an evolutionary model in which genomic elements are shaped by their co-evolution with other elements and their environment.

We are a combined computational and experimental lab in the Department of Human Genetics at the University of Utah. We are a member of the Cluster in Evolutionary Genetics and Genomics (CEGG), whose member labs span Human Genetics and Biology.

Eccles Institute for Human Genetics
Department of Human Genetics
جامعة يوتا
Lab Room 6460
15 S 2030 E
Salt Lake City, Utah 84112-5330


شاهد الفيديو: هل تعلم كيف سيكون شكل أطفالك المستقبليون.!! (قد 2022).


تعليقات:

  1. Alvaro

    موضوع لا يضاهى ، أحب حقًا))))

  2. Jarvis

    أعلم أنهم سيساعدونك في العثور على الحل المناسب هنا.

  3. Brakora

    أجد أنك تعترف بالخطأ. سوف نأخذة بعين الاعتبار.

  4. Padruig

    أنا nra) فكرة جيدة.



اكتب رسالة