معلومة

تعدين PDB: لماذا أجد ذرات أقل من أنجستروم واحد؟

تعدين PDB: لماذا أجد ذرات أقل من أنجستروم واحد؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

أحاول العثور على روابط هيدروجينية محتملة بين مانحي الهيدروجين ومتقبلات الحلقة العطرية. أفعل ذلك من خلال التنبؤ بموقع الهيدروجين على المخلفات ثم حساب بعد هذه الهيدروجين عن الحلقات العطرية. إذا كان الهيدروجين أقل من 7.0 أنجستروم من حلقة عطرية معينة ، فأنا أعتبره في الاعتبار: أنا أشكل ناقل NH ، وهو المتجه الذي تم إنشاؤه بواسطة الهيدروجين محل السؤال والنيتروجين في العمود الفقري للبقايا التي ينتمي إليها الهيدروجين إلى. اختبرت أن متجه N-H هذا يشير إلى مستوى الحلقة العطرية ، واختبرت أيضًا أن نقطة التقاطع بين مستوى المتجه العطري والمتجه N-H تقع في حدود 6 أنجستروم من مركز الحلقة العطرية.

إذا تم استيفاء كل هذه الشروط ، فأنا أعتبرها رابطة هيدروجينية بين الهيدروجين والحلقة العطرية. ومع ذلك ، يجب أن تكون بياناتي غير صحيحة ، لأنني أرى حالات يكون فيها الهيدروجين أقل من 1.0 أنجستروم من مستوى العطرية. لا ينبغي أن تقترب الذرات من بعضها البعض.

لقد اختبرت طريقتي يدويًا باستخدام مثال على الحالة حيث حددت الشفرة الخاصة بي أحد سلاسل الهيدروجين الجانبية على ASN وهي 0.3 أنجسترومس من مستوى عطري TRP. لسوء الحظ ، لم أجد أي أخطاء. يمكنك العثور على ملف PDF لهذا التحقق هنا.

أي اقتراحات حول الكيفية التي قد تكون بها طريقة معيبة ستكون موضع تقدير كبير.


إذا كنت تستخدم هياكل NMR ، فقد ترتكب خطأ استخدام العديد من الهياكل المتراكبة - سيكون من الجيد تطوير هياكل الأشعة السينية بدقة أقل من 2.0 A للمبتدئين.

يمكن أن تكون بعض النماذج ذات الدقة المنخفضة قذرة ، ولكن المقدمة بعد عام 1994 أو نحو ذلك لن يكون لها أي مركز إلى مسافات مركزية كما هو الحال عندما تستخدم هياكل الأشعة السينية النماذج الجزيئية بدلاً من مجرد كثافة الإلكترون بشكل صارم والانتهاكات الغريبة في الهيكل يجب أن كن نادرا.

ومع ذلك ، قد لا يكون هذا خطأ - فقد يشير الهيدروجين مباشرة إلى مركز الحلقة العطرية. وقد لوحظ هذا قليلا. في مثل هذه الحالة ، قد تكون المسافة بين الذرة والحلقة صغيرة جدًا.

ما عليك سوى القلق إذا كان المركز إلى المسافة بين الذرات أقل من نصف قطر vanderWaals. أود تصفية مركز الذرة إلى مسافة المركز ومعرفة ما إذا كنت ترى انتهاكات.


الدقة (كثافة الإلكترون)

الدقة من حيث كثافة الإلكترون هو مقياس قابلية الحل في خريطة كثافة الإلكترون للجزيء. في علم البلورات بالأشعة السينية ، الدقة هي أعلى قمة قابلة للحل في نمط الحيود ، في حين أن الدقة في مجهر الإلكترون بالتبريد هي مقارنة فراغ التردد لنصفين من البيانات ، والتي تسعى جاهدة للربط مع تعريف الأشعة السينية. [1]


خلفية

في العقدين الماضيين ، وجدت الطرق الحسابية دورًا ثابتًا في عملية تصميم الدواء العقلاني نظرًا لمساعدتها التي لا تقدر بثمن في تفسير النتائج التجريبية (مثل الرنين المغناطيسي النووي والأشعة السينية) ، وتوليد أفكار جديدة بناءً على النماذج النظرية وتصفح خطوات البحث باستخدام تنبؤي. أدوات. ينبع جزء كبير من "العقلاني" داخل الأساليب الحسابية من تحليل المعلومات الهيكلية من بلورات الأشعة السينية وهياكل الرنين المغناطيسي النووي لمجمعات بروتين يجند. حتى الآن ، أهم مستودع لهذه الهياكل - بنك بيانات البروتين (PDB) [1] - يضم حوالي 120.000 بنية جزيئية كبيرة [2] (تم الوصول إليه في يوليو ، 2016) ومع كل إدخال جديد يحسن فهمنا للأمور البيولوجية والطبية الظواهر ذات الصلة على المستوى الذري. نظرًا لأن ما يقرب من نصف الإدخالات قد تم إيداعها في السنوات الخمس الماضية ، فهناك حاجة لإعادة التقييم الدوري لمعرفتنا حول أهداف الجزيئات الكبيرة وكذلك الروابط التي تتفاعل معها.

في تصميم الدواء العقلاني ، يركز الكيميائيون الحسابيون على خصائص الترابط بما في ذلك الخصائص التوافقية والضبط الدقيق لهيكل الترابط والتنظيم المسبق بهدف تقليل العقوبات النشطة المرتبطة بالمرونة غير المرغوب فيها ، والترتيب دون الأمثل للمجموعات الوظيفية التي تتفاعل مع موقع ربط البروتين أو استقرار داخلي غير مرغوب فيه. عندما تُعرف البنية ثلاثية الأبعاد للبروتين المستهدف (التصميم القائم على الهيكل) ، غالبًا ما تتضمن عملية تحسين الرصاص الحديثة تحديد أوضاع الربط المعقولة - والأكثر استحسانًا - أيضًا النشط بيولوجيًا باستخدام الالتحام الجزيئي والتسجيل. نظرًا لأن حساب المرونة الجزيئية الكاملة لكل من الليجند والبروتين في وقت واحد أمر معقد للغاية ويتجاوز حاليًا قدرتنا الحسابية ، فإن بعض طرق الإرساء تولد مسبقًا أجهزة مطابقة ليجند معقولة في بحث توافقي ثم حاول إدخالها في (إما جامدة أو مرنة) موقع ارتباط للبروتين المستهدف يبحث عن أفضل تكامل ممكن للخصائص الفراغية والإلكترونية [3 ، 4 ، 5 ، 6 ، 7 ، 8]. كبديل لهذا النهج ، تستخدم بعض البروتوكولات إنشاء المطابق أثناء الطيران في تجويف ربط المستقبل [9 ، 10] أو الاعتماد على الالتحام المستند إلى الجزء مع مرونة دوران كاملة لزوايا ثنائية الأضلاع [11 ، 12].

تعد المطابقات المفضلة ليجند ، الناتجة عن البحث المطابق ، ذات أهمية رئيسية أيضًا في التصميم القائم على الترابط ، عندما تكون المعلومات الهيكلية حول الهدف نادرة أو غير موجودة ، وبالتالي يجب اشتقاق الفرضية الملزمة التي تفترض تكامل قفل المفتاح من تشترك الروابط المعروفة في ترتيب ثلاثي الأبعاد مشترك للمجموعات الوظيفية (حامل الأدوية) [13 ، 14].

لقد تم الاعتراف منذ فترة طويلة بالحاجة إلى المطابقات منخفضة الطاقة ، لا سيما في سياق العثور على التشكل النشط بيولوجيًا. لذلك تم تطوير وتنفيذ عدد من خوارزميات البحث وطرق أخذ العينات المختلفة في بروتوكولات لتوليد المطابقات من الجزيئات الصغيرة (مثل المخدرات) [15،16،17]. تعتمد بعض الأدوات على نهج منظم (مثل CORINA [18 ، 19] ، ConfGen [3] ، OMEGA [20 ، 21]) وبعضها يستخدم نهجًا عشوائيًا (مثل BALLOON [22] ، RDKit [23]). البروتوكولات شائعة الاستخدام مثل Catalyst [24] و MOE [25] و MacroModel [26] تنفذ كلا النهجين [15 ، 27]. تمت مناقشة أهمية أخذ العينات المطابقة والتحديات في العثور على الوضع النشط بيولوجيًا بين مجموعة من المطابقات المتولدة سابقًا في العديد من الدراسات [14 ، 28 ، 29 ، 30 ، 31 ، 32].

أثناء البحث المطابق ، يتم تحسين الهندسة (تقليل الطاقة) للمطابقات بواسطة مجال القوة. وبالتالي ، يعد حقل القوة المحدد جيدًا شرطًا أساسيًا لضمان أن تجمع المطابق الناتج يتضمن التشكل الحيوي النشط (أو واحد مشابه جدًا له). نظرًا لأن طاقة المطابقة غالبًا ما تكون أهم معيار للاختيار ، يجب أن تكون جميع شروط مجال القوة لحساب الطاقات (الروابط والزوايا وزوايا ثنائية الأضلاع والكهرباء الساكنة وفان دير فالس (vdW) ومساهمات الحل) دقيقة ومتوازنة بشكل متبادل. تم بالفعل تقييم أداء بعض حقول القوة لمجموعات محددة من الروابط أو الببتيدات الصغيرة [33 ، 34 ، 35]. في هذه الدراسة ، قمنا بالتحقيق في العديد من مجالات القوة المستخدمة بشكل متكرر (تم تنفيذها في حزمة برامج تجارية شهيرة [26]) لقدرتها على إنشاء وترتيب المطابقات النشطة بيولوجيًا لمجموعة متنوعة جدًا كيميائيًا من الروابط الشبيهة بالعقاقير.


مصدر المشاكل والتدابير الوقائية العامة

قد يشير الوصول الجاهز إلى الأدوات القوية من قبل المستخدمين غير المدربين أو الذين يخضعون للإشراف الضعيف إلى عدم الكفاءة الفنية باعتباره السبب الرئيسي للأخطاء. ومع ذلك ، يشير فحص المنشورات الحديثة التي تسلط الضوء على بعض "التفاح الفاسد" [2] ، أو مجرد ترتيب النماذج حسب مؤشرات الجودة الرقمية [3-5] ، إلى أن النماذج السيئة ترتبط دائمًا تقريبًا بكعب أخيل الرئيسي لعلم البلورات الجزيئي الحيوي: التفسير من كثافة الإلكترون. على النقيض من علم البلورات الجزيئي الصغير ، نادرًا ما تكون خرائط كثافة الإلكترون الجزيئية بدقة ذرية ، وأحيانًا تكون ذات جودة رديئة ، وغالبًا ما تتعرض للخطر نتيجة - من الصعب فك - اضطراب جزيئي معقد وعدم تجانس. تسمح خطوة تفسير كثافة الإلكترون للعنصر الذاتي للعقل البشري ، الموجود دائمًا ، بالتأثير على عملية بناء النموذج.

هناك عنصران رئيسيان مرتبطان بالعقل البشري يهددان قوة العملية: التوقع المعرفي الموثق جيدًا - والتحيز التأكيدي [٦ ، ٧] ، وإهمال الانضباط الصارم في التفكير التجريبي. لا يوجد شيء جديد في هذه الرؤية: التحيز المعرفي تم التعرف عليه بالفعل من قبل العقول العظيمة في عصر التنوير المبكر ، راجع. [8]. بعد ذلك ، تم إدراك أن المعرفة السابقة يمكن أن تحد من التوقعات [9 ، 10] وأن التفكير التجريبي يتطلب ادعاءً قويًا مدعومًا بأدلة تجريبية قوية مماثلة. بالإضافة إلى ذلك ، فإن القابلية للتزييف هي المطلب الأساسي للفرضية العلمية [11 ، 12]. اعتمد علم البلورات البروتيني مبكرًا جدًا مفاهيم بايز والاحتمالية [13-18] لمواجهة الرغبة المنتشرة في العثور على ما يبحث عنه المرء [19 ، 20] ، واقترح تدريبًا معرفيًا أفضل كعلاج منهجي ، على سبيل المثال [21 ، 22].


مناقشة

كان الهدف من هذه الدراسة هو تطوير تحلل منهجي لمساحة بنية البروتين المعروفة والتي تكون مدمجة وعالمية ومفصلة بما يكفي لتوفير نظرة ثاقبة لعلاقات الهيكل والتسلسل. تشكل مجموعة TERM التي نقوم بتجميعها هنا مثل هذا التحلل ، الذي يغطي المستويات الثانوية والثالثية وحتى الرباعية للتسلسل الهرمي الهيكلي. علاوة على ذلك ، فإن الطريقة التي نستخلص من خلالها المصطلحات ، عبر شكلية الغلاف المحدد ، عامة ويمكن استخدامها لتطوير التحليلات باستخدام قواعد بيانات هيكلية بديلة وتعريفات للتغطية.

نجد أن الكون البنيوي للبروتين متدهور للغاية ، وهو ما يتضح من الزيادة السريعة للتغطية الهيكلية كدالة لعدد TERMs المستخدمة (الشكل 1).ب). من ناحية أخرى ، لتجاوز 70-80٪ من التغطية ، يلزم عشرات الآلاف من TERMs الفردية ، ويتبع منحنى التغطية الإجمالي قانون القدرة (الشكل 1)ب, أقحم). وهكذا يبدو أنه على الرغم من كونه متدهورًا ومتكررًا للغاية ، إلا أن الكون يتطور باستمرار. الزخارف باتجاه نهاية الذيل لمنحنى التغطية في الشكل 1ب تمثل الأشكال الهندسية غير المتكررة ، والتي ينشأ بعضها من عدم دقة التحديد الهيكلي (الملحق SI، الشكل S5) ، ولكن معظمها يمثل خروجًا حقيقيًا (وإن كان صغيرًا نسبيًا) عن مصطلحات TERM العامة الأكثر شيوعًا (الملحق SI، تين. S6 و S7).

يجب أن تؤثر الاعتبارات الديناميكية الحرارية الهيكلية على حدوث TERMs لأنها تقيد تطور بنية البروتين. من المحتمل أيضًا أن تساهم القيود المادية الأخرى ، بما في ذلك قابلية التصميم ، والخصوصية الهيكلية ، والقابلية للذوبان ، وما إلى ذلك ، وبالتالي ، يمكننا التفكير في TERMs ، بنمط التكرار والتحيز المتسلسل ، كترميز معين لتخطيط هيكل التسلسل ، مدفوعًا بمقياس معقد يتضمن الخصائص المذكورة أعلاه (من بين أمور أخرى). لقد استجوبنا هذا التعيين باستخدام الإحصائيات المستندة إلى TERM لاقتراح التسلسلات المحتملة وفقًا للعمود الفقري الأصلي. أنتج هذا الإجراء تسلسلات مماثلة لتلك الأصلية (الجدول 1) ، وهو أمر ملحوظ بالنظر إلى أن النهج القائم على TERM لا يأخذ صراحة في الاعتبار التفاصيل الذرية. تعتبر العوامل الزائفة المستندة إلى TERM أكثر نجاحًا في التنبؤ بتغير التسلسل التطوري (الملحق SI، الشكل S18) ، ينتج الحمض الأميني الصحيح الإجماع في 35٪ من المواضع. جنبًا إلى جنب مع الأداء النسبي العالي على العمود الفقري للرنين المغناطيسي النووي (الجدول 1) ، تشير هذه النتائج إلى أن إحصاءات TERM قد تعكس تفضيلات المجموعة الهيكلية التي يمثلها العمود الفقري المحدد ، وليس فقط التشكل المحدد المقدم.

نؤكد أن إجراء التصميم الخاص بنا شديد التبسيط وأن هدفنا في تطويره كان مجرد التحقيق في علاقات التسلسل والبنية الظاهرة التي تم ترميزها بواسطة TERMs. لا يزال يتعين استكشاف ما إذا كان يمكن استخدام نوع مختلف من هذه الطريقة من أجل نهج قوي لتصميم البروتين بشكل عام. من ناحية أخرى ، تشير نتائجنا إلى أن الرؤية المستندة إلى TERM قد تكون مفيدة لطرق تصميم البروتين. كخطوة أولى نحو استكشاف هذا الاحتمال ، استخدمنا عناصر زائفة قائمة على TERM لتقييد أبجدية الأحماض الأمينية تلقائيًا في إعادة تصميم التسلسل المستند إلى Rosetta ، مما أدى إلى معدلات استرداد تسلسل أصلية أعلى من Rosetta وحدها (الجدول 1). التفسير المحتمل لهذه النتيجة هو أن طلب اتفاق بين وظيفة التسجيل الذري المفصلة في Rosetta و TERM المستندة إلى المجموعة الأكثر مرونة ، وكلاهما دقيق جزئيًا فقط ، يثري مساحة التسلسل المتبقية للحصول على حلول جيدة (ربما على حساب تقليل التسلسل مساحة أكبر من اللازم).

بعد استجواب قدرة TERM على التنبؤ بالتسلسل من الهيكل ، أظهرنا بعد ذلك أن العكس ممكن أيضًا - استخدام إحصائيات TERM للتنبؤ بالزخارف الهيكلية المحلية من التسلسل وحده (الشكل 6 و الملحق SI، تين. S19 و S20). هذه القدرة لها أهمية خاصة في TERMs متعددة القطاعات ، لأنها تعني أن المقاطع البعيدة في التسلسل يمكن التنبؤ بها لتكون متجاورة في الفضاء - وهو تحد كبير في التنبؤ بالبنية. ظهرت خطوات كبيرة نحو معالجة هذا التحدي مؤخرًا من التنبؤ بالاتصالات على أساس التباين التطوري (70 ، 71) ، ولكن الأهم من ذلك ، أن مثل هذا التنبؤ لا ينطبق إلا على البروتينات الأصلية ، وخاصة تلك التي تحتوي على MSAs العميق المتاح. من ناحية أخرى ، يبدو أن التعدين المستند إلى TERM قابل للتطبيق تمامًا على بروتينات de novo ولا يتطلب أي تماثل (الشكل 6) ، مما يوفر مزيدًا من الأدلة على عمومية الإحصائيات المشفرة TERM. تكمل هذه النتائج النتائج السابقة التي توصلنا إليها والتي تبين أن إحصائيات التسلسل من الزخارف الشبيهة بـ TERM كافية ، من تلقاء نفسها ، للتمييز بين نماذج التنبؤ بالهيكل الجيد والضعيف على قدم المساواة مع وظائف التسجيل الرائدة أو أفضل منها (55). يجب أن يتيح توافر TERMs العالمية مسبقة الصنع ، ولكل منها نموذجها الإحصائي الخاص بها ، العديد من الاستخدامات الجديدة لتحسين تنبؤ الهيكل.

السؤال الأساسي المهم هو لماذا تتكرر TERM. هل يرجع ذلك أساسًا إلى الفيزياء الحيوية لبنية البروتين وقابلية تصميمه ، أم أن الكثير من الانحطاط يرجع ، على سبيل المثال ، إلى القيود الوظيفية للتطور؟ على الرغم من صعوبة تحديد الإجابة بشكل نهائي ، فمن المحتمل أن يكون مزيجًا من هذين العاملين. يشير الحدس إلى أن TERMs ذات الأولوية العالية ، والتي تحدث عبر مجموعة متنوعة للغاية من البروتينات ، والتي لا ترتبط بأي دور خلوي معين ، أو التوطين ، أو الأنواع المضيفة ، من المحتمل أن تتكرر نتيجة للمبادئ الفيزيائية الحيوية الأساسية. من ناحية أخرى ، من المحتمل أن تتأثر TERMs التي تحدث داخل البروتينات المنحازة وظيفيًا (على الرغم من أنها لا تزال متنوعة تمامًا) بالقيود الوظيفية والتاريخ التطوري. لقد سعينا تحديدًا إلى أمثلة على TERMs التي تتكرر في سياق وظيفة ، مثل ربط المعدن أو الماء (الشكل 5 و الملحق SI، تين. S9 – S13). الأهم من ذلك ، مع ذلك ، لن تؤثر كل وظيفة بالضرورة على اختيار TERM. لن يظهر هذا التحيز إلا إذا: (أنا) ترتبط الوظيفة بزخارف هيكلية محددة جيدًا نسبيًا و (ثانيا) تكون الأشكال الهندسية المقابلة إما في كل مكان أو أن الوظيفة نفسها شائعة (بين البروتينات المتنوعة). في كلتا الحالتين ، يمكننا اعتبار الزخارف الناتجة وحدات حقيقية لبنية البروتين. وبالتالي ، فإن عالمية TERMs التي تم اكتشافها بواسطة إجراء الغلاف المحدد يجب أن تكون ثابتة بشكل عام ، سواء كانت لها وظيفة مرتبطة أم لا.


اختبار البيولوجيا الجزيئية 1

هناك افتراض بأن الجينات المعزولة والجزيئات الحيوية وهياكلها لها قوة تفسيرية كافية لتوفير فهم للنظام الحيوي بأكمله.

نعتقد أن الفهم الكامل لما يلي:
A. ستأتي الكائنات الحية من دراسة الخلايا
ب. ستأتي الخلايا من دراسة بنية ووظيفة (الأنشطة والتفاعلات) للجزيئات البيولوجية

1. حافظ على الأشياء بسيطة. تُفضل النظريات البسيطة والفعالة على النظريات الأكثر تعقيدًا مع المزيد من الافتراضات

1. اسكتشات على الورق مثل الرسوم التخطيطية التي تستخدم تمثيلات منمنمة للجزيئات
2. نماذج ملء الفراغات الفيزيائية مثل نماذج CPK
3. نماذج مقياس افتراضية تم إنشاؤها بواسطة الكمبيوتر تمثل (جزيئات ثابتة ثلاثية الأبعاد وجزيئات ديناميكية رباعية الأبعاد)

من الذي اقترح أولًا وحدة أساسية في الكيمياء الحيوية لجميع الكائنات الحية؟

ماذا تمتلك أنظمة النماذج البسيطة نسبيًا؟ على سبيل المثال؟

1. لعب دورًا حاسمًا في نجاح البيولوجيا الجزيئية
2. تم استخدامها كنقطة انطلاق لدراسة نفس العملية في الكائنات الحية الأكثر تعقيدًا
على سبيل المثال: استخدام الإشريكية القولونية وفيروساتها لاستقراء الكائنات الحية الأخرى (آليات مشتركة)

كيف يتم تصنيعها؟ (3)

الأحماض النووية (DNA و RNA) (2)

1. عن طريق الجمع المتسلسل للوحدات الأحادية
2. على الآلات الجزيئية ذات الأنشطة التحفيزية
3. استخدام آلية محفوظة لإضافة وحدات أحادية

البروتينات:
1. الوحدات أحادية هي مخلفات الأحماض الأمينية
2. تم تصنيعه على الريبوسومات وهي عبارة عن آلات بلمرة تتكون من بروتينات و RNAs

غير متوفر:
1. الوحدات الأحادية هي أحادي الفوسفات النيوكليوزيد
2. توليفها بالتسلسل بواسطة آلات البلمرة (البوليميرات) المكونة من البروتينات

على بعد واحد من نهاية الكربوكسيل

كيف يتم تمييزها تجريبيا؟

ما الاتجاه الذي تذهب إليه الأحماض الأمينية؟ د؟

متى يتم دمج الأحماض الأمينية L فقط؟

3 أمثلة من الأحماض الأمينية D الموجودة في الجزيئات الحيوية

بالنظر إلى كربون ألفا على طول رابطة الهيدروجين والكربون ، قم بتتبع قوس من الكربوكسيل إلى المجموعة R إلى المجموعة الأمينية
1. في اتجاه عقارب الساعة لـ L.
2. عكس اتجاه عقارب الساعة لـ D.

أثناء تخليق البروتين على الريبوسومات

1. ببتيدوغليكان (بوليمر جدار الخلية للبكتيريا)
2. بعض المضادات الحيوية الببتيدية
3 - فوليسين (ببتيد عصبي مشفر وراثيا)

ما هي وظيفة الشحنة؟

ما هو pKa؟ (مثال على مجموعة ألفا كاربوكسيل / مجموعة ألفا أمينو)

pKa هو الرقم الهيدروجيني الذي ينفصل عنده بروتون معين في نصف الجزيئات (HA = A- ، ثم يمكنك وضع HA في القوس A- وإلغائها بحيث يكون Ka = H + ثم pH = pKa.

يبلغ pKa من مجموعة alpha carboxyl حوالي 2.3 مما يعني أنه عند درجة الحموضة 2.3 يتم نزع نصف الجزيئات ونصفها بروتونات.

pKa لمجموعة alpha amino هو 9.6

كيف تقدر pI للغلوتامات (تنفصل مجموعة الكربوكسيل السفلية قبل القمة)؟ (4)

اكتب أنواع الشحنات المختلفة
○ قم بتعرف الشكل الكهربي (0)
○ بي أكاذيب

في منتصف المسافة بين pKa1 و pKa2 لأنها خطية إلى حد ما بين الاثنين.
○ بي

(2.19 + 4.25) /2=3.2 - & GT حيث يكون محايدًا كهربائيًا
pKa1 هو المكان الذي يكون فيه نصف نصف في النصف السفلي من الكربوكسيل ، لذلك عند 1 مول ، يكون كل شيء في الشكل 2 ، لذلك عند 1.5 (pKa2 - يعني في الجزء العلوي الكربوكسيل ، تكون البروتونات نصف متوقفة عن النصف) ، يكون pKa3 حيث تقوم بشحن المجموعة الأمينية.

ما الذي يعتمد عليه pKa لـ AAs؟

ما هي سلسلتان جانبيتان سالبتي الشحنة عند درجة حموضة محايدة؟ إيجابي؟

1. D (حمض الأسبارتيك ، السلسلة الجانبية لحمض الخليك).
2. ه (حمض الجلوتاميك ، سلسلة جانبية حمض البروبيونيك).

سلاسل جانبية مشحونة إيجابياً عند درجة حموضة محايدة
1. K (ليسين ، سلسلة جانبية بوتيلامين).
2. R (أرجينين ، سلسلة جانبية بروبيل جوانيدينيوم)

ما نوع السلاسل الجانبية التي تمتلكها وما الذي ينضم إليه البعض؟

ما هو الكبريت غير المشحون في الاعتبار؟

كيف تقيس الكراهية النسبية للماء

اشرح معامل التقسيم

اشرح معادلة دلتا

قم بقياس قابلية الذوبان النسبية للسلسلة الجانبية بين الماء والمذيبات العضوية الكارهة للماء مثل الديوكسان أو 1-أوكتانول

• معامل التقسيم (Kp =
[X] ديوكسان / [X] ماء) يمكن استخدامها لتقدير الطاقة الحرة القياسية
التغيير (deltaG ^ o) المصاحب لنقل السلسلة الجانبية من الماء إلى الطور العضوي.

أضف سلسلة جانبية وابحث عن معامل التقسيم إذا كان مرتفعًا فهو غير قطبي ، وإذا كان منخفضًا فهو قطبي.

القياسات التي تم إجراؤها في ظل ظروف درجة حرارة وضغط ثابتين للنظام عند التوازن ، يتم تقدير تغيير الطاقة الحرة القياسي الذي يصاحب نقل سلسلة جانبية من الماء بواسطة deltaGo = - RT ln Kp

ماذا تشمل السلاسل الجانبية العطرية لـ AA؟ (3)

ما هو استثناء من الجلايسين؟

ما الذي يميز الجلايسين؟ (انظر الشريحة الخاصة بالهيكل) Proline؟

كم عدد AAs المختلفة الموجودة؟ ما هي نتيجة لهم؟ (2)

ما هي أمثلة المجموعات الكيميائية المضافة إلى البروتينات؟ (4)

339 AAs مختلفة كيميائياً إنزيم ما بعد متعدية محفز: 1. إضافات لمجموعات كيميائية 2. أزمرة من L إلى D

1. الفوسفات
2. مجموعات الميثيل
3. الكربوهيدرات (السكريات)
4. الدهون

ما هو أول AA في سلسلة؟ ثانيا؟

هذه ليست الآلية التي يتم من خلالها تصنيع البروتينات على الريبوسومات (وليس كيفية ربطها بالـ AAs)

يتم إجراء هجوم نووي على الزوج الوحيد من O والمجموعة المغادرة هي الماء

الأول هو الطرف الأميني والثاني هو الطرف الكربوكسيل

1 رابطة تساهمية مستقرة جدا:
أ. يتطلب التحلل المائي الكامل 6 N HCl و 100 درجة مئوية و 12-24 ساعة.
ب. البروتياز عبارة عن إنزيمات تحفز التحلل المائي السريع للروابط الببتيدية للبروتينات عند درجة الحموضة المحايدة ودرجة حرارة الغرفة

ما هي المكونات الثلاثة للنيوكليوتيدات؟

ما هي شروط نيوكليوتيدات int من pKa؟

مما تتكون النيوكليوسيدات؟ (2)

1. Cyclic 5 Carbon sugar sugar (DNA has D-2'-deoxyribose، RNA has D-ribose)
2. البيورين (A أو G ، [R]) أو بيريمادين (C ، T ، أو U ، [Y])
3. واحد أو أكثر من الفوسفات تعلق على 5 'كربون من الريبوز

إنها حمضية (pKa و pKb من الفوسفات المرتبط بالإستر هي .7 إلى 1 و 6.1 إلى 6.3)

1. سكر الريبوز
2. قاعدة البيورين أو بيريميدين

ماذا يسبب نزع الامين؟

ما الذي ينتج عنه نزع الأمين التأكسدي؟

1. حلقة النيتروجين
2. الأكسجين والنيتروجين exocylic

يميلون إلى الارتباط مع أنفسهم
من خلال التراص التفاعلات.

• نزع الأمين هو مادة كيميائية عفوية
رد فعل في محلول يحول:
1. السيتوزين إلى اليوراسيل
(التي تتزاوج مع A).
2. الأدينين إلى هيبوكسانثين
(التي تتزاوج مع C).
3. جوانين إلى Xanthine
(التي تتزاوج مع C).

يؤدي إلى فقدان المجموعة الأمينية والارتباط المزدوج للأكسجين (Adenine - & gt hypoxanthine)

ما هي أهمية الروابط الضعيفة؟

ماذا تشمل الروابط التساهمية؟ صِف لهم وقوتهم.

ماذا يحدث إذا كانت الوحدات الأحادية للمولود الكبري متماسكة معًا فقط بواسطة روابط تساهمية؟

1. الرابطة بين الببتيد
بقايا الأحماض الأمينية.
2. الرابطة بين ثاني كبريتيد
بقايا السيستين.
3. N- الارتباط بين الجليكوسيد
البيورين (N1) / بيريميدين (N9)
و C1 من الريبوز. (في DNA أو RNA)
4. إستر الارتباط بين C5
من ريبوز و PO4 ^ -2
5. ارتباط أنهيدريد
بين زوج من الفوسفات (بيروفوسفات)
تندمج مدارات الإلكترون للذرات الفردية معًا وتشكل مدارات جزيئية و quothybrid & quote. قوة bobnd هي كمية الطاقة التي يمكن أن تضعها لكسر الرابطة فعليًا. إذا قمت بتجميع H-H معًا ، فإنها تشكل رابطة سيجما.

ثم في الحل سوف يفعلون
افترض نوعًا من الهيكل يسمى الملف العشوائي.

لماذا ليست البوليمرات الحيوية ملفات عشوائية؟

ماذا تفعل الروابط التساهمية القوية مقابل القوى الضعيفة؟

في أي شيء تلعب القوى الضعيفة دورًا حاسمًا؟

البوليمرات الحيوية ليست ملفات عشوائية للأسباب التالية:
1. وحدات أحادية للتفاعل عبر.
تفاعلات الترابط الضعيفة.
2. تمت إضافة العديد من الروابط الضعيفة معًا
يشكل قوة كبيرة أن
يتسبب في ثني البوليمر وتكثيفه.

تربط الروابط التساهمية المخلفات لتشكيل بوليمرات
تتسبب القوى الضعيفة في تكثيفها وضغطها لتشكيل مجموعات

تحديد البنية ثلاثية الأبعاد والوظيفة والتفاعل

• إذا لم يتم تطبيق أي قوى على سلسلة بوليمر ملفية عشوائية ،
سيكون له طول متوسط ​​مربع من طرف إلى طرف:

R ^ 2 = ملحوظة ^ 2
• b هو طول البقايا ، N هو عدد البقايا
• متوسط ​​حجم الملف العشوائي هو

ما هي سماحية الفراغ؟

اشرح الصورة على الشريحة؟

القوة الكهروستاتيكية التي تعمل بين الجسيمات المشحونة
يتم إعطاء Q1 و Q2 بموجب قانون كولوم:

• وحدة الشحنة الكهربائية هي كولوم (C)
س = 1.6 × 10-19 درجة مئوية
r = المسافة بالأمتار التي تفصل بين الجسيمات.
E = ثابت العزل الكهربائي (يعكس ميل
متوسط ​​لحماية شحنة واحدة من أخرى)
E_0 = 8.9 X 10-12 C ^ 2N ^ -1m ^ -2 سماحية الفراغ
1 / 4piE_0 = 9.0X10 ^ 9 نانومتر ^ 2 / C ^ 2

قياس بعض المواد لنقل مجال كهربائي

يتم تشكيل قضيب صلب لأن كل المونومرات لها نفس الحجم. إذا أدخلت الملح ، تبدأ أيونات الملح بالطن في تحييد المونومر وبالتالي يمكن أن يبدأ البوليمر في الانضغاط.

لنفترض أن جسر الملح مستقر ، ماذا يحدث؟

ما مدى الأس الهيدروجيني المستقر للجلوتاميك؟

ماذا يحدث عندما تذوب بلورات كلوريد الصوديوم في الماء؟

يحدث هذا عندما يتم شحن أكثر من نصف المجموعات (نصف الجلوتاميك له شحنة سالبة على الكربوكسيل وشحنة موجبة على الأمونيوم)

بين 4.25 وأقل 10.53
عند درجة الحموضة المحايدة ، يكون جسر الملح مستقرًا لأنه يقع بين هذا النطاق

تشكل جزيئات الماء أغلفة مذابة موجهة (هذا الماء لا يتحرك بشكل طبيعي فقط - إنه يبقى في مكانه. إنه ليس مجرد قشرة واحدة تتشكل - هناك غلاف داخلي واحد حول أيون ثم أكثر.

من أين تمتد الرابطة H؟

ماذا تقترح التجارب حول روابط H؟

إذا كان لديك O-H-O ، فإن الرابطة H تنتقل من مركز O إلى مركز O الآخر.

أين يتم رؤية سندات H قوية جدًا؟ ما هي مستقرة في؟

ثنائيات حمض الفورميك وثنائيات حمض الأسيتيك. مرحلة الغاز.

ماذا يحدث للبروتينات في محلول مائي؟

ما هو جوهر البروتينات الأصلية؟

استنادًا إلى الرسم البياني ، لماذا ترتفع H و E و D؟

تنثني البروتينات تلقائيًا إلى هياكل مدمجة تقسم السلاسل الجانبية للأحماض الأمينية الكارهة للماء بعيدًا عن جزيئات الماء السائبة.

غالبًا ما توجد H و E و D في المواقع النشطة للإنزيمات ، لذلك تشارك الكربوكسيلات في العملية التحفيزية

لأنه يحتوي على شبك حاد في الببتيد

كيف هي جزيئات الماء في القفص؟

وما هو تكوين هذه الأقفاص المصحوبة؟

صف دلتا H في درجة حرارة الغرفة مقارنة بدلتا S.

صف الصورة على الشريحة

تسمى جزيئات الماء في القفص & quotoriented & quot لأنهم لا يتمتعون بحرية الحركة مثل & quot؛ تجميع & quot جزيئات الماء.

تشكيل أقفاص المياه الموجهة يرافقه انخفاض كبير في
إنتروبيا متعدية (deltaS_tr كبيرة وسلبية).

في درجة حرارة الغرفة ، تكون deltaH_tr سالبة وصغيرة مقارنة بـ deltaS_tr

في الصورة ، هناك 36 H2O موجهًا حول 4 كائنات ، ثم لديك 19 كائنًا و 18 موجهًا H2O ، أطلقنا 17 جزيئًا في طور الماء السائب. في نظام مغلق يزداد الانتروبيا بمرور الوقت. على اليسار لدينا مستحلب ، لكن بمرور الوقت ، ينفصلون على اليمين عندما تزداد الإنتروبيا.

متى تتعطل؟ (3 أشياء محددة حول هذا)

ماذا يحدث إذا قمت بتقليل درجة حرارة مستحلب الزيت؟

ما هي العلاقة بين دلتا ودلتا ودرجة الحرارة؟

ماذا يحدث لبعض البروتينات في درجات حرارة منخفضة؟ (مثال)
لماذا قد يكون هذا؟

لماذا تعتبر البقع الكارهة للماء على سطح البروتينات مهمة؟

تتكسر بالقرب من نقطة أساس الماء:
1. أقفاص الماء حول الجزيئات الكارهة للماء
لم تعد مرتبة أكثر من المذيب السائب deltaStr = 0).
2.! Htr سلبي صغير
3.! Gtr سلبي

إذا قمت بتقليل درجة حرارة مستحلب الزيت ، فستفقد تأثير الانتروبيا مع استمرار التبريد لأن جزيئات الماء ستبدأ في توجيه نفسها في العملية كما تفعل عند تكوين الجليد.

! H tr و! Str ليس لهما نفس الاعتماد على درجة الحرارة ، لذلك هناك درجة حرارة يكون فيها التأثير الكارهة للماء أقوى.

• بعض البروتينات مثل إنزيم النيتروجينيز يفسد في درجات حرارة منخفضة قد يساهم الانخفاض في قوة التأثير الكارهة للماء في تمسخ بعض البروتينات في درجات الحرارة المنخفضة.

تعتبر البقع الكارهة للماء الموجودة على سطح البروتينات مهمة للتفاعل بين البروتينات التي تؤدي إلى تكوين بروتينات متعددة الوحدات.


تحضير ملفات MM لـ CPMD

دعونا نلقي نظرة على التكوين الأخير الذي تم الحصول عليه من موازنة الديناميات الجزيئية الكلاسيكية:

تُظهر الصورة النظام الذي تم حله دون تطبيق شروط الحدود الدورية (PBC) التي تأخذها برامج الصنفرة والعديد من البرامج الأخرى في مجموعة AmberTools في الاعتبار. لذلك ، في هذا التمثيل ، تنجرف الجزيئات بمرور الوقت وقد تمتد عبر خلايا دورية متعددة ، وهذا وضع طبيعي في MD. ومع ذلك ، نريد الآن الانتقال إلى CPMD من أجل إجراء محاكاة QM / MM MD ، ولا يطبق CPMD PBC "تلقائيًا" على تكوين البداية. وبالتالي ، نحتاج إلى "إعادة رسم" الإحداثيات في خلية الوحدة الأولية. يمكن تنفيذ هذه المهمة بواسطة برنامج cpptraj في مجموعة AmberTools. انقل ملفات الهيكل والإحداثيات النهائية إلى مجلد ثم أنشئ ملف الإدخال eq_density.cpptraj لـ cpptraj:

قم بتشغيل cpptraj وفقًا لهذا النحو:

تحقق من أن إعادة التصوير قد تم بشكل صحيح:

تم الحصول على الصورة أعلاه باستخدام VMD عن طريق تحديد (في قائمة العرض) وضع العرض العمودي بدلاً من المنظور الافتراضي.

نحن الآن جاهزون لتحويل الهيكل الخاص بنا وتنسيق الملفات بتنسيق يمكن لواجهة QM / MM الحالية الخاصة بـ CPMD قراءتها. رمز amber12togromos.x 13 الذي يمكنك العثور عليه في ملف tarball أعلاه ، هو برنامج داخلي (المصدر متاح تحت الطلب: [email protected]) كتب منذ بضع سنوات لتحويل ملفات Amber MD في GROMOS التنسيق 14:

يسمح خيار "solvate" للشخص بتحديد وجوب معاملة جزيئات الماء على أنها جزيئات مذيبة: هذا مفيد فقط إذا كنت مهتمًا بقراءة طاقات ملف السجل CPMD والكميات الأخرى المقسمة إلى مكونات مذابة ومذيب.

سينشئ المحول الملفات النصية التالية:

gromos.top ملف طوبولوجيا GROMOS لنظامنا

gromos.inp ملف الإدخال GROMOS

gromos.crd ملف الإحداثيات بتنسيق GROMOS96

ملاحظة: لفتح وتصور ملف gromos.crd باستخدام VMD:

هذه الملفات الثلاثة جاهزة لمحاكاة QM / MM MD. ومع ذلك ، قد تكون بعض التغييرات في هذه الملفات ضرورية لإعداد المحاكاة بشكل صحيح. فيما يلي نصف الأقسام الأكثر صلة 15 من هذه الملفات التي تحتاج إلى التحقق منها. لاحظ أن الكود amber12togromos.x يوفر ملف gromos.inp بأقسام كاملة التعليقات.

في قسم النظام ، يجب أن يكون الرقمان متسلسلين:

عدد جزيئات الذائبة (المتطابقة) (ليس بالضرورة جزء QM!) 16

عدد جزيئات المذيب (المتطابقة) (ليس بالضرورة جزء MM!)

يمكن الحصول على هذه المعلومات على سبيل المثال من خلال فحص ملف gromos.crd:

يجب أن يكون الرقم الأول 0 للنظام المعزول & gt0 إذا تم استخدام PBC في صندوق متوازي السطوح & lt0 إذا تم استخدام PBC في صندوق ثماني السطوح.

الأرقام الثلاثة التالية هي أحجام الصندوق التي يمكن قراءتها في نهاية ملف gromos.crd.

90.0 هي الزاوية بين المحور x و z للمربع.

يتم تجاهل الرقم الأخير بواسطة CPMD في محاكاة QM / MM.

في القسم الفرعي ، يجب أن تكون الأرقام المتسلسلة:

عدد الجزيئات الذائبة (المختلفة) 18.

فهرس الذرة الأخيرة للجزيء المذاب الأول.

فهرس الذرة الأخيرة للجزيء المذاب الثاني.

يمكن قراءة هذه البيانات من ملف gromos.crd:

في القسم PRINT ، قد ترغب في تعديل الرقم الأول ، وهو عدد الخطوات بعد أن يكتب CPMD معلومات الطاقة في ملف الإخراج (100 عادة ما تكون كافية).

في قسم FORCE ، أسفل سطر 1 (الذي يشغل مكونات القوة المختلفة ، بحيث عندما تكون 1 فقط موجودة ، يتم تضمين جميع شروط القوة في الحسابات) ، علينا أن نضع:

عدد الطبقات المختلفة ، عادة 2 (مذاب ومذيب)
فهرس الذرة الأخيرة من الطبقة 1
فهرس آخر ذرة من الطبقة 2

  1. In the section ATOMTYPENAME replace the names of the types of the atoms, coming from the standard generic force field library GAFF (o, c, c3, etc):

The correctly modified files gromos_mod.top and gromos_mod.inp have been provided in the tutorial subfolder 5-Preparing_the_MM_files_for_CPMD


تراكيب الأحماض الأمينية الشائعة

تختلف الأحماض الأمينية الموجودة في البروتينات عن بعضها البعض في هيكل جانبها (ص) سلاسل. أبسط الأحماض الأمينية هو الجلايسين ، وفيه ص هي ذرة هيدروجين. في عدد من الأحماض الأمينية ، ص يمثل سلاسل الكربون المستقيمة أو المتفرعة. أحد هذه الأحماض الأمينية هو ألانين ، وفيه ص هي مجموعة الميثيل (―CH3). فالين ، وليوسين ، وإيزولوسين ، مع فترة أطول ص المجموعات ، أكمل سلسلة سلسلة الألكيل الجانبية. سلاسل الجانب الألكيل (ص المجموعات) من هذه الأحماض الأمينية غير قطبية ، وهذا يعني أنه ليس لديهم تقارب مع الماء ولكن لديهم بعض التقارب لبعضهم البعض. على الرغم من أن النباتات يمكن أن تشكل جميع الأحماض الأمينية الألكيلية ، إلا أن الحيوانات يمكنها تصنيع الألانين والجليسين فقط ، وبالتالي يجب توفير الفالين والليوسين والإيزولوسين في النظام الغذائي.

اثنان من الأحماض الأمينية ، يحتوي كل منهما على ثلاث ذرات كربون ، مشتق من الألانين وهما سيرين وسيستين. يحتوي سيرين على مجموعة كحول (―CH2OH) بدلاً من مجموعة الميثيل من الألانين ، ويحتوي السيستين على مجموعة مركابتو (―CH2ش). يمكن للحيوانات تخليق السيرين ولكن ليس السيستين أو السيستين. يحدث السيستين في البروتينات في الغالب في شكلها المؤكسد (الأكسدة بهذا المعنى والتي تعني إزالة ذرات الهيدروجين) ، تسمى السيستين. يتكون السيستين من جزيئين سيستين مرتبطين برابطة ثاني كبريتيد (―S ― S―) التي تنتج عند إزالة ذرة هيدروجين من مجموعة مركابتو لكل من السيستين. روابط ثاني كبريتيد مهمة في بنية البروتين لأنها تسمح بربط جزأين مختلفين من جزيء البروتين - وبالتالي تكوين حلقات في - السلاسل المستقيمة. تحتوي بعض البروتينات على كميات صغيرة من السيستين مع مجموعات السلفهيدريل الحرة (―SH).

توجد أربعة أحماض أمينية ، كل منها يتكون من أربع ذرات كربون ، في البروتينات وهي حمض الأسبارتيك ، والأسباراجين ، والثريونين ، والميثيونين. يمكن تصنيع حمض الأسبارتيك والأسباراجين ، اللذين يوجدان بكميات كبيرة ، بواسطة الحيوانات. لا يمكن تصنيع ثريونين وميثيونين ، وبالتالي فهي من الأحماض الأمينية الأساسية ، أي يجب توفيرها في النظام الغذائي. تحتوي معظم البروتينات على كميات صغيرة فقط من الميثيونين.

تحتوي البروتينات أيضًا على حمض أميني به خمس ذرات كربون (حمض الجلوتاميك) وأمين ثانوي (في البرولين) ، وهو عبارة عن هيكل مع المجموعة الأمينية (―NH2) مرتبط بالسلسلة الجانبية الألكيلية ، مكونًا حلقة. حمض الجلوتاميك وحمض الأسبارتيك عبارة عن أحماض ثنائية الكربوكسيل أي أن لديهم مجموعتين من الكربوكسيل (―COOH).

يشبه الجلوتامين الأسباراجين من حيث أن كلاهما عبارة عن أميدات أشكال حمض الكربوكسيليك المقابلة لها ، أي أن لديهم مجموعة أميد (―CONH).2) بدلاً من الكربوكسيل (― COOH) من السلسلة الجانبية. يتواجد حمض الجلوتاميك والجلوتامين بوفرة في معظم البروتينات ، على سبيل المثال ، في البروتينات النباتية ، يشتملان أحيانًا على أكثر من ثلث الأحماض الأمينية الموجودة. يمكن تصنيع كل من حمض الجلوتاميك والجلوتامين بواسطة الحيوانات.

محتوى الأحماض الأمينية لبعض البروتينات *
حمض أميني بروتين
ألفا كازين جليادين إدستين الكولاجين (إخفاء الثور) كيراتين (صوف) الميوسين
* عدد جزيئات الجرام من الأحماض الأمينية لكل 100.000 جرام من البروتين.
** تشتمل قيم حمض الأسبارتيك وحمض الجلوتاميك على الأسباراجين والجلوتامين على التوالي.
*** آيسولوسين بالإضافة إلى لوسين.
ليسين 60.9 4.45 19.9 27.4 6.2 85
الهيستيدين 18.7 11.7 18.6 4.5 19.7 15
أرجينين 24.7 15.7 99.2 47.1 56.9 41
حمض الأسبارتيك ** 63.1 10.1 99.4 51.9 51.5 85
ثريونين 41.2 17.6 31.2 19.3 55.9 41
سيرين 63.1 46.7 55.7 41.0 79.5 41
حمض الجلوتاميك ** 153.1 311.0 144.9 76.2 99.0 155
برولين 71.3 117.8 32.9 125.2 58.3 22
جليكاين 37.3 68.0 354.6 78.0 39
ألانين 41.5 23.9 57.7 115.7 43.8 78
نصف سيستين 3.6 21.3 10.9 0.0 105.0 86
فالين 53.8 22.7 54.6 21.4 46.6 42
ميثيونين 16.8 11.3 16.4 6.5 4.0 22
إيزولوسين 48.8 90.8*** 41.9 14.5 29.0 42
ليسين 60.3 60.0 28.2 59.9 79
تيروزين 44.7 17.7 26.9 5.5 28.7 18
فينيل ألانين 27.9 39.0 38.4 13.9 22.4 27
tryptophan 7.8 3.2 6.6 0.0 9.6
هيدروكسي برولين 0.0 0.0 0.0 97.5 12.2
هيدروكسي ليسين 8.0 1.2
المجموع 839 765 883 1,058 863 832
متوسط ​​الوزن المتبقي 119 131 113 95 117 120

توجد الأحماض الأمينية البرولين والهيدروكسي برولين بكميات كبيرة في الكولاجين ، وهو بروتين النسيج الضام للحيوانات. يفتقر البرولين والهيدروكسي برولين إلى الأمينية الحرة (―NH2) لأن المجموعة الأمينية محاطة بهيكل حلقة مع السلسلة الجانبية وبالتالي لا يمكن أن توجد في شكل zwitterion. على الرغم من أن المجموعة المحتوية على النيتروجين (& gtNH) من هذه الأحماض الأمينية يمكن أن تشكل رابطة ببتيدية مع مجموعة الكربوكسيل لحمض أميني آخر ، فإن الرابطة المتكونة على هذا النحو تؤدي إلى تشويش في سلسلة الببتيد ، أي أن بنية الحلقة تغير زاوية الرابطة العادية من روابط الببتيد العادية.

عادة ما تكون البروتينات عبارة عن جزيئات محايدة تقريبًا ، أي ليس لها خصائص حمضية أو أساسية. هذا يعني أن مجموعات الكربوكسيل الحمضية (―COO -) من حمض الأسبارتيك وحمض الجلوتاميك متساوية في العدد تقريبًا مع الأحماض الأمينية ذات السلاسل الجانبية الأساسية. توجد ثلاثة من هذه الأحماض الأمينية الأساسية ، كل منها يحتوي على ست ذرات كربون ، في البروتينات. واحد مع أبسط بنية ، ليسين ، يتم تصنيعه بواسطة النباتات ولكن ليس بواسطة الحيوانات. حتى أن بعض النباتات تحتوي على نسبة منخفضة من اللايسين. تم العثور على الأرجينين في جميع البروتينات ويوجد بكميات عالية بشكل خاص في البروتامين الأساسي بشدة (بروتينات بسيطة تتكون من عدد قليل نسبيًا من الأحماض الأمينية) من الحيوانات المنوية للأسماك. الحمض الأميني الأساسي الثالث هو الهيستيدين. يمكن تصنيع كل من الأرجينين والهيستيدين بواسطة الحيوانات. الهيستيدين هو قاعدة أضعف من الليسين أو الأرجينين. حلقة إيميدازول ، وهي عبارة عن بنية حلقة خماسية الأعضاء تحتوي على ذرتين من النيتروجين في السلسلة الجانبية من الهيستيدين ، تعمل كمخزن مؤقت (أي عامل استقرار لتركيز أيون الهيدروجين) عن طريق ربط أيونات الهيدروجين (H +) بذرات النيتروجين في الإيميدازول حلقة.

تشترك الأحماض الأمينية المتبقية - فينيل ألانين ، وتيروزين ، وتريبتوفان - في بنية عطرية مشتركة ، أي أن حلقة البنزين موجودة. هذه الأحماض الأمينية الثلاثة ضرورية ، وبينما لا تستطيع الحيوانات تصنيع حلقة البنزين نفسها ، يمكنها تحويل الفينيل ألانين إلى التيروزين.

لأن هذه الأحماض الأمينية تحتوي على حلقات بنزين ، يمكنها امتصاص الضوء فوق البنفسجي بأطوال موجية بين 270 و 290 نانومتر (نانومتر 1 نانومتر = 10 9 متر = 10 وحدات أنجستروم). يمتص فينيل ألانين القليل جدًا من الضوء فوق البنفسجي من التيروزين والتربتوفان ، ومع ذلك ، يمتصه بقوة وهو مسؤول عن نطاق الامتصاص الذي تعرضه معظم البروتينات عند 280-290 نانومتر. غالبًا ما يستخدم هذا الامتصاص لتحديد كمية البروتين الموجودة في عينات البروتين.


Whilst less well described than cation-aryl interactions there are a number of examples of anion-aryl interactions. There is a review "Anion-&pi interactions" DOI that highlights examples and theoretical considerations taken from supramolecular chemistry suggesting the binding interactions are comparable in energy to hydrogen bonds.

In sharp contrast to the mature area of cation binding to aromatic systems, anion-&pi interactions had hitherto been overlooked, primarily due to their counterintuitive nature (anions are expected to exhibit repulsive interactions with aromatic &pi-systems due to their electron donating character)

An interesting example of ligand binding to a biological macromolecule is found in the binding of phenyl diketo acids to Malate Synthase PDB. The diketo acid binds to the active site magnesium and Arg339 whilst the carboxylate portion of Asp633 residue packs face-on to the &pi-cloud of the aromatic ring, and the mean contact distance is

3.5 Å (less that than the typical

4.5 Å distance of hydrophobic contacts, suggesting an anion-&pi interaction. Modelling this interaction has been used to screen ligands DOI


الملخص

Targeting protein kinases is an important strategy for intervention in cancer. Inhibitors are directed at the active conformation or a variety of inactive conformations. While attempts have been made to classify these conformations, a structurally rigorous catalog of states has not been achieved. The kinase activation loop is crucial for catalysis and begins with the conserved DFGmotif. This motif is observed in two major classes of conformations, DFGin—a set of active and inactive conformations where the Phe residue is in contact with the C-helix of the N-terminal lobe—and DFGout—an inactive form where Phe occupies the ATP site exposing the C-helix pocket. We have developed a clustering of kinase conformations based on the location of the Phe side chain (DFGin, DFGout, and DFGinter or intermediate) and the backbone dihedral angles of the sequence X-D-F, where X is the residue before the DFGmotif, and the DFG-Phe side-chain rotamer, utilizing a density-based clustering algorithm. We have identified eight distinct conformations and labeled them based on the Ramachandran regions (A, alpha B, beta L, left) of the XDF motif and the Phe rotamer (minus, plus, trans). Our clustering divides the DFGin group into six clusters including BLAminus, which contains active structures, and two common inactive forms, BLBplus and ABAminus. DFGout structures are predominantly in the BBAminus conformation, which is essentially required for binding type II inhibitors. The inactive conformations have specific features that make them unable to bind ATP, magnesium, and/or substrates. Our structurally intuitive nomenclature will aid in understanding the conformational dynamics of kinases and structure-based development of kinase drugs.

Phosphorylation is a fundamental mechanism by which signaling pathways are regulated in cells. Protein kinases are cellular sentinels which catalyze the phosphorylation reaction by transferring the γ-phosphate of an ATP molecule to Ser, Thr, or Tyr residues of the substrate. Due to their crucial role in the functioning of the cell, protein kinases are tightly regulated. Dysregulation of kinases may result in variety of disorders including cancer, making development of compounds for modulating kinase activity an important therapeutic strategy.

The human genome contains ∼500 protein kinases that share a common fold consisting of two lobes: an N-terminal lobe, consisting of a five-stranded β-sheet with an α-helix called the C-helix, and a C-terminal lobe comprising six α-helices (Fig. 1). They are divided broadly into nine families based on their sequences (1). The two lobes are connected by a flexible hinge region forming the ATP-binding site in the middle of the protein. The active site comprises several structural elements that are crucial for enzymatic activity. The activation loop is typically 20 to 30 residues in length beginning with a conserved DFG motif (usually Asp-Phe-Gly) and extending up to an APE motif (usually Ala-Pro-Glu). In active kinase structures, this loop forms a cleft that binds substrate. Bound substrate peptide forms specific interactions with the conserved HRD motif (usually His-Arg-Asp) which occurs in the catalytic loop of the protein. In the active conformation, the DFG motif Asp is in a position and orientation to bind a magnesium ion that interacts directly with an oxygen atom of the β phosphate of ATP. The active state exhibits an inward disposition of the C-helix which positions a conserved Glu in the helix to form a salt bridge with a Lys residue in the β3 strand. When the salt bridge is formed, the lysine side chain forms hydrogen bonds with oxygen atoms of the α and β phosphates of ATP. The N-lobe has a GxGxxG motif in a loop that stabilizes the phosphates of the bound ATP molecule during catalysis. The catalytically active state of a kinase requires a unique assembly of these elements that create an environment conducive to the phosphotransfer reaction. The regulation of the activity of a kinase is achieved in part by the plasticity of these elements of the structure (2).

Structure of a typical protein kinase domain displaying ATP binding site and conserved elements around it (INSR kinase, PDB ID code 1GAG).

Inactive states of a kinase do not have the chemical constraints required for catalytic activity and therefore kinases exhibit multiple inactive conformations (3). Typically, in an inactive conformation the activation loop is collapsed onto the surface of the protein, blocking substrate binding and rendering the kinase catalytically inactive. In addition, many inactive conformations have positions of the DFGmotif incompatible with binding ATP and magnesium ion required for catalysis. In the DFGout conformation, DFG-Phe and DFG-Asp swap positions so that DFG-Phe occupies the ATP binding pocket and DFG-Asp is out of the active site. There are diverse DFGin structures from multiple kinases where DFG-Phe remains adjacent to the C-helix but in a different orientation (and sometimes position) from that of active DFGin structures. There are also structures where the Phe is in positions intermediate between the typical DFGin and DFGout states. The many inactive, non-DFGout conformations have been variously referred to as pseudo DFGout, DFGup, SRC-like inactive, and atypical DFGout (4, 5). Although DFGin and DFGout are broadly recognized groups of conformations, a consensus nomenclature for the inactive states is lacking.

The DFGin and DFGout conformations have been used as the basis of grouping the inhibitors developed against the active site of these proteins into two main categories (6, 7). Molecules such as dasatinib which occupy the ATP pocket only are called type I inhibitors and typically bind DFGin conformations, but not exclusively. Type II Inhibitors like imatinib bind to the DFGout state and extend into the hydrophobic allosteric pocket underneath the C-helix (8). Design of better inhibitors could be guided by a better understanding and classification of the conformational variation observed in kinases.

There have been some attempts to classify kinase structures in the Protein Data Bank (PDB) (now over 3,300) and to study inhibitor interactions (9 ⇓ ⇓ –12). Möbitz (11) has performed a quantitative classification of all of the mammalian kinases using pseudo dihedral angles of four consecutive Cα atoms of the residues of the DFGmotif and its neighbors and its distance from the C-helix. This resulted in a scheme dividing kinase conformations into 12 categories with labels “FG-down,” “FG-down αC-out,” “G-down αC-out,” “A-under P BRAF,” “A-under P-IGF1R,” and so on. Recently, Ung et al. (12) used a similar idea of using two directional vectors for the DFGmotif residues and the distance from the C-helix to classify kinases into five groups, C-helix-in-DFGin (CIDI), C-helix-in-DFGout (CIDO), C-helix-out-DFGin (CODI), C-helix-out-DFGout (CODO), and ωCD. Some other classification schemes have emphasized the binding modes of inhibitors (4, 13).

In this paper, we present a clustering and classification of the conformational states of protein kinases that addresses some of the deficiencies of previous such efforts. These deficiencies include failing to distinguish DFGin inactive conformations from active structures, either too few or too many structural categories, and an inability to automatically classify new structures added to the PDB. In the current work, we have clustered all of the human kinase structures at two levels of structural detail. First, at a broader level we grouped kinase structures into three categories depending on the spatial position of the DFG-Phe side chain. These three groups are labeled the DFGin, DFGout, and DFGinter (intermediate) conformations. Second, we clustered each of the three spatial groups at a finer level based on the dihedral angles required to place the Phe side chain: the backbone dihedral angles ϕ and ψ of the residue preceding the DFGmotif (X-DFG), the DFG-Asp residue, and the DFG-Phe residue, as well as the χ1 side-chain dihedral angle of the DFG-Phe residue. This produced a total of eight clusters—six for DFGin and one cluster each for the DFGout and DFGinter groups.

We have developed a nomenclature that is intuitive to structural biologists based on the regions of the Ramachandran map occupied by the X, D, and F residues of the X-DFG motif (“A” for alpha-helical region, “B” for beta-sheet region, and “L” for left-handed helical region) and the χ1 rotamer of the Phe side chain (“minus” for the −60° rotamer, “plus” for the +60° rotamer, and “trans” for the 180° rotamer). We have clearly identified the active state of kinases, designated “BLAminus,”’ which is the most common kinase conformation in the PDB. Further, we also clearly define different inactive DFGin conformations which were previously grouped together. The most common inactive DFGin conformations are BLBplus and ABAminus. The type II-binding DFGout state is labeled BBAminus. Overall, our clustering and nomenclature scheme provides a structural catalog of human kinase conformations which will provide deeper insight into the structural variation of these proteins, benefitting structure-guided drug design.


أساليب

Compilation of XL-MS data from the literature

XL-MS data from equine cytochrome c was taken from the studies of Xu وآخرون. 28 and Lackner وآخرون. 31 Selected Nζ و جα atom coordinates from six structures of equine cytochrome c (PDB codes: 1akk, 1crc, 2giw, 1ocd, 3o1y, and 3o2o) were retrieved from the Protein Data Bank and interatomic distances were calculated using a custom Perl script (available on request). Distributions of experimental crosslink distances were taken from the extensive compilation of XL-MS data of Kahraman وآخرون. 30 This database was then filtered to contain only XL-MS results that used either BS 3 or disuccinimidyl suberate (DSS), a reagent of identical length, as the crosslinker. Crosslinks were flagged as either intramolecular or intermolecular. Only the intramolecular set was used for comparison to the Dynameomics simulations, since the Dynameomics database contains only simulations of monomers. However, the difference between inter- and intramolecular Nζ–Nζ distance distributions was not significant (ص=0.32, Welch's two-sample ر-test), suggesting that the results are relevant to protein complexes as well. For Cα–جα distances, the inter- and intramolecular distance distributions were significantly different (ص=0.035.), and only the intramolecular set was used. Crosslinks involving residues with missing Cα or Nζ atoms were also removed, and in a few cases, the identity of the crosslinked subunit was changed to either make the crosslinked distance shorter or account for a missing atom. The final set included 486 intramolecular crosslinks with distances between crosslinked residues calculated from 40 different protein structures.

Dynameomics MD simulations

Simulations were conducted using the in lucem Molecular Mechanics (اناmm 43 ) software package using the Levitt وآخرون. potential function, 44 and the F3C water model. 45 Detailed protocols for selection of starting structures, preparation and simulation, and quality assurance of the Dynameomics targets have been described elsewhere. 25, 46 Using SQL queries (available upon request), we extracted the distances between all lysine Nζ atom pairs and all lysine Cα atom pairs from every simulation at 100-ps intervals from the Dynameomics database. 24 This sampling frequency was chosen because it was the least-frequent sampling that maintained the distribution of distances for a representative simulation. Of the 807 CCD simulations, 766 simulations contained more than one lysine residue and were subsequently analyzed, comprising a total of 43,364 lysine–lysine pairs. All aggregate measures of simulation distance (median, etc.) were calculated after omitting the first 2 ns of the simulation, to allow for relaxation from the starting conformation. The simulation length varied from 50.999 to 75.522 ns, (average 52.529 ns), for a combined total of 40 µs of simulation time. The simulation starting distances د0 are the distance in the simulated structure at simulation time zero. These starting distances closely approximate the experimental distances of the simulated protein structures, having been only slightly altered (on the order of 0.1 Å Cα RMSD) by the minimization and other protocols used to prepare the structure for simulation. Data were imported into the ص statistical computing environment 47 for analysis and plotting. مخصص ص scripts used for the analysis are available upon request.


شاهد الفيديو: FEZ SUCESSO NA BEIRA DA PRAIA. VANLIFE REAL. Carol Kunst e João Rauber (يوليو 2022).


تعليقات:

  1. Gom

    رائع ، هذه معلومات قيمة للغاية

  2. Vinsone

    إنها ليست نكتة!

  3. Lorne

    فاجأ!

  4. Faemuro

    تم تسجيله خصيصا في منتدى للمشاركة في مناقشة هذا السؤال.



اكتب رسالة