Chemoinformatics Studies on a Series of Quinoline
No Thumbnail Available
Date
2024-06-12
Journal Title
Journal ISSN
Volume Title
Publisher
university of eloued جامعة الوادي
Abstract
تهدف الدراسة الحالية إلى نمذجة النشاط المضاد للانتشار بقيم pIC50 الخاص بسرطان الثدي لسلسلة مكونة من 30 مركبًا مشتقا للكينولين باستخدامd-QSAR 2 و طريقة الانحدار الخطي المتعدد (MLR)
حيث تم حساب الواصفات المستخدمة بواسطة طريقة (DFT/ B3LYP/6-31G (d,p)) لبرنامح Gaussian09، برنامج Hyperchem، وكذلك قاعدة البيانات …SwissADME
تتكون هذه الدراسة من ثلاث خطوات رئيسية: اختيار مجموعة البيانات، وإنشاء الواصفات الجزيئية، وبناء واختبار صحة النماذج التنبؤية للنشاط المُدروس. لبناء وإثبات صحة نموذج QSAR الخاص بنا، تم التقسيم عشوائيا لمجموعة البيانات إلى مجموعتين: 24 جزيءًا تشكل مجموعة التدريب والـــــــ 6 جزيئات المتبقية تشكل مجموعة الاختبار.ثم تم التحقق من صحة كل من مجموعة التدريب ومجموعة الاختبار بشكل منفصل باستخدام اختبارات داخلية وخارجية، مثل إعادة التخليط العشوائي و معايير إثبات صحة النموذج Golbraikh و Trouphsa. وتوصلنا إلى أن النموذج 3 هو الأفضل حيث كانت له المعاملات الإحصائية التالية: r= 0.925 ; r2= 0.888 ; F=21.288 ; R_Adj^²= 0.815 ; RMSE = 0.127
وبعد تحديد مجال قابلية تطبيقه، أظهرت النتائج أن كل المركبات تقع ضمن المجال ولا وجود لقيم متطرفة، مما يدل على موثوقية تنبؤات نموذج MLR-QSAR وقدرته على التنبؤ بفعالية بالخصائص الكيميائية للمركبات ضمن مجال التطبيق المحدد. واستنادًا إلى الخصائص الفيزيو-كميائية (الواصفات المشاركة في النموذج3) وبنية المركب 21 الذي تم استخدامه كقالب (أكثر جزيء نشط في قاعدة البيانات)، قمنا بتصميم مركبات جديدة يُعتقد أن لها فعالية أفضل أي IC50 أقل.
The main objective of our study is the modeling of the anti-proliferative activity (pIC50 values) against breast cancer for a series of 30 quinoline-derived compounds using 2D-QSAR and multiple linear regression (MLR) method, this study consists of three main steps: Data set selection, molecular descriptor generation, construction and validation of predictive models for the studied activity. To build and validate our QSAR model, the dataset was divided into two sets: 24 molecules constitute the training set and 6 molecules constitute the test set. The division of the data set was done by random selection. The training set and the test set were validated separately using internal and external tests, such as the y-randomization and Golbraikh and Trouphsa model validation criteria. Model 3 was found to be the best with the following statistical parameters: r= 0.925 ; r2= 0.888 ; F=21.288 ; R_Adj^²= 0.815 ; RMSE = 0.127.
All compounds were found to fall within the applicability domain, indicating the reliability of the MLR-QSAR model predictions and its ability to effectively predict the chemical properties of the compounds within the defined applicability domain.
Based on the physicochemical properties (descriptors involved in model 3) and the structure of compound 21 (used as a template; the most active molecule in the database), new compounds were designed that are expected to have better activity (lower IC50
Description
مدكرة ماستر كيمياء
Keywords
D-QSAR ، سرطان الثدي، الكينولين، الخلط العشوائي ، التحقق الخارجي., D-QSAR, Breast Cancer, Quinoline, y-randomization, external validatio
Citation
سامية بن عماره - وئــــام غمام حامد. Chemoinformatics Studies on a Series of Quinoline.مدكرة ماستر2024.قسم الكيمياء كلية العلوم الدقيقة.جامعة الوادي (12-06-2024) متاح على الرابط