Context
Contexte
Peptides are increasingly investigated in therapeutics, cosmetics, biomaterials, and drug delivery. Yet they often exhibit high conformational flexibility, multiple relevant conformations may coexist, and structural predictions depend on environmental conditions. Docking scores alone are poor predictors of biological activity, and molecular dynamics results depend on force fields and simulation protocols.
Les peptides sont de plus en plus étudiés en thérapeutique, cosmétique, biomatériaux et drug delivery. Pourtant, ils présentent souvent une forte flexibilité conformationnelle, plusieurs conformations biologiquement pertinentes peuvent coexister, et les prédictions structurales dépendent des conditions environnementales. Les scores de docking seuls sont de mauvais prédicteurs d'activité biologique, et les résultats de dynamique moléculaire dépendent des force fields et des protocoles de simulation.
PSAP was built to answer a central R&D question: can a reproducible computational workflow prioritize peptide candidates from public literature based on structural plausibility, stability, and robustness?
PSAP a été conçu pour répondre à une question centrale en R&D : un workflow computationnel reproductible peut-il prioriser des candidats peptidiques issus de la littérature publique selon leur plausibilité structurale, leur stabilité et leur robustesse ?
Approach
Approche
Unlike demonstration projects focused solely on running AlphaFold, PSAP reproduces a realistic early-stage R&D workflow where computational predictions are treated as hypotheses, not conclusions. The pipeline automates the full path from literature retrieval to automated scientific reporting.
Contrairement aux projets de démonstration centrés uniquement sur AlphaFold, PSAP reproduit un workflow R&D précoce réaliste où les prédictions computationnelles sont traitées comme des hypothèses, et non comme des conclusions. Le pipeline automatise l'ensemble du parcours, de la récupération bibliographique au rapport scientifique automatisé.
- Literature mining and peptide dataset curation from PubMed, PDB, and UniProt
- Structure prediction with ESMFold, ColabFold, and AlphaFold, benchmarked against experimental structures
- Rosetta relax and scoring, with OpenMM fallback when PyRosetta is unavailable
- GROMACS molecular dynamics with optional AMBER/OpenMM cross-validation
- Environmental robustness assessment and trajectory analysis
- Self-hosted LLM scientific review (Qwen on EU infrastructure) and automated reporting
- Exploration bibliographique et curation de jeux de données peptidiques depuis PubMed, PDB et UniProt
- Prédiction structurale avec ESMFold, ColabFold et AlphaFold, comparée aux structures expérimentales
- Relax et scoring Rosetta, avec repli OpenMM lorsque PyRosetta n'est pas disponible
- Dynamique moléculaire GROMACS avec validation croisée AMBER/OpenMM en option
- Évaluation de la robustesse environnementale et analyse de trajectoires
- Revue scientifique par LLM auto-hébergé (Qwen sur infrastructure UE) et reporting automatisé
Solution
Solution
PSAP runs in three execution modes: demo (laptop, minutes to hours), standard (GPU workstation), and research (GPU server or HPC). When heavy dependencies are absent, stages emit clearly labeled synthetic artifacts so the full pipeline still completes and produces a report.
PSAP s'exécute via trois modes : démo (ordinateur portable, minutes à heures), standard (station GPU) et recherche (serveur GPU ou HPC). Lorsque les dépendances lourdes sont absentes, les étapes produisent des artefacts synthétiques clairement identifiés, afin que le pipeline complet aboutisse toujours à un rapport.
The framework explicitly rejects oversimplified assumptions: high pLDDT does not imply biological relevance, good docking scores do not imply activity, stable RMSD does not imply correctness, and short simulations do not prove equilibrium. Each computational observation is mapped to a relevant experimental validation (CD, DSC, NMR, SPR, ITC, LC-MS).
Le cadre rejette explicitement les simplifications abusives : un pLDDT élevé n'implique pas de pertinence biologique, un bon score de docking n'implique pas d'activité, un RMSD stable n'implique pas de correction, et de courtes simulations ne prouvent pas l'équilibre. Chaque observation computationnelle est associée à une validation expérimentale pertinente (CD, DSC, RMN, SPR, ITC, LC-MS).
Key outcome
Résultat clé
A reproducible framework that combines modern computational tools to generate robust, experimentally testable hypotheses, with uncertainty quantification, model comparison, and validation planning built in.
Un cadre reproductible qui combine des outils computationnels modernes pour générer des hypothèses robustes et testables expérimentalement, avec quantification de l'incertitude, comparaison de modèles et planification de validation intégrées.
Applications
Applications
PSAP supports natural-language queries over pipeline results, for example:
PSAP permet des requêtes en langage naturel sur les résultats du pipeline, par exemple :
- Early-stage peptide R&D: prioritize candidates from literature based on structural plausibility and stability
- Cosmetics and biomaterials: assess conformational robustness under environmental stress
- Model comparison studies: evaluate consistency between ESMFold, ColabFold, and AlphaFold predictions
- "Which peptides should be prioritized for experimental validation?"
- R&D peptidique précoce : prioriser des candidats issus de la littérature selon plausibilité structurale et stabilité
- Cosmétique et biomatériaux : évaluer la robustesse conformationnelle sous stress environnemental
- Études de comparaison de modèles : évaluer la cohérence entre prédictions ESMFold, ColabFold et AlphaFold
- « Quels peptides prioriser pour une validation expérimentale ? »