banner
Nachrichtenzentrum
Unser Ziel ist es, unsere Techniken und Qualität kontinuierlich zu verbessern, um Ihren Anforderungen gerecht zu werden.

Vorhersage chemischer Kampfstoffe basierend auf cholinergen Array-Metadaten

Jun 11, 2023

Wissenschaftliche Berichte Band 12, Artikelnummer: 16709 (2022) Diesen Artikel zitieren

1466 Zugriffe

Details zu den Metriken

Molekulare Erkenntnisse zur Chemikaliensicherheit sind sowohl für die nachhaltige Entwicklung als auch für die Risikobewertung von großer Bedeutung. In dieser Studie wird untersucht, wie mit künftig auftretenden Schadstoffen umgegangen werden kann, insbesondere mit potenziell cholinergen chemischen Kampfstoffen (CWAs). Zu diesem Zweck wurden die Strukturen bekannter cholinerger Wirkstoffe durch molekulare Deskriptoren kodiert. Und dann wurde jede Arzneimittelzielinteraktion (DTI) aus den kodierten Strukturen und ihren cholinergen Aktivitäten gelernt, um DTI-Klassifizierungsmodelle für fünf cholinerge Ziele mit zuverlässiger statistischer Validierung zu erstellen (Ensemble-AUC: bis zu 0,790, MCC: bis zu 0,991, Genauigkeit: bis). bis 0,995). Die gesammelten Klassifikatoren wurden in 2D- oder 3D-Array-Meta-Prädiktoren für mehrere Aufgaben umgewandelt: (1) cholinerge Vorhersage und (2) CWA-Erkennung. Die Erkennungsfähigkeit der Array-Klassifikatoren wurde unter dem unausgeglichenen Datensatz zwischen CWAs und Nicht-CWAs überprüft (Fläche unter der Präzisions-Recall-Kurve: bis zu 0,997, MCC: bis zu 0,638, F1-Score von Nicht-CWAs: bis zu 0,991, F1- Score der CWAs: bis zu 0,585).

Chemische Kampfstoffe (CWAs) und gefährliche Chemikalien gefährden die chemische Sicherheit1,2. Vor der Chemiewaffenkonvention wurden CWAs gezielt für militärische Einsätze erfunden und synthetisiert. Heutzutage gibt es Bedenken hinsichtlich unbeabsichtigter CWA-Erfindungen und ihrer unerwarteten Unfälle durch (1) synthetische Chemie im Zusammenhang mit bekannten CWAs (z. B. Organophosphorderivate)2,3 oder (2) Chemikalien für therapeutische Medikamente (z. B. BZ-Code von der NATO zugewiesen) und illegale Drogen4. Serienterroristen wie Sarin in Japan im Jahr 1994, VX in Malaysia im Jahr 2017 und Nowitschok (nicht deklarierter Wirkstoff) in Syrien im Jahr 2018 machen die Besorgnis über chemische Waffen zu berechtigten Befürchtungen5. Darüber hinaus waren einige schädliche Chemikalien (wie in Abb. 1 dargestellt) nicht in der CWA-Liste der Organisationen für das Verbot chemischer Waffen (OPCW) aufgeführt, haben jedoch zu verheerenden Folgen geführt, und die Tragödien dauern immer noch an: (1) Ethoxyethyl Guanidinium (PGH)/Polyhexamethylenguanidin (PHMG), Inhaltsstoffe von Reckitt Benckiser-Sterilisatoren, die in Südkorea zu Todesfällen durch Desinfektionsmittel bei Babys und schwangeren Frauen führten6,7, und (2) TCDD, eine Spurenverunreinigung von Agent Orange (Herbizid und Entlaubungschemikalie). ) während des Vietnamkrieges, was die epigenetische transgenerationale Vererbung von Krankheiten gefördert hat8,9.

Zu den chemischen Bedrohungen gehören chemische Kampfstoffe (CWAs), denen NATO-Codes zugewiesen wurden, CWA-Stimulanzien, neue psychoaktive Substanzen (NPSs) und chemische Gefahren wie PHMG (Sterilisator) und TCDD.

Für die chemische Sicherheit haben Menschen Vorschriften oder Systeme entwickelt, um das Risiko zu kontrollieren, das von schädlichen Chemikalien ausgeht10,11,12. Mit solchen Systemen wurden die Erkennung gefährlicher Stoffe oder deren Entgiftungstechnologien kontinuierlich weiterentwickelt13,14,15,16. Trotz der Geschichte ist die kommende Rate an schädlichen Stoffen schneller als die Rate, mit der eine Verordnung oder eine Erkennungstechnologie erlassen werden muss. Beispielsweise wurden von 2014 bis 2014 mehr als 450 neue psychoaktive Substanzen (NPS) oder Designerdrogen überwacht, die die pharmakologischen Wirkungen bekannter illegaler Drogen nachahmen sollten und einer Regulierung illegaler Drogen und/oder einem Nachweis in Standard-Drogentests entgehen könnten 201717,18,19. Während dieser Zeiträume war kein Sicherheitssystem in der Lage, die NPS angemessen und rechtzeitig zu kontrollieren: ihre Identifizierung und Erkennung, die Bewertung ihrer Toxizität und die Festlegung einer Regelung20. Natürlich können chemische Gefahren oder toxische Substanzen, die in einem System nicht definiert sind, nicht verhindert, erkannt oder kontrolliert werden21. Daher sollten schädliche und gefährliche „noch nicht vorhandene, aber kommende Chemikalien (NE-Chemikalien)“ im Voraus für die Risikobewertung definiert werden. Allerdings ist die Vorhersage des „Nicht-Existierens“ vage und unbestimmt. Wenn eine Maschine die Strukturen und Eigenschaften bekannter schädlicher Chemikalien lernt und ihre Beziehungen analysiert, kann die erlernte Beziehung glücklicherweise theoretisch ein Muster von NE-Chemikalien vorschlagen22. Mit anderen Worten: Ein Teil des Gefahren- und Toxizitätsraums kann durch die Verwendung molekularer Merkmale (Variablen) bekannter Chemikalien definiert werden (Abb. 2). Als „chemischer Raum“ wird ein Begriff bezeichnet, der alle möglichen kleinen Moleküle umfasst23, ein Gefahren- und Giftraum bezeichnet, der alle möglichen gefährlichen und giftigen Chemikalien umfasst und benannt wurde. Noch wünschenswerter ist, dass die Definition, wenn sie idealerweise erreicht wird, für die präventive Regulierung verwendet werden kann. Mit dieser Überlegung haben wir versucht, einen Teil des Gefahren- und Toxizitätsraums mithilfe cholinerger Metaprädiktoren zu definieren. In dieser Studie wird der Raum pancholinerger Wirkstoffe a priori durch ihre molekularen Strukturen definiert, und dann wird das cholinerge Muster von Nervenkampfstoffen als CWAs im Raum durch ein Faltungs-Neuronales Netzwerk (CNN) erlernt. Ersteres ist die Generierung cholinerger Meta-Prädiktoren und Letzteres ist die CWA-Erkennung basierend auf den Meta-Prädiktoren.

Konzeptionelle Darstellung des Gefahren- und Giftraums und molekulare Charakterisierung von Chemikalien im Raum.

Für ein Vorhersagemodell werden Prädiktorvariablen und abhängige Variablen im Allgemeinen aus Variablen von Rohdaten ausgewählt (oder nach Manipulation ausgewählt). Allerdings gab es keine gemeinsamen Informationen zwischen CWAs und bekannten cholinergen Wirkstoffen, und ein Toxizitätsindex war selten verfügbar1,2,16,24. Die verfügbaren Daten zu cholinergen Wirkstoffen waren deren Strukturen und cholinerge Aktivitäten (Abb. 3 und Tabelle S1). Mittlerweile war die molekulare Struktur die einzige allgemein bekannte Information über CWAs und Schadstoffe. Erwartungsgemäß ergab die Verknüpfung zwischen CWAs und cholinergen Daten keine gemeinsame Variable. Ein praktisches Problem bestand also darin, aus den begrenzten Daten einen einheitlichen Deskriptor (Prädiktorvariable) der Chemikalien zu erstellen. Um einen einheitlichen Deskriptor zu definieren, ist eine wichtige Eigenschaft gefährlicher und toxischer Stoffe ihr Toxizitätsprofil, das zusammen mit der molekularen Mechanik zur Rettung vor Toxizität führt. Insbesondere ist der detaillierte Mechanismus der jeweiligen Toxizität für die meisten Wirkstoffe nicht klar und unterscheidet sich voneinander. Während in CWAs einige Nervenkampfstoffe eine hohe strukturelle Kongenerität aufweisen, unterscheidet sich die Struktur von 3-Chinuclidinylbenzilat (NATO-Code: BZ) stark von denen anderer CWAs und stellt einen Ausreißer in der chemischen Struktur von CWAs dar. Glücklicherweise weisen Nervenkampfstoffe vergleichsweise konsistentere Mechanismen auf, die auf Acetylcholinesterase (AChE) basieren, als auf anderen CWAs wie Blasenerregern, Erstickungsmitteln, Erstickungsmitteln (pulmonalschädigenden Mitteln), handlungsunfähig machenden Mitteln, tränentreibenden Mitteln und Erbrechenmitteln1,2,25,26. Es ist bekannt, dass Nervenstoffe und Organophosphor AChE an cholinergen Synapsen hemmen und dadurch den Abbau von Acetylcholin hemmen (Abb. 3A). Die Anhäufung des freigesetzten Acetylcholins führt zu einer Überstimulation der Endorgane, die als cholinerge Krise1 erkannt wird.

Beschreibung des cholinergen Raums in dieser Studie. (A) Die Lage und Rolle cholinerger Ziele im Nervensystem. (B) Datenerfassung cholinerger Wirkstoffe aus der ChEMBL-Datenbank. Alle Wirkstoffe wurden unter Verwendung der jeweiligen cholinergen Ziele als MySQL-Abfragen extrahiert. nAChR-Nikotin-Acetylcholinesterase-Rezeptor, MAChR-Muskarin-Acetylcholinesterase-Rezeptor, VAChT vesikulärer Acetylcholintransporter, AChE-Acetylcholinesterase, BuChE-Butyrylcholinesterase.

Das begrenzte Wissen motivierte uns daher, Gefahren- und toxische Räume im Hinblick auf ihre cholinergen Wirkungen auf das Nervensystem zu untersuchen (von Abb. 3). Das Ziel dieser Studie war insbesondere nicht nur die cholinerge DTI-Vorhersage einzelner Chemikalien, sondern auch der Nachweis von CWA aus NE-Chemikalien mithilfe cholinerger Muster bekannter Chemikalien. Zu diesem Zweck haben wir einen Meta-Prädiktor entwickelt, um die Muster mithilfe der Struktur-Aktivitäts-Beziehung (SAR) cholinerger Wirkstoffe zu beschreiben (Abb. 4). Nach unserem besten Wissen verwenden vor dieser Studie Meta-Prädiktor- oder Meta-Learning-Studien zu Bio-/Chemoinformatik-Daten (1) iterativ homogene Methoden27, (2) passen Gewichte von Elementprädiktoren explizit an28,29 oder (3) linear Elementprädiktoren kombinieren29. Bemerkenswerter ist, dass während solche bekannten Studien denselben Datensatz für das Training sowohl von Prädiktoren als auch von Meta-Prädiktoren verwendeten, diese Studie zwei heterogene Datensätze verwendete (cholinerge Daten in ChEMBL für Prädiktoren und CWA/NPS aus ChEMBL für Meta-Prädiktoren). Wir haben unseren Meta-Prädiktor wie in den folgenden Gleichungen dargestellt entworfen. Während ein Prädiktor \(f\) (von Gleichung 1) Daten und Parameter als Eingabe verwendete, verwendete ein Meta-Prädiktor \(g\) auch Elementprädiktoren \(f_{ij}^{{T^{\ Primzahl}}}\) in einem \(\left[ {i \times j} \right]\)-förmigen Array. Daher nannten die Autoren sie „Meta-Prädiktoren“.

Design eines Meta-Prädiktors für Multitasking und Daten-Workflow. Hellhimmelblauer Pfeil: Datenfluss für die Erstellung cholinerger DTI-Modelle, blauer Pfeil: Datenfluss für die Erstellung eines Array-Klassifikators, gelber Pfeil: der Fluss anstehender Daten für Multitasking. Modellliste = [M1, M2, …, M20], Zielliste = [T1, T2, T3, T4, T5], ML-Liste = [ML1, ML2, ML3, ML4], Seed-Liste = [S1, S2, … , S10], zusammengesetzte Liste = [C11, C12, …, C21, …, Cij] und Werteliste der Prädiktoren = [1, 2].

Praktischerweise wurden zunächst die biochemischen Aktivitäten cholinerger Wirkstoffe zusammen mit den molekularen Deskriptoren eingebettet, damit eine Maschine den SAR lernen konnte. Zweitens disziplinierten die experimentellen Aktivitätsdaten von ChEMBL (einer öffentlichen Datenbank) die Maschinen, um die Beziehung zwischen den fünf cholinergen Zielen und Chemikalien zu beurteilen, die als Drug Target Interaction (DTI) bezeichnet wird. Die trainierten DTI-Modelle aus Abb. 4 (200 Klassifizierer von vier Maschinentypen, zehn unterschiedlich unterteilte Daten und fünf Ziele) wurden intern und extern validiert, um die binominalen cholinergen Muster (aktiv/inaktiv) einer Chemikalie aufzuklären. Drittens wurden die cholinergen Muster bekannter CWAs und NPSs als schädliche Agenzien durch die 200 binären Klassifikatoren vorhergesagt, und die vorhergesagten Werte wurden in Array-Daten umgewandelt, wie in Abb. 4 dargestellt. Schließlich wurden die vorhergesagten Array-Daten als Metadaten verwendet. Prädiktoren zum Aufbau des CWA-Erkennungsmodells. Auch wenn die tatsächlichen cholinergen Muster dieser schädlichen Chemikalien unbekannt sind, konnten wir mithilfe eines chemozentrischen Ansatzes auf das Muster schließen. Der chemozentrische Ansatz bedeutet, dass, wenn zwei ähnliche Moleküle wahrscheinlich ähnliche Eigenschaften besitzen, sie gemeinsame biologische Ziele haben oder ähnliche pharmakologische Profile aufweisen können30,31,32,33,34,35. Bemerkenswerterweise wurden in dieser Studie nur zwei Arten realer Daten verwendet: chemische Strukturen aller Chemikalien (ChEMBL, CWAs und NPS) und cholinerge Aktivitäten von ChEMBL-Chemikalien (Abb. 3B).

Um den entworfenen Meta-Prädiktor zu realisieren, erfassten zwei Arten von 2D-molekularen Fingerabdrücken (FCFP, ECFP) die molekularen Strukturen aller cholinergen Wirkstoffe36. Bei diesen erweiterten Konnektivitäts- und Funktionsklassen-Fingerabdrücken handelt es sich um bekannte molekulare Darstellungen, die die molekulare Struktur und funktionelle Gruppen (Atomgruppen mit ihren eigenen charakteristischen Eigenschaften) in einem Molekül präzise beschreiben und ihre kompetente Leistung bei der Arzneimittelentwicklung und groß angelegten Vorhersagen zeigen36 . Daher wurden ECFP und FCFP verwendet, um die cholinerge SAR unter maschinellen Lernalgorithmen (ML) von Random Forest (RF), Support Vector Machine (SVM), Entscheidungsbaum (DT) und k-Nearest Neighbor (KNN) zu beschreiben37,38 ,39. Das DTI-Modell wurde für jedes cholinerge Ziel von Acetylcholinesterase (AChE), Butyrylcholinesterase (BuChE), nikotinischem Acetylcholinesterase-Rezeptor (nAChR), muskarinischem Acetylcholinesterase-Rezeptor (mAChR) und vesikulärem Acetylcholintransporter (VAChT) trainiert40. Zunächst wurde die statistische Leistung des nAChR-Klassifikators bewertet (Tabelle 1 und Tabelle S2). Erwartungsgemäß zeigten die ROC-Diagramme (Receiver Operating Characteristic) von nAChR-Klassifikatoren die robuste Vorhersagbarkeit unabhängig von der Datenaufteilung in Training und Test (Tabelle S2 und Abb. S2). Beim Vergleich der Area Under ROC (AUC) der Testdaten ergaben RF-, SVM- und KNN-Modelle (AUC: 0,961–0,998) eine höhere AUC als DT (AUC: 0,739–0,889). Darüber hinaus haben wir andere statistische Metriken angewendet, darunter Genauigkeit, F1-Score und Matthews-Korrelationskoeffizient (MCC), die bei der Bewertung binärer Klassifizierungen aussagekräftiger und wahrheitsgetreuer sind als Genauigkeit und F1-Score. Bemerkenswert ist, dass die MCC-Werte jedes Modells zuverlässig waren (Test: MCC ~ 0,438–0,978, Zug: 0,474–0,956) und die MCC-Werte der Testsätze denen der Zugsätze entsprachen. Zweitens folgte das Lernen des MAChR-Datensatzes einem ähnlichen Muster wie bei nAChR-Modellen, zusammen mit einer AUC von 0,807–0,998 und einem MCC von 0,608–0,974 (Tabelle 1 und Tabelle S3). Die MAChR-Modelle erbrachten eine etwas höhere Vorhersageleistung als die nAChR-Modelle. Das gesamte DT-Modell zeigte eine geringere Leistung als RF-, SVM- und KNN-Modelle. Drittens zeigten BuChE-Modelle auch eine zuverlässige Vorhersageleistung mit einer AUC von 0,771–1,000 und einem MCC von 0,420–0,986 und waren etwas niedriger als die Klassifizierungsmodelle von nAChR und mAChR (Tabelle 1 und Tabelle S5). Viertens haben wir die Klassifizierungsmetriken der AChE-Modelle weiter analysiert. Trotz der großen Datenmenge (n = 3098) zeigte die Klassifizierungsleistung eine gleichwertige Leistung für die AUC von 0,774–0,999 (Tabelle 1 und Tabelle S4). Schließlich übertreffen die VAChT-Modelle des kleinsten Datensatzes die von nAChR, MAChR, AChE und BuChE (Tabelle 1 und Tabelle S6). Um die Vorhersagekraft der cholinergen DTI-Modelle zu visualisieren, wurden die leistungsstärksten Modelle durch Ensemble-AUC-Werte beschrieben (Abb. 5 und Tabelle S7).

Statistische Leistung von DTI-Klassifizierungsmodellen. Die Fläche unter der Receiver Operating Characteristic Curve (AUC) wurde in der externen und internen Validierung der jeweiligen Ziele berechnet.

Die erste Aufgabe des erstellten Array-Modells besteht darin, cholinerge Aktivitäten von Molekülen außerhalb des Satzes (weder Trainings- noch Testsatz) auf nAChR, mAChR, VAChT, AChE und BUChE vorherzusagen (Abb. 4). Zu diesem Zweck wurde jeder cholinerge DTI-Klassifikator bereits im vorherigen Abschnitt validiert. Offensichtlich stammen CWAs und Nicht-CWAs, die aus NPSs und Designerdrogen19 bestehen, aus den cholinergen ChEMBL-Daten40, also weder aus Trainings- noch aus Testdaten. Es wurde vorausgesagt, dass cholinerge Muster der CWAs und keiner CWAs die Rolle von Meta-Prädiktoren für die zweite Aufgabe spielen. Die zweite Aufgabe des Array-Modells besteht darin, die Ähnlichkeit von „außerhalb der Reihe“ liegenden Molekülen zur chemischen Kriegsführung zu beurteilen. Zu diesem Zweck wurde die Unterscheidung zwischen CWAs und Nicht-CWAs durch einen CNN-Algorithmus gelernt. CNN ist ein häufig verwendetes Deep-Learning-Framework für Objekterkennungsaufgaben, Objektverfolgung, Posenschätzung, Texterkennung und -erkennung, Erkennung visueller Besonderheiten, Aktionserkennung und Szenenkennzeichnung41. LeNet von LeCun et al.42 und AlexNet von Hinton et al.43 begründeten die Popularität von CNN im Bereich Computer Vision. Die von GoogleNet44, VGGNEt45, ResNet46 usw. ausgearbeitete CNN-Architektur (z. B. Batch-Normalisierung, Filter, Restfunktion) verbesserte die Vorhersagegenauigkeit. Trotz des Unterschieds in der Datengröße haben unsere Meta-Prädiktoren die gleichen Eigenschaften wie ein binäres Pixelarray mit handgeschriebenen MNIST-Daten (28 × 28 Pixel mit zwei Farben), bei dem es sich um einen repräsentativen Datensatz von CNN-Modellen handelt47. Die gemeinsame Eigenschaft veranlasste uns, das bildbasierte Lernen von MNIST-Daten zu vergleichen. Zunächst wurden unsere Meta-Prädiktoren für das CNN-Lernen in das 2D-Array einer 5 × 4-Form konvertiert. Nach der Untersuchung wurde die Architektur von Abb. 6A (siehe auch Abb. S9) für den besten Lernenden ausgewählt. Wie erwartet erkannte das 2D-Array CWAs zuverlässig aus großen NPS-Daten. Während des Lernens und der zunehmenden Epoche erreichten die Genauigkeits- und Verlustwerte ihre optimalen Werte und behielten die Werte bei (Abb. 6B). Aufgrund der ermutigenden Ergebnisse haben wir versucht, das Datenungleichgewicht zwischen CWAs und Nicht-CWAs durch Über- und Unterabtastung (das Entfernen von Daten, die doppelte Array-Werte anzeigen) auszugleichen. Wie in Abb. 7 dargestellt, zeigten die statistischen Metriken beim Vergleich unausgeglichener nativer Daten (Modell 01) mit ausgeglichenen überabgetasteten Daten (Modell 03) eine leichte Abnahme der Abweichung, aber die Fläche unter der Präzisions-Erinnerungskurve (AUPR) Die Werte von Abb. 7A waren immer noch zwischen nativen (unausgeglichenen) und überabgetasteten Daten (ausgeglichen) vergleichbar, um zu beweisen, dass diese statistischen Werte nicht einfach auf Datenungleichgewichte zurückzuführen sind. Der Matthews-Korrelationskoeffizient (MCC), der F1-Score und die Genauigkeit (Abb. 7B) bestätigten ebenfalls, dass SMOTE (Überabtastung) die Fähigkeit bestätigte, CWAs zu finden48. Darüber hinaus ermöglichten uns die beiden Arten der Probenahme die Bewertung von 2D- oder 3D-Array-Klassifikatoren unterschiedlicher Form. Als wir das 2D-Array von [50 × 4] auf [40 × 5] umformten, nahm die Erkennungsfähigkeit stark ab, um die Bedeutung der Anordnung von Elementprädiktoren deutlich zu machen. Wenn einige Daten eine Abhängigkeit von der Reihenfolge zwischen ihren Variablen (Elementprädiktoren) aufweisen, können die Daten als sequentiell bezeichnet werden. Als wir das 2D-Array in 3D-Arrays umwandelten, verbesserte das bildbasierte Lernen der [10 × 5 × 4]-Form überraschenderweise AUPR, MCC und F1-Score des schlechtesten „Modell 04“ und verringerte den Leistungsunterschied zwischen verschiedenen Daten (Abb. 7). Als das 3D-Array in [5 × 10 × 4] umgeformt wurde, blieb die Verbesserung dieser statistischen Werte ebenfalls erhalten. Darüber hinaus wurde aus den Trainingsdaten des CNN-Modells ein Multi-Layer-Perceptron-Modell (MLP) mit der gleichen Anzahl von Schichten erstellt. Das MLP-Modell als Basis zeigte eine sehr geringere Präzision und einen niedrigeren F1-Score als das beste CNN-Modell. Im Detail waren zwar zwei CNN-Modelle dem MLP-Modell überlegen, die Form des Arrays war jedoch dennoch wichtig, um eine um ein Vielfaches bessere Leistung als MLP zu erzielen (Abb. 7C).

Training der drei unterschiedlich geformten Array-Klassifikatoren (2D, 3D und umgeformtes 3D). (A) CNN-Architektur in dieser Studie. (B) Robustes Training der CNN-Modelle mit frühem Stoppen per Rückruf. X-Achse: die Anzahl der Epochen (Trainingseinheit), y-Achse: Genauigkeits- oder Verlustwerte (die Lücke zwischen real und Vorhersage), die durch eine Verlustfunktion gemäß Datenabtastung berechnet wurden (Modell 01: nativ, Modell 02: Entfernung doppelter Array-Werte aus Modell 01-Daten, Modell 03: SMOTE-Überabtastung von Modell 01-Daten, Modell 04: SMOTE-Überabtastung von Modell 02-Daten).

CWD-Erkennungsleistung der drei unterschiedlich geformten Array-Klassifikatoren gemäß Datenabtastung (Modell 01 bis 04). (A) Precision-Recall-Kurve von CNN-Modellen, (B) Leistung von CNN-Modellen (MCC, F1-Score und Genauigkeit) und (C) Vergleich mit mehrschichtigem Perzeptron als Basismodell.

Basierend auf der statistischen Validierung von Abb. 7 und Tabelle S8 sind die Array-Klassifikatoren für die CWA-Erkennung von NE-Chemikalien bereit. Offensichtlich ist dieses Vorhersagemodell für chemische Bedrohungen unter der chemozentrischen Annahme aufgrund der verfügbaren Daten und der unmöglichen experimentellen Validierung umstritten. Allerdings ist ein solcher Prozess nicht der einzige. Beispielsweise hat die OECD auch die QSAR-Modell-Toolbox entwickelt und für die Risikobewertung bereitgestellt10. Obwohl typische QSAR-Modelle eine hohe Präzision innerhalb ihres Vorhersagebereichs garantieren können, unterliegen die QSAR-Modelle der Einschränkung eines Bereichs, der über den Satz kongenerischer Reihen hinausgeht. Als beispielsweise die sechs akuten Toxizitätsmodelle der OECD QSAR Toolbox CWAs vorhersagten, konnten erhebliche CWAs aufgrund außerhalb des Vorhersagebereichs nicht die vorhergesagten Werte zurückgeben und ergaben eine Ausfallrate von ca. 50 % (Tabelle 2). Daher sollten innovative Studien die Einschränkungen einer Domäne überwinden. Darüber hinaus können QSAR-Modelle im Allgemeinen nicht mit einer Ab-initio-Methode erstellt werden. Leider ist der Toxizitätsindex von CWA-Daten selten und reicht nicht aus, um ein zuverlässiges Vorhersagemodell zu erstellen. Obwohl ein Klassifizierungsmodell erstellt werden kann, ist der Vorhersagebereich offensichtlich immer noch auf Organophosphor ausgerichtet. Daher haben wir cholinerge Metaprädiktoren vorgeschlagen, um die Zusammensetzung der aktuellen Datenbeschränkung zu untersuchen. Der bemerkenswerte Unterschied zwischen dieser Studie und typischen QSAR-Modellen ist die Definition der abhängigen Variablen und der unabhängigen Variablen. Typische QSAR-Modelle verwenden den „experimentellen Aktivitäts-/Toxizitätsindex“ als abhängige Variable und die „chemische Struktur und ihre Deskriptoren“ als unabhängige Variablen. Das CNN-Modell dieser Studie verwendete weder chemische Strukturen noch deren molekulare Deskriptoren. Die Kodierung chemischer Strukturen wurde durch cholinerge Metaprädiktoren ersetzt. Da aktuelle Informationen über den Mechanismus von CWAs reich an AchE und cholinergen Wirkungen sind, wurden in dieser Studie nur cholinerge Muster zur Erkennung chemischer Bedrohungen beschrieben. Wenn die Daten aktualisiert werden, könnte diese Methodik in Zukunft auf andere pharmakologische Wirkungen bekannter schädlicher Chemikalien anwendbar sein, wie z. B. die Monoacylglycerol-Lipaseaktivität (MAG) im Gehirn und das Endocannabinoid-abbauende Enzym Fettsäureamidhydrolase (FAAH), bei denen es sich um kürzlich gemeldete Toxizitätsmechanismen handelt von Organophosphor-Pestiziden2,16. Selbst wenn über die MAG- und FAAH-Hemmung der Insektizide berichtet würde, wäre ein solcher Versuch durchführbarer, wenn die Daten (von MAG- oder FAAH-Wirkstoffen) genauso aktualisiert würden wie die von cholinergen Wirkstoffen.

Trotz extrem unausgeglichener Daten wurde das cholinerge Muster von CWAs durch Array-artige Metaprädiktoren erlernt, um eine akzeptable Vorhersageleistung zu erzielen. Darüber hinaus ermöglicht das Lernen Multitasking für eine Chemikalie: DTI-Vorhersage für fünf cholinerge Ziele unter vier ML-Algorithmen und CWA-Erkennung unter dem CNN-Algorithmus. Während die erstere Aufgabe durch die interne und externe Validierung des jeweiligen DTI-Klassifikators überprüft wurde, wurde die letztere Aufgabe mithilfe von CWA und Nicht-CWA validiert. Insbesondere schlägt diese Studie eine neue Methode zur Beschreibung von Schadstoffen vor, die nur über begrenzte Informationen über ihre quantitative Struktur-Toxizitäts-Beziehung verfügt. Somit trägt es zur Forschung bei, die chemische Bedrohungen durch NE-Chemikalien in der nahen Zukunft kontrolliert und vorhersagt.

Jeder Algorithmus für maschinelles Lernen ist untrennbar mit der Struktur und den gemeldeten Aktivitätsdaten verknüpft. In den letzten Jahren haben sich die ChEMBL-Datenbanken zu einer Hauptquelle für den Abruf chemischer Daten für Anwendungen des maschinellen Lernens entwickelt. Hierin wurde die ChEMBL-Datenbankversion 2449 ausgewählt, um die Struktur- und Eigenschaftsdaten cholinerger Wirkstoffe (nAChR, mAChR, VAChT, AChE und BUChE) abzurufen, wobei die MySQL-Abfrage aus molekularen Strukturen (kanonisches Lächeln), Aktivitäts-ID und Standardwerten besteht Hemmende Aktivitäten mit Standardbeziehung und Standardeinheit (nanomolar), Assay-ID und Ziel-ID. Darüber hinaus wurden die molekularen Strukturen von CWAs und NPS aus der Literatur1,2,19 und dem NPS-Datahub50 gesammelt. Jede Manipulation von Daten (Sortieren, Zusammenführen, Bereinigen duplizierter Daten und Binominalisierung) wurde von der KNIME Analytic Platform51 durchgeführt. Der ergänzende Abschnitt beschreibt die Zusammensetzung der Chemikalien in jedem Ziel. Kurz gesagt, es wurden insgesamt 1818, 6944, 3098, 1382, 302, 95 und 3126 Chemikalien ausgewählt, die zu nAChR, MAChR, AChE, BuChE, VAChT, CWA und NPSs gehören.

Wählen Sie x.molregno,canonical_smiles,activity_id,y.assay_id, standard_value, standard_relation, standard_units, i.tid, k.target_type, k.pref_name, k.organism aus Compound_structures x, Activities y, Assays i, target_dictionary k.

Wobei x.molregno = y.molregno und y.assay_id = i.assay_id und i.tid = k.tid und k.tid = 10532 INTO outfile „chembl_target_BuChE.csv“ Felder, die mit „,“ abgeschlossen sind, Zeilen, die mit „/n“ abgeschlossen sind ;

Es wurden acht molekulare 2D-Fingerabdrücke aller chemischen Daten mit (1) zwei Typen, dem Extended-Connectivity-Fingerabdruck (ECFP) und dem Functional-Class-Fingerabdruck (FCFP), und (2) 4 verschiedenen Durchmessern (0, 2, 4, 6) erstellt eine feste 1024-Bit-Vektorgröße. Insbesondere erfasst ECFP präzise Atomeigenschaften (z. B. Ordnungszahl, Ladung, Wasserstoffzahl usw.), während FCFP funktionelle (pharmakophore) Merkmale (z. B. Wasserstoffdonor/-akzeptor, Polarität, Aromatizität usw.) der Atome in einem Molekül erfasst. Für beide Fingerabdruckberechnungen wurde das CDK-Toolkit52 verwendet. Die generierten Fingerabdrücke wurden aufgeteilt und mit den jeweiligen binominalen Aktivitätswerten zu einer eingebetteten Datenmatrix zum Lernen kombiniert.

Vier Algorithmen für maschinelles Lernen (Random Forest, Entscheidungsbaum, Support Vector Machine und k-Nearest Neighbor) werden auf die Datenmatrix mit 10 verschiedenen Zufallsstartwerten angewendet, um ein Klassifizierungsmodell im Klassifizierungs- und Regressionstrainingspaket (CARET) des R zu erstellen Umfeld. Jedes Modell wurde intern und extern unter der Bedingung eines 70:30-Aufteilungsverhältnisses zwischen Training und Test sowie k-fachen (k = 10) Kreuzvalidierungsmethoden validiert. Kurz gesagt, bei der k-fachen Kreuzvalidierung werden die Eingabedaten zufällig in k-gleich große Teilstichproben aufgeteilt. Eine der k Teilproben wird als Validierungsdaten zum Testen des Modells aufbewahrt, während die verbleibenden k-1 Teilproben als Trainingsdaten verwendet werden. Dieses k-fache Kreuzvalidierungsverfahren wird dann k-mal wiederholt (die Falten), wobei jede der k Teilproben genau einmal als Validierungsdaten verwendet wird.

Die erstellten Modelle generierten Meta-Prädiktoren (Metadaten) von 200 Binärbits (5 cholinerge Ziele × 4 Methoden des maschinellen Lernens × 10 Startzahlen). Die Metadaten wurden über mehrere Formarrays von ([50 × 4], [5 × 10 × 4], [10 × 5 × 4]) eingebettet. Das CNN-Modell, das aus verschiedenen Faltungs-, Pooling-, Abflachungs- und dichten Schichten besteht, wurde mit den Hyperparametern von maximal 100 Epochen, einer Stapelgröße von 32 und einer Lernrate von 0,01 mit dem Adam-Optimierer53 erstellt. Die EarlyStopping-Kriterien wurden eingeführt, um eine Überanpassung der CNN-Modelle zu verhindern und das Lernen vorzeitig zu beenden. Die „Softmax“-Aktivierungsfunktion wurde verwendet, um die Wahrscheinlichkeitsverteilung der Ähnlichkeit zur chemischen Kriegsführung zu definieren54. Die Lernleistung und Robustheit wurden anhand von Genauigkeits- und Verlustwerten mit zunehmender Epochenzahl gemessen. Als Verlustfunktion wurde die binäre Kreuzentropie verwendet, um die Abweichung zwischen den vorhergesagten und den tatsächlichen Klassenwerten zu messen.

Die Leistung jedes Modells wurde anhand von drei Klassifizierungsmetriken bewertet, nämlich dem Matthews-Korrelationskoeffizienten (MCC), der Genauigkeit und der Fläche unter der Betriebskennlinie des Empfängers (AUC), basierend auf richtig positiv (TP), richtig negativ (TN), falsch positiv (FP). ), falsch negativ (FN). Diese Metriken bewerten die statistische Leistung und Robustheit erstellter Modelle.

Jeder Autor akzeptierte die ethischen Standards einer echten Forschungsstudie.

Python-Code und verfeinerte Daten werden in GitHub verfügbar sein. https://github.com/college-of-pharmacy-gachon-university/Array_Classifier.

Chauhan, S. et al. Chemische Kampfstoffe. Umgebung. Toxicol. Pharmakol. 26, 113–122. https://doi.org/10.1016/j.etap.2008.03.003 (2008).

Artikel CAS PubMed Google Scholar

Kim, K., Tsay, OG, Atwood, DA & Churchill, DG Zerstörung und Erkennung chemischer Kampfstoffe. Chem. Rev. 111, 5345–5403. https://doi.org/10.1021/cr100193y (2011).

Artikel CAS PubMed Google Scholar

Lin, TJ et al. Epidemiologie der Organophosphat-Pestizidvergiftung in Taiwan. Klin. Toxicol. 46, 794–801. https://doi.org/10.1080/15563650801986695 (2008).

Artikel Google Scholar

Ganesan, K., Raza, S. & Vijayaraghavan, R. Chemische Kampfstoffe. J. Pharm. Bioall. Wissenschaft. 2, 166. https://doi.org/10.4103/0975-7406.68498 (2010).

Artikel CAS Google Scholar

Munro, N. Toxizität der chemischen Organophosphat-Kampfstoffe GA, GB und VX: Auswirkungen auf den öffentlichen Schutz. Umgebung. Gesundheitsperspektive. 102, 18–37. https://doi.org/10.1289/ehp.9410218 (1994).

Artikel CAS PubMed PubMed Central Google Scholar

Schätzungsweise 14.000 Menschen starben an Skandal um Luftbefeuchter-Desinfektionsmittel: Studie. Yonhap News Agency (abgerufen am 28. März 2022); https://en.yna.co.kr/view/AEN20200727006300315

Paek, D. et al. Landesweite Studie zu Lungenschäden durch Luftbefeuchter und Desinfektionsmittel in Südkorea, 1994–2011: Inzidenz und Dosis-Wirkungs-Beziehungen. Ann. ATS 12, 1813–1821. https://doi.org/10.1513/AnnalsATS.201504-221OC (2015).

Artikel Google Scholar

Herbizide, I. von M. (US) C. bis R. das HE in VV von E. bis (1994). Geschichte der Kontroverse um den Einsatz von Herbiziden. National Academies Press (USA) (abgerufen am 14. Juli 2021); https://www.ncbi.nlm.nih.gov/books/NBK236351/

Manikkam, M., Tracey, R., Guerrero-Bosagna, C. & Skinner, MK Dioxin (TCDD) induziert die epigenetische transgenerationale Vererbung von im Erwachsenenalter auftretenden Krankheiten und Spermien-Epimutationen. PLoS ONE 7, e46249. https://doi.org/10.1371/journal.pone.0046249 (2012).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Bewertung von Chemikalien – OECD (abgerufen am 28. März 2022); https://www.oecd.org/chemicalsafety/risk-assessment/

Risikomanagement von Chemikalien – OECD (abgerufen am 28. März 2022); https://www.oecd.org/chemicalsafety/risk-management/

Schmidt, CW TSCA 2.0: Eine neue Ära im chemischen Risikomanagement. Umgebung. Gesundheitsperspektive. 124, A182–A186. https://doi.org/10.1289/ehp.124-A182 (2016).

Artikel PubMed PubMed Central Google Scholar

Gharami, S., Aich, K., Das, S., Patra, L. & Mondal, TK Einfache Erkennung von Organophosphor-Nervenkampfstoff-Mimic (DCP) durch einen neuen ratiometrischen Schalter auf Chinolinbasis. Neue J. Chem. 43, 8627–8633. https://doi.org/10.1039/C9NJ02218J (2019).

Artikel CAS Google Scholar

Agrawal, M., Sava Gallis, DF, Greathouse, JA & Sholl, DS Wie nützlich sind gängige Simulanzien chemischer Kampfstoffe bei der Vorhersage des Adsorptionsverhaltens? J. Phys. Chem. C 122, 26061–26069. https://doi.org/10.1021/acs.jpcc.8b08856 (2018).

Artikel CAS Google Scholar

Mondloch, JE et al. Zerstörung chemischer Kampfstoffe mithilfe metallorganischer Gerüste. Nat. Mater 14, 512–516. https://doi.org/10.1038/nmat4238 (2015).

Artikel ADS CAS PubMed Google Scholar

Eddleston, M. Neuartige klinische Toxikologie und Pharmakologie der Selbstvergiftung durch Organophosphor-Insektizide. Annu. Rev. Pharmacol. Toxicol. 59, 341–360. https://doi.org/10.1146/annurev-pharmtox-010818-021842 (2019).

Artikel CAS PubMed Google Scholar

Europäische Beobachtungsstelle für Drogen und Drogensucht. (2015). Neue psychoaktive Substanzen in Europa: Ein Update des EU-Frühwarnsystems, März 2015. LU: Amt für Veröffentlichungen (abgerufen am 27. März 2022); https://doi.org/10.2810/372415

Europäische Beobachtungsstelle für Drogen und Drogensucht. und Europäisches Polizeiamt. (2016). EU-Drogenmarktbericht 2016: Eingehende Analyse. LU: Amt für Veröffentlichungen (abgerufen am 27. März 2022); https://doi.org/10.2810/219411

Urbas, A. et al. NPS Data Hub: Ein webbasiertes, von der Community betriebenes Repository für analytische Daten für neue psychoaktive Substanzen. Für. Chem. 9, 76–81. https://doi.org/10.1016/j.forc.2018.05.003 (2018).

Artikel CAS Google Scholar

Shafi, A., Berry, AJ, Sumnall, H., Wood, DM & Tracy, DK Neue psychoaktive Substanzen: Eine Übersicht und Aktualisierungen. Dort. Adv. Psychopharmakol. 10, 2045125320967197. https://doi.org/10.1177/2045125320967197 (2020).

Artikel PubMed PubMed Central Google Scholar

Chemical Network Algorithms for the Risk Assessment and Management of Chemical Threats – Fuller – 2012 – Angewandte Chemie Internationale Ausgabe – Wiley Online Library (abgerufen am 28. März 2022); https://doi.org/10.1002/anie.201202210

Carbó-Dorca, R. Bestimmung unbekannter molekularer Eigenschaften in molekularen Räumen. J. Mathe. Chem. 60, 353–359 (2022).

Artikel MathSciNet Google Scholar

Dobson, CM Chemischer Raum und Biologie. Natur 432, 824–828. https://doi.org/10.1038/nature03192 (2004).

Artikel ADS CAS PubMed Google Scholar

https://www.opcw.org/chemical-weapons-convention

Casida, JE Organophosphor-xenobiotische Toxikologie. Annu. Rev. Pharmacol. Toxicol. 57, 309–327. https://doi.org/10.1146/annurev-pharmtox-010716-104926 (2017).

Artikel CAS PubMed Google Scholar

Picard, B., Chataigner, I., Maddaluno, J. & Legros, J. Einführung in chemische Kampfstoffe, relevante Simulanzien und moderne Neutralisierungsmethoden. 10 (2019).

Hansen, JV Prädiktoren kombinieren: Vergleich von fünf meta-maschinellen Lernmethoden. Inf. Wissenschaft. 119, 91–105 (1999).

Artikel Google Scholar

Wan, J. et al. Metavorhersage von Phosphorylierungsstellen mit gewichteter Abstimmung und eingeschränkter Auswahl der Rastersuchparameter. Nukleinsäuren Res. 36, e22–e22 (2008).

Artikel Google Scholar

Manavalan, B., Basith, S., Shin, TH, Wei, L. & Lee, G. mAHTPred: Ein sequenzbasierter Meta-Prädiktor zur Verbesserung der Vorhersage von blutdrucksenkenden Peptiden mithilfe einer effektiven Merkmalsdarstellung. Bioinformatik 35, 2757–2765 (2019).

Artikel CAS Google Scholar

Keiser, MJ et al. Zusammenhang zwischen Proteinpharmakologie und Ligandenchemie. Nat. Biotechnologie. 25, 197–206. https://doi.org/10.1038/nbt1284 (2007).

Artikel CAS PubMed Google Scholar

Die OECD QSAR Toolbox nutzte die chemozentrische Annahme – OECD (abgerufen am 28. März 2022); https://www.oecd.org/chemicalsafety/risk-assessment/oecd-qsar-toolbox.htm

Venkanna, A. et al. Pharmakologische Verwendung eines neuartigen Gerüsts, anomeres N,N-Diarylaminotetrahydropyran: Suche nach molekularer Ähnlichkeit, chemozentrische Zielprofilierung und experimentelle Beweise. Wissenschaft. Rep. 7, 12535. https://doi.org/10.1038/s41598-017-12082-3 (2017).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Kumar, S., Jang, C., Subedi, L., Kim, SY & Kim, M. Umnutzung von FDA-zugelassenen Ringsystemen durch bidirektionales Zielringsystem-Dual-Screening. Wissenschaft. Rep. 10, 21133. https://doi.org/10.1038/s41598-020-78077-9 (2020).

Artikel ADS CAS PubMed PubMed Central Google Scholar

Lee, S.-H., Ahn, S. & Kim, M. Vergleich einer Abfrageverbindung mit Wirkstoffzielklassen unter Verwendung der 3D-chemischen Ähnlichkeit. Int. J. Mol. Wissenschaft. 21, 4208. https://doi.org/10.3390/ijms21124208 (2020).

Artikel PubMed Central Google Scholar

Dhorma, LP et al. Positionierung eines beispiellosen 1,5-Oxaza-Spirochinon-Gerüsts in SMYD2-Inhibitoren im epigenetischen Raum. EUR. J. Med. Chem. 227, 113880. https://doi.org/10.1016/j.ejmech.2021.113880 (2022).

Artikel CAS PubMed Google Scholar

Rogers, D. & Hahn, M. Fingerabdrücke mit erweiterter Konnektivität. J. Chem. Inf. Modell. 50, 742–754. https://doi.org/10.1021/ci100050t (2010).

Artikel CAS PubMed Google Scholar

Kumar, S. & Kim, M. SMPLIP-Score: Vorhersage der Ligandenbindungsaffinität anhand einfacher und interpretierbarer On-the-fly-Interaktions-Fingerabdruckmusterdeskriptoren. J. Cheminform. 13, 28. https://doi.org/10.1186/s13321-021-00507-1 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Lee, J., Kumar, S., Lee, S.-Y., Park, SJ & Kim, M. Entwicklung von Vorhersagemodellen zur Identifizierung potenzieller S100A9-Inhibitoren basierend auf Methoden des maschinellen Lernens. Vorderseite. Chem. https://doi.org/10.3389/fchem.2019.00779 (2019).

Artikel PubMed PubMed Central Google Scholar

Sadik, O. et al. Erkennung und Klassifizierung von Organophosphat-Nervenkampfstoffsimulanzien mithilfe von Support-Vektor-Maschinen mit Multiarray-Sensoren. J. Chem. Inf. Berechnen. Wissenschaft. 44, 499–507. https://doi.org/10.1021/ci034220i (2004).

Artikel CAS PubMed Google Scholar

Gaulton, A. et al. Die ChEMBL-Datenbank im Jahr 2017. Nucleic Acids Res. 45(D1), D945–D954 (2017).

Artikel CAS Google Scholar

Aloysius, N. & Geetha, M. Ein Überblick über tiefe Faltungs-Neuronale Netze. Int. Konf. Komm. Signalprozess. (ICCSP) 2017, 0588–0592. https://doi.org/10.1109/ICCSP.2017.8286426 (2017).

Artikel Google Scholar

LeCun, Y. et al. Handschriftliche Ziffernerkennung mit einem Backpropagation-Netzwerk. Fortschritte in neuronalen Informationsverarbeitungssystemen 2, (1989).

Krizhevsky, A., Sutskever, I. & Hinton, GE Imagenet-Klassifizierung mit tiefen Faltungs-Neuronalen Netzen. Fortschritte in neuronalen Informationsverarbeitungssystemen 25, (2012).

Szegedy, C. et al. Mit Windungen tiefer gehen. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition 1–9 (2015).

Simonyan, K. & Zisserman, A. Sehr tiefe Faltungsnetzwerke für die Bilderkennung im großen Maßstab. Vorabdruck arXiv:1409.1556 (2014).

He, K., Zhang, X., Ren, S. & Sun, J. Deep Residual Learning für die Bilderkennung. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition 770–778 (2016).

Deng, L. Die Mnist-Datenbank handgeschriebener Ziffernbilder für die maschinelle Lernforschung. IEEE-Signalprozess. Mag. 29(6), 141–142 (2012).

Artikel ADS Google Scholar

Chawla, NV, Bowyer, KW, Hall, LO & Kegelmeyer, WP SMOTE: Synthetische Minderheits-Oversampling-Technik. J. Artif. Int. Res. 16(1), 321–357 (2002).

MATH Google Scholar

ChEMBL-Datenbank (abgerufen am 28. März 2022); https://www.ebi.ac.uk/chembl/

https://www.emcdda.europa.eu, https://nps-datahub.com/

Berthold, MR et al. KNIME – der Konstanzer Information Miner: Version 2.0 und höher. AcM SIGKDD Explor. Newsletter. 11(1), 26–31 (2009).

Artikel Google Scholar

Steinbeck, C. et al. Das Chemistry Development Kit (CDK): Eine Open-Source-Java-Bibliothek für Chemo- und Bioinformatik. J. Chem. Inf. Berechnen. Wissenschaft. 43(2), 493–500. https://doi.org/10.1021/ci025584y (2003).

Artikel CAS PubMed PubMed Central Google Scholar

Kingma, DP & Ba, J. Adam: Eine Methode zur stochastischen Optimierung. https://doi.org/10.48550/arxiv.1412.6980. (2014).

Goodfellow, I., Bengio, Y. & Courville, A. 6.2.2.3 Softmax-Einheiten für Multinoulli-Ausgabeverteilungen. Deep Learning 180–184 (MIT Press, 2016).

Google Scholar

Referenzen herunterladen

Die Autoren danken Prof. Young Mi Yoon für seine hilfreiche Beratung.

Diese Studie wurde vom Basic Science Research Program der National Research Foundation of Korea (NRF) unterstützt, das vom Ministerium für Bildung, Wissenschaft und Technologie finanziert wird (Nr.: 2017R1E1A1A01076642, 2020R1I1A1A01074750).

Diese Autoren haben gleichermaßen beigetragen: Surendra Kumar und Chandni Kumari.

Abteilung für Pharmazie, Gachon Institute of Pharmaceutical Science, College of Pharmacy, Gachon University, 191 Hambakmoeiro, Yeonsu-gu, Incheon, Republik Korea

Surendra Kumar, Chandni Kumari, Sangjin Ahn und Mi-hyun Kim

Abteilung für Künstliche Intelligenz, Ajou-Universität, Suwon, 16499, Republik Korea

Sangjin Ahn

Abteilung für Datenmanagement, KEIS, 56 Mullae-ro 20-gil, Yeongdeungpo-gu, Seoul, Republik Korea

Hyoungrae Kim

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

MK konzipierte und gestaltete die Studie. Nach dem Plan von MK führten CK und SK alle Modellierungs- und Datenarbeiten durch. MK, CK und SK analysierten die Daten. SA unterstützte beim Aufbau der CNN-Architektur. HK hat die Evaluierung des CNN-Modells und der überarbeiteten Architektur empfohlen. MK und SK haben das Manuskript geschrieben und überarbeitet. MK stellte das Labor für molekulare Modellierung und die Arbeitseinrichtung für synthetische Forschung zur Verfügung. Alle Autoren haben das endgültige Manuskript gelesen und genehmigt. Jeder Autor stimmte der Einreichung bei der Zeitschrift und der Autorschaft zu.

Korrespondenz mit Mi-hyun Kim.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Springer Nature bleibt neutral hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die Originalautor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Kumar, S., Kumari, C., Ahn, S. et al. Vorhersage chemischer Kampfstoffe basierend auf Meta-Prädiktoren vom Typ cholinerger Array. Sci Rep 12, 16709 (2022). https://doi.org/10.1038/s41598-022-21150-2

Zitat herunterladen

Eingegangen: 15. Juni 2022

Angenommen: 23. September 2022

Veröffentlicht: 06. Oktober 2022

DOI: https://doi.org/10.1038/s41598-022-21150-2

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.