Difference between revisions of "Metabolome"
Sbprm2018 1 (talk | contribs) |
Sbprm2018 1 (talk | contribs) |
||
(6 intermediate revisions by the same user not shown) | |||
Line 1: | Line 1: | ||
+ | Morgane Burgisser, Jessica Rebeaud, Emmanuel Constantin et Elsa Rosete Simoes | ||
+ | |||
+ | Superviseur : Mirjam Mattei | ||
+ | |||
[[But:]] | [[But:]] | ||
+ | |||
Le but est d'analyser des données RMN extraites d'échantillons l'urine. Les données RMN nous informent sur les métabolites présents dans l'urine, que nous essayons de lier avec des maladies d'intérêt. Nous allons aussi essayer de grouper les individus qui ont le même profil métabolomique. | Le but est d'analyser des données RMN extraites d'échantillons l'urine. Les données RMN nous informent sur les métabolites présents dans l'urine, que nous essayons de lier avec des maladies d'intérêt. Nous allons aussi essayer de grouper les individus qui ont le même profil métabolomique. | ||
[[Pourquoi le projet est-il intéressant?]] | [[Pourquoi le projet est-il intéressant?]] | ||
+ | |||
Ce projet est intéressant car il nous permettrait de faire des liens plus rapides entre des métabolites et des maladies d'intérêt. Ceci permettrait des analyses relativement simples mais qui en diraient beaucoup sur les maladies potentielles. En effet, il est facile d'obtenir un échantillon d'urine et de l'analyser. | Ce projet est intéressant car il nous permettrait de faire des liens plus rapides entre des métabolites et des maladies d'intérêt. Ceci permettrait des analyses relativement simples mais qui en diraient beaucoup sur les maladies potentielles. En effet, il est facile d'obtenir un échantillon d'urine et de l'analyser. | ||
En l'occurrence, nous avons choisis deux maladies d'intérêt qui sont Alzheimer et le diabète. Nous les avons choisis car ce sont des pathologies communes et qui peuvent potentiellement toucher tout le monde (d'ailleurs, on connait tous au moins une personne atteinte d'une de ces maladies). | En l'occurrence, nous avons choisis deux maladies d'intérêt qui sont Alzheimer et le diabète. Nous les avons choisis car ce sont des pathologies communes et qui peuvent potentiellement toucher tout le monde (d'ailleurs, on connait tous au moins une personne atteinte d'une de ces maladies). | ||
Line 9: | Line 15: | ||
[[Méthodes]] | [[Méthodes]] | ||
+ | |||
- RMN | - RMN | ||
+ | |||
RMN signifie Résonance magnétique nucléaire et permet de déterminer la structure d’une molécule organique. Il existe plusieurs types de RMN et la méthode utilisée pour l’analyse des données de CoLaus est la RMN du proton qui se limite à l’étude des noyaux d’atomes d’hydrogène. | RMN signifie Résonance magnétique nucléaire et permet de déterminer la structure d’une molécule organique. Il existe plusieurs types de RMN et la méthode utilisée pour l’analyse des données de CoLaus est la RMN du proton qui se limite à l’étude des noyaux d’atomes d’hydrogène. | ||
Line 18: | Line 26: | ||
- ISA | - ISA | ||
+ | |||
Isa est une méthode de biclustering avec un système de seuil qui permet de grouper des individus et des positions (ppm ) dans le spectre RMN correspondant à des métabolites features en sélectionnant ceux les plus éloignés de la moyenne et en leur donnant un score. Les autres valeurs (trop proches de la moyenne), se verrons attribuer un 0. On obtient donc une matrice formée de valeurs (entre -1 et 1) correspondant aux scores des patients et des ppm. | Isa est une méthode de biclustering avec un système de seuil qui permet de grouper des individus et des positions (ppm ) dans le spectre RMN correspondant à des métabolites features en sélectionnant ceux les plus éloignés de la moyenne et en leur donnant un score. Les autres valeurs (trop proches de la moyenne), se verrons attribuer un 0. On obtient donc une matrice formée de valeurs (entre -1 et 1) correspondant aux scores des patients et des ppm. | ||
Il existe d'autres algorithmes mais nous utilisons ISA car il permet de donner des scores après avoir fait une analyse itérative avec un seuil, ce qui permet de restreindre les critères de sélection. | Il existe d'autres algorithmes mais nous utilisons ISA car il permet de donner des scores après avoir fait une analyse itérative avec un seuil, ce qui permet de restreindre les critères de sélection. | ||
+ | |||
+ | |||
+ | - Module | ||
+ | |||
+ | On veut maintenant former des modules. (Un module est une colonne de la matrice dans laquelle au moins un score est différent de 0.) | ||
+ | Après l’analyse itérative d’ISA on obtient deux matrices, une avec les scores des individus et une avec ceux des ppm. Comme nous ne nous intéressons pas aux 0, nous les excluons de sorte que chaque colonne de cette nouvelle matrice correspond à un module. | ||
+ | |||
+ | |||
+ | - Analyse grâce à la corrélation | ||
+ | |||
+ | Une fois qu'on a nos modules, on mesure leur corrélation à un phénotype d'intérêt. Les modules qui sont les plus corrélés (p-value <<0.05) sont sélectionnés. Avec les modules sélectionner, nous faisons un graphique pour observer graphiquement la corrélation. | ||
+ | |||
+ | |||
+ | - Metabomatching | ||
+ | |||
+ | Le metabomatching sert à mettre en relation des variances génétiques (SNIP) avec des métabolites produits à l’aide d’un spectre RMN, dans la mesure où cette variation influence la composition d’un métabolite. | ||
+ | Nous on l’utilise simplement pour identifier les métabolites en utilisant les scores de ISA comme beta-value. | ||
+ | |||
+ | |||
+ | [[Résultats]] | ||
+ | |||
+ | Nous avons fait un metabomatching du module qui était le plus corrélé entre les individus et le glucose pour voir si cette forte corrélation se reflétait sur un métabolite candidat lié au diabète. Nous voyons que le glucose est en effet un métabolite candidat pour ce module. Mais nous ne pouvons pas affirmer que le pseudospectre correspond à celui du glucose car les pics ne dépasses même pas la ligne verte. | ||
+ | |||
+ | [[Challenges]] | ||
+ | |||
+ | Si nous avions plus de temps, nous nous pencherions sur la maladie d’Alzheimer. En effet, les données de CoLaus étaient insuffisantes pour trouver des métabolites significativement liés à cette maladie. Pour poursuivre notre recherche, il faudrait demander des autorisations pour accéder aux données de psyCoLaus. Cette étude est liées aux démences et non pas aux maladies cardio-vasculaires. | ||
+ | |||
+ | ISA est un algorithme très complexe c’est pourquoi il nous faudrait plus de temps pour le maîtriser et le comprendre dans les moindres détails. | ||
+ | |||
+ | |||
+ | [[Feedback]] | ||
+ | |||
+ | Le cours permet d’avoir un aperçu plus concert de ce qu’on sera amené à faire plus tard et nous donne un avant goût des étapes pour faire une recherche scientifique. | ||
+ | Ce cours nous a aussi aidé à prendre plus d’assurance sur R et à avoir de plus amples connaissances de ce logiciel. | ||
+ | Il est important de noté que le cours est très bien organisé. En effet, le fait de devoir faire une première présentation à blanc nous a permis de nous exercer et de se perfectionner avant la présentation finale. De plus, il est agréable d’avoir une présentation orale durant le semestre plutôt qu’un examen écrit. | ||
+ | En outre, le fait de présenter nos résultats devant un public est un bon exercice pour notre avenir. |
Latest revision as of 14:09, 24 May 2018
Morgane Burgisser, Jessica Rebeaud, Emmanuel Constantin et Elsa Rosete Simoes
Superviseur : Mirjam Mattei
Le but est d'analyser des données RMN extraites d'échantillons l'urine. Les données RMN nous informent sur les métabolites présents dans l'urine, que nous essayons de lier avec des maladies d'intérêt. Nous allons aussi essayer de grouper les individus qui ont le même profil métabolomique.
Pourquoi le projet est-il intéressant?
Ce projet est intéressant car il nous permettrait de faire des liens plus rapides entre des métabolites et des maladies d'intérêt. Ceci permettrait des analyses relativement simples mais qui en diraient beaucoup sur les maladies potentielles. En effet, il est facile d'obtenir un échantillon d'urine et de l'analyser. En l'occurrence, nous avons choisis deux maladies d'intérêt qui sont Alzheimer et le diabète. Nous les avons choisis car ce sont des pathologies communes et qui peuvent potentiellement toucher tout le monde (d'ailleurs, on connait tous au moins une personne atteinte d'une de ces maladies). Projet intéressant car donne la possibilité de généraliser le concept à n'importe quel trait phénotypique. Intéressant car on utilise les données d'une étude faite à Lausanne (colaus = étude qui cherche à connaître es facteurs de risque et les maladies cardiovascuaires). Durant cette étude, 835 échantillon d'urine correspondant chacun a un individu ont été testés. Il est difficile d'analyser les échantillons d'urine car les données RMN correspondantes regroupent plein beaucoup de pics (ppm). Il faut donc cibler quels ppm sont important et dans un second temps, essayer de les lier à des métabolites particuliers.
- RMN
RMN signifie Résonance magnétique nucléaire et permet de déterminer la structure d’une molécule organique. Il existe plusieurs types de RMN et la méthode utilisée pour l’analyse des données de CoLaus est la RMN du proton qui se limite à l’étude des noyaux d’atomes d’hydrogène.
Quand un proton est plongé dans un champ magnétique, il se comporte comme un aimant. Sa fréquence de résonance dépend des liaisons et atomes voisins ce qui nous permet de déterminer l’environnement chimique de chaque proton d’une molécule et donc de trouver sa structure.
Les pics du spectre RMN correspondent à la résonance des différents protons présents dans la molécule. L’axe horizontal représente le déplacement chimique exprimé en ppm (parties par millions)
- ISA
Isa est une méthode de biclustering avec un système de seuil qui permet de grouper des individus et des positions (ppm ) dans le spectre RMN correspondant à des métabolites features en sélectionnant ceux les plus éloignés de la moyenne et en leur donnant un score. Les autres valeurs (trop proches de la moyenne), se verrons attribuer un 0. On obtient donc une matrice formée de valeurs (entre -1 et 1) correspondant aux scores des patients et des ppm. Il existe d'autres algorithmes mais nous utilisons ISA car il permet de donner des scores après avoir fait une analyse itérative avec un seuil, ce qui permet de restreindre les critères de sélection.
- Module
On veut maintenant former des modules. (Un module est une colonne de la matrice dans laquelle au moins un score est différent de 0.) Après l’analyse itérative d’ISA on obtient deux matrices, une avec les scores des individus et une avec ceux des ppm. Comme nous ne nous intéressons pas aux 0, nous les excluons de sorte que chaque colonne de cette nouvelle matrice correspond à un module.
- Analyse grâce à la corrélation
Une fois qu'on a nos modules, on mesure leur corrélation à un phénotype d'intérêt. Les modules qui sont les plus corrélés (p-value <<0.05) sont sélectionnés. Avec les modules sélectionner, nous faisons un graphique pour observer graphiquement la corrélation.
- Metabomatching
Le metabomatching sert à mettre en relation des variances génétiques (SNIP) avec des métabolites produits à l’aide d’un spectre RMN, dans la mesure où cette variation influence la composition d’un métabolite. Nous on l’utilise simplement pour identifier les métabolites en utilisant les scores de ISA comme beta-value.
Nous avons fait un metabomatching du module qui était le plus corrélé entre les individus et le glucose pour voir si cette forte corrélation se reflétait sur un métabolite candidat lié au diabète. Nous voyons que le glucose est en effet un métabolite candidat pour ce module. Mais nous ne pouvons pas affirmer que le pseudospectre correspond à celui du glucose car les pics ne dépasses même pas la ligne verte.
Si nous avions plus de temps, nous nous pencherions sur la maladie d’Alzheimer. En effet, les données de CoLaus étaient insuffisantes pour trouver des métabolites significativement liés à cette maladie. Pour poursuivre notre recherche, il faudrait demander des autorisations pour accéder aux données de psyCoLaus. Cette étude est liées aux démences et non pas aux maladies cardio-vasculaires.
ISA est un algorithme très complexe c’est pourquoi il nous faudrait plus de temps pour le maîtriser et le comprendre dans les moindres détails.
Le cours permet d’avoir un aperçu plus concert de ce qu’on sera amené à faire plus tard et nous donne un avant goût des étapes pour faire une recherche scientifique. Ce cours nous a aussi aidé à prendre plus d’assurance sur R et à avoir de plus amples connaissances de ce logiciel. Il est important de noté que le cours est très bien organisé. En effet, le fait de devoir faire une première présentation à blanc nous a permis de nous exercer et de se perfectionner avant la présentation finale. De plus, il est agréable d’avoir une présentation orale durant le semestre plutôt qu’un examen écrit. En outre, le fait de présenter nos résultats devant un public est un bon exercice pour notre avenir.