Logo de l'E.N.T. Alsace
Thèses électroniques Service Commun de la documentation
Logo de l'Université de Strasbourg
Thèses et Mémoire de l'Université de Strasbourg

Etablissement d'une architecture bioinformatique et biostatistique d'intégration et d'analyse des données génomiques, épigénétiques et phylogénétiques du génome humain : application au cas des sites de fixation du facteur hSTAF/ZNF143

ANNO, Yannick-Noël (2010) Etablissement d'une architecture bioinformatique et biostatistique d'intégration et d'analyse des données génomiques, épigénétiques et phylogénétiques du génome humain : application au cas des sites de fixation du facteur hSTAF/ZNF143. Thèses de doctorat, Université de Strasbourg.

Plein texte disponible en tant que :

PDF - Un observateur de PDF est nécessaire, comme par exemple GSview, Xpdf or Adobe Acrobat Reader
11675 Kb

Résumé

Le facteur STAF est une protéine deux régions distinctes d’activation de la transcription, selon la machinerie de transcription mobilisée. Une étude récente faisant état d'un millier de sites potentiels au sein des promoteurs de gènes protéiques et dont 400 furent validés expérimentalement laisse supposer que le nombre de sites à l'échelle du génome soit encore plus nombreux, forçant à développer d'autres méthodes de caractérisation à même de questionner le génome entier et de forts volumes de données. Ce problème adresse un challenge d'envergure supérieure : faire émerger de la connaissance à partir d'une région génomique. Afin de savoir quelle connaissance est pertinente, il est indispensable d'évaluer en quoi celle-ci s'écarte des valeurs attendues du génome et donc de connaitre ces valeurs. Dans cette optique nous avons développé l'architecture GeCo, solution soutenue par une base de données automatisée et son portail web, et dont la puissance repose sur son aptitude à déterminer les valeurs statistiques des gènes et du génome complet. Caractérisé par un ensemble de descripteurs (séquence, épigénétique, phylogénétique), le contexte qui en émerge est utilisé pour replacer tout questionnement génomique dans son environnement global, de manière rapide et fiable. Au delà du contexte génomique, c'est une philosophie de développement basée sur de solides outils statistiques que nous avons développé. Son message est que produire des résultats ne suffit plus et qu'il est impératif de les remettre dans leur contexte. Cette architecture permit de mettre en évidence plusieurs milliers de sites de STAF et est d’ores et déjà connectée aux autres projets du laboratoire.

Type d'EPrint:Thèse de doctorat
Discipline de la thèse / mémoire / rapport :Sciences du Vivant. Bioinformatique
Mots-clés libres:ChIP-Seq ; biostatistique ; sites de fixation de facteur de transcription ; génome humain ; plate-forme bioinformatique ; localisation génomique ; acide rétinoïque ; séquençage haut-débit
Sujets:CL Classification > DDC Dewey Decimal Classification > 500 Sciences de la nature et mathématiques > 570 Sciences de la vie. Biologie. Biochimie > 572 Biochimie > 572.8 Génétique biochimique
Classification Thèses Unistra > Santé > Sciences de la vie, biologie, biochimie > 570 Sciences de la vie. Biologie. Biochimie > 572 Biochimie > 572.8 Génétique biochimique

CL Classification > DDC Dewey Decimal Classification > 500 Sciences de la nature et mathématiques > 570 Sciences de la vie. Biologie. Biochimie > 570.1 Physiologie, théories > 570.15 Sciences, techniques et mathématiques appliquées à la biologie
Classification Thèses Unistra > Santé > Sciences de la vie, biologie, biochimie > 570 Sciences de la vie. Biologie. Biochimie > 570.1 Physiologie, théories > 570.15 Sciences, techniques et mathématiques appliquées à la biologie

UNERA Classification UNERA > DISC Discipline UNERA > DISC-16 Sciences de la vie et de la santé, psychologie
UNERA Classification UNERA > ACT Domaine d'activité UNERA > ACT-2 Bio-industries, biotechnologies
Code ID:1924
Déposé le :13 Janvier 2011

Administrateurs de l'archive uniquement : éditer cet enregistrement