Logo de l'E.N.T. Alsace
Thèses électroniques Service Commun de la documentation
Logo de l'Université de Strasbourg
Thèses et Mémoire de l'Université de Strasbourg

Les méthodes de la fouille du web pour la détection des sources faisant autorité

FIALA, Dalibor (2007) Les méthodes de la fouille du web pour la détection des sources faisant autorité. Thèses de doctorat, Université Louis Pasteur.

Plein texte disponible en tant que :

PDF - Un observateur de PDF est nécessaire, comme par exemple GSview, Xpdf or Adobe Acrobat Reader
2579 Kb

Résumé

La partie innovante de cette thèse porte sur les définitions, les explications et teste des modifications de la formule standard de PageRank adaptée aux réseaux bibliographiques. Les nouvelles versions de PageRank tiennent compte non seulement du graphe de citations mais aussi du graphe de collaboration. On vérifie l’applicabilité des nouveaux algorithmes en traitant des données issues de la bibliothèque numérique DBLP et en comparant les rangs des lauréats du prix « ACM SIGMOD E. F. Codd Innovations Award ». Les classements reposant sur les informations concernant à la fois les citations et les collaborations s’avèrent meilleurs que les classements générés par PageRank standard. Dans un autre chapitre de la thèse, on présente une méthodologie et deux études de cas concernant la recherche des chercheurs faisant autorité en analysant des sites Web académiques.

Type d'EPrint:Thèse de doctorat
Discipline de la thèse / mémoire / rapport :Computer science and engineering
Mots-clés libres:fouille du Web, robots Web, algorithmes d’évaluation, réseaux bibliographiques, citations, co-auteurs, authorité, PageRank bibliographique
Sujets:CL Classification > DDC Dewey Decimal Classification > 000 Informatique, information, généralités > 006 Méthodes informatiques particulières > 006.3 Intelligence artificielle
Classification Thèses Unistra > Sciences, technologies > Informatique, information, généralités > 006 Méthodes informatiques particulières > 006.3 Intelligence artificielle

UNERA Classification UNERA > ACT Domaine d'activité UNERA > ACT-11 Technologies de l’information, télécommunications, réseaux
UNERA Classification UNERA > DISC Discipline UNERA > DISC-19 Mathématiques et informatique
Code ID:1417
Déposé le :26 Février 2008

Administrateurs de l'archive uniquement : éditer cet enregistrement