Résumé:
Cet ouvrage présente les modèles statistiques récemment développés au sein
de diverses communautés pour accéder à l'information contenue dans des
collections textuelles. Les problématiques considérées sont liées aux
applications visant à faciliter l'accès à l'information :
- recherche et extraction d'information ;
- catégorisation et classification de textes ;
- détection et classification d'opinions ;
- aide à la compréhension : résumé automatique, traduction automatique,
visualisation.
Afin de donner au lecteur une description aussi complète que possible, l'accent
est mis sur les modèles probabilistes utilisés dans les applications concernées,
en exposant la relation entre modèles et applications et en illustrant le
comportement de chaque modèle sur des collections réelles.
Modèles statistiques pour l'accès à l'information textuelle est organisé autour de
quatre thématiques : la recherche d'information et les modèles
d'ordonnancement, la classification et le clustering (régression logistique,
méthodes à noyaux, champ markoviens, etc.), le multilinguisme et la
traduction automatique et les applications émergentes comme l'exploration
d'information.