DICTIONNAIRE DE STATISTIQUE 2005

 

Concepts, Méthodes, Résultats

 

par

 

Jean Alain Monfort

 

 

Statisticien Economiste

 

(17 / 09 / 2015)

 

AVANT-PROPOS

 

INTRODUCTION

 

 

AVANT-PROPOS

 

 

La Statistique est souvent présentée, tantôt sous une forme « utilitariste », à finalités pratiques (« recettes »), tantôt sous une forme « calculatoire », ou encore « procédurale », voire « algorithmique ». Ces deux modes de présentation ont, sans doute, leur intérêt. Mais des études, ou des formations, basées sur ces seules considérations réduisent la Statistique à n’être qu’un outils que l’on peut manipuler sans en comprendre les fondements.

 

Un objectif majeur de ce travail est un objectif pédagogique, dont l’une des conséquences est de montrer que la Statistique, en tant que savoir (« science ») et en tant que savoir-faire (« art »), est, dans son essence, éloignée de ces présentations très restrictives, voire simplistes. Etant à la fois une branche des mathématiques et un instrument général opérant au coeur même de la science, la Statistique apporte donc bien davantage que des recettes ou des calculs, si sophistiqués soient-ils.

 

En effet, le savoir est une chose, la compréhension en est une autre. Il s’agit ici d’essayer de faciliter l’assimilation (a) des fondements des concepts statistiques, (b) des problèmes à traiter et des motivations des statisticiens pour mettre au point des méthodes appropriées, et aussi (c) la signification (ou l’intérêt) et la portée des résultats obtenus à partir de ces fondamentaux.

 

1. Ce dictionnaire a pour but de rendre service aux utilisateurs de la Statistique, quels qu'en soient le niveau ou l'étendue des connaissances, ainsi que les domaines d'application.

 

            1.1. Etudiants et enseignants des différents degrés universitaires ou des grandes écoles, à titre de référence. Celle-ci peut constituer une « transition » entre l'étude générale de la Statistique, telle qu'elle est enseignée dans les grandes écoles ou les universités, et les travaux statistiques approfondis pendant la carrière professionnelle ultérieure (revues spécialisées, applications particulières), qui nécessitent souvent des connaissances supplémentaires, ainsi que de l’expérience.

 

            1.2. Ingénieurs et chercheurs des entreprises ou des administrations, dont les sphères d'activité requièrent des bases statistiques, à titre d'outils méthodologique et technique.

 

            1.3. Scientifiques et praticiens, appelés ici « hommes de l'art », que leurs domaines de connaissance respectifs conduisent vers l'utilisation plus ou moins régulière d'informations statistiques : séries ou tableaux statistiques, d'une part, articles de revues nécessitant une connaissance des concepts ou des méthodes mises en oeuvre dans les applications, d'autre part.

 

2. Pour en asseoir la valeur scientifique aussi bien que l'utilité pratique, la réalisation de ce dictionnaire a cherché à atteindre des objectifs importants.

 

            2.1. Combler en France une lacune, qui a été durable, dans ce domaine ;

 

            2.2. Réunir, dans un même endroit et sous une forme aussi homogène que possible, des définitions et propriétés statistiques figurant habituellement dans des ouvrages divers, plus ou moins spécialisés, souvent hétérogènes dans leur contenu ou dans leur présentation. Cet objectif doit conduire à un corpus aussi complet et autonome que possible ;

 

            2.3. Fournir des définitions précises et rigoureuses des concepts statistiques ainsi que des descriptions concises des méthodes mises en oeuvre. Cet objectif couvre des domaines très vastes : aussi, quelques règles simples, développées dans l’introduction, ont servi à circonscrire le champ des thèmes abordés. La délimitation de la matière traîtée est donc implicitement résumée dans la classification générale des thèmes ;

 

            2.4. Mettre à la portée du statisticien « généraliste » ou de l'homme de l'art des informations plus approfondies que celles auxquelles il a usuellement recours et, corrélativement, fournir au « spécialiste » des notions relatives à des spécialités différentes de la sienne. Parallèlement, on a cherché à faciliter l'accès à des notions élaborées à partir de notions élémentaires ;

 

            2.5. Rassembler, ce qui est le propre de tout dictionnaire, les résultats importants afférents à un même thème (concept, méthode, propriété), notamment afin d'économiser au lecteur l'effort et la dispersion inévitables liés à leur recherche ;

 

            2.6. Dresser un large panorama des concepts, méthodes et résultats sur lesquels se fonde la Statistique moderne, autrement dit, décrire les démarches usuelles du statisticien lorsqu'il traite un problème statistique. Le dictionnaire montre d'ailleurs que, par delà une certaine diversité, nécessaire pour progresser, ces démarches procèdent souvent d'une certaine unité d'esprit qui peut servir de fil directeur au lecteur peu expérimenté.

 

On peut, sur un exemple concret, donner un aperçu de ces multiples possibilités.

 

3. Les caractéristiques majeures de ce site sont les suivantes.

 

            3.1. Fruit d'un travail de compilation, ce dictionnaire rassemble (objectif d'exhaustivité), trie (objectif de pertinence) et met en forme (objectif de présentation) un domaine qui mérite d'être mieux connu (formations, utilisations) ;

 

            3.2. Le souci de pédagogie - dont la négligence entraîne souvent, chez l’utilisateur, de mauvaises interprétations ou des retours en arrière sur des notions supposées connues - conduit à doubler le texte statistique (donc mathématique) à l'aide d'un texte littéraire qui autorise, lorsque celà est possible, une interprétation intuitive des notions. Tout en limitant les redondances dans le discours statistique proprement dit, cette méthode permet de mieux expliquer les notions. Un environnement mathématique, constitué des « méthodes mathématiques de la Statistique », contribue en outre à préciser ou à rappeler, le cas échéant, un concept ou une notation mathématiques utilisés à titre intermédiaire ;

 

            3.3. Enfin, l'exigence de rigueur se traduit par un formalisme concis, évitant les abus de language (ceux-ci sont, le cas échéant, indiqués), et par l'adoption d'un système de notations facile à interpréter et, autant qu’il est possible (cf infra et notations), homogène dans la plus grande partie de ce travail.

 

4. Pour permettre une consultation pratique et rapide, le site est organisé comme suit.

 

            4.1. L'accès direct vers une notion donnée s'effectue simplement en suivant l'ordre alphabétique des articles (de A à Z), c’est-à-dire par usage des index analytiques : en principe, il existe un index par lettre de l'alphabet (à quelques regroupements près). Un article correspond, généralement, à un terme ou à un concept statistique, ou encore à une expression terminologique ou conceptuelle plus complexe. Il peut donc correspondre à un concept, à une méthode ou à un résultat ; il peut éventuellement en contenir plusieurs (lorsque les notions sont très liées entre elles, ou qu’elles sont très spécialisées). Les définitions sont notamment repérables en caractères gras dans le texte.

 

Les index dont il est question reprennent les articles directs, mais aussi les termes ou expressions terminologiques important(e)s localisé(e)s dans le corps des articles. Les divers renvois ou références doivent permettre une consultation aisée, c'est-à-dire rapide et précise.

 

            4.2. L'accès indirect vers une notion donnée s'effectue alors grâce aux renvois situés dans les articles auxquels le lecteur a accédé directement. Les index contiennent généralement aussi ces accès indirects. Des redondances, voulues, entre ces divers renvois (liens hypertextes) doivent faciliter les cheminements.

 

            4.3. Excepté l'environnement mathématique (méthodes mathématiques de la Statistique), incorporé au dictionnaire sous forme d'articles plus ou moins détaillés, il existe deux catégories d'articles directs.

 

            (a) la première comporte des articles généraux qui introduisent une théorie ou une méthode, souvent sous une forme littéraire accessible, et qui renvoient à des articles plus spécialisés ou techniques : ceux-ci (concepts, méthodes ou résultats) sont développés ailleurs dans le corps des articles ;

 

            (b) la seconde catégorie regroupe des articles plus spécialisé ou plus techniques, auxquels il est fait référence dans la première catégorie, ainsi que d'autres articles de portée générale qu'il serait arbitraire de rattacher à une théorie ou à une méthode particulière (formules et inégalités classiques, théorèmes, propriétés ou critères, etc).

 

            4.4. Les articles - qu’ils soient banalisés, spécialisés ou techniques - comprennent généralement :

 

            (a) un rattachement à la classification thématique générale (codification des thèmes) ;

 

            (b) souvent, une courte introduction ;

 

            (c) une définition (voire même plusieurs : variantes d'une définition, ou encore suite de définitions de plus en plus générales) ;

 

            (d) des notations-types courantes ;

 

            (e) les propriétés les plus caractéristiques, lorsqu'elles ne nécessitent pas de développements trop importants. Dans le cas contraire, il s’agit généralement d’une méthode en elle-même, à laquelle est alors dédié un article ;

 

            (f) des remarques permettant d'apprécier la portée ou l'utilité de la notion examinée (concept, méthode ou résultat).

 

            4.5. Les notations mathématiques ont été uniformisées au maximum. Elles sont ainsi regroupées dans un index des principales notations. Les autres notations rencontrées doivent être considérées comme spécifiques de l’article concerné, dans le corps duquel elles sont donc définies. La grande majorité des symboles utilisés est de pratique courante ; à défaut, leur signification est précisée lors de leur utilisation.

 

            4.6. Un lexique  anglais-français est inclus, en sorte que l'accès à la littérature statistique internationale, largement dominée par la langue anglaise, en soit facilité. S'agissant d'un texte rédigé en langue française, le lexique inverse (français - anglais) paraissait d'un intérêt limité et n’a donc pas été inséré.

 

            4.7. Enfin, un index des noms d'auteurs a été établi. Un travail de cette nature est naturellement redevable des apports des grands statisticiens, dont chaque siècle fournit ses propres exemplaires. Malgré un risque d'arbitraire, l'imputation d'un concept, d'une méthode ou d'un résultat a été effectuée : soit en suivant l'usage (règle générale), soit en citant les auteurs qui ont fait progresser la connaissance de façon significative et reconnue. Lorsque plusieurs auteurs sont concernés, ils sont représentés selon l'ordre alphabétique de leur patronyme.

 

 

*

*             *

*

 

Ce dictionnaire peut parfois donner l’impression d’un « essai » de type BOURBAKI, combinant rigueur mathématique, axiomatisation généralisée, et figeage des développements. Mais, aussi tentante qu’elle soit, une telle prétention aurait certainement été utopique ; de plus, elle est démentie par la présence, à tous les niveaux, de développements littéraires et de guides pédagogiques visant à présenter les finalités en fonction du contexte. Ces précautions devraient notamment assurer une pérennité maximale à ce contenu.

 

Nous espérons avoir ainsi accompli une oeuvre utile et fiable, en offrant des points de départ, préalables ou simultanés, à la lecture d'ouvrages, généraux ou spécialisés, ou de revues périodiques.

 

 

® n ¬

 

 

INTRODUCTION

 

 

La Statistique constitue par excellence un intrument scientifique puissant qui permet d'établir le nécessaire aller - retour entre les théories et les faits, c'est-à-dire entre les hypothèses et les observations, ou encore entre les idées et les expériences. Cette caractéristique majeure d'une science habituellement réputée austère et difficile en fait ainsi une démarche générale pour l'étude de l'Homme et des divers « milieux » dans lesquels il cherche à se situer.

 

Pour des raisons pédagogiques, et avec un risque d’arbitraire, on distinguera par commodité ici cinq milieux par rapport auxquels l’homme peut vouloir satisfaire sa curiosité, ou sur lesquels il peut vouloir agir : il s’agit des milieux physique, biologique, écologique, psychologique et sociologique (cf domaine de connaissance). En effet, sans philosophie excessive, on admet ici que le milieux physique (physique du globe et des corps célestes) est le substrat sur lequel s’est « greffé » au cours du temps un milieu biologique (faune, flore) ; les intéractions entre milieu physique et biologique ont en même temps conduit à un ensemble complexe de fonctions définissant le milieu écologique ; le monde vivant a aussi développé des comportements, individuels ou de groupe, qui définissent l’objet d’un milieu psychologique et d’un milieu sociologique (cf aussi Grand mystère de l’existence).

 

On situera donc l’Homme à l’origine de divers questionnements portant sur ces domaines. En raison du caractère spécialisé de l’activité statistique, une « division du travail » s’est imposée : une sorte de « contrat social » a conduit à donner au scientifique - donc, à un degré ou à un autre, au statisticien - un mandat en vue de l’éclairer sur le fonctionnement de ces milieux. Le plus souvent, cette connaissance doit apporter des informations permettant de mieux agir sur ces milieux : il s’agit ; en effet, de mieux satisfaire divers besoins.

 

1. Définir la Statistique revient donc à préciser sa place dans le champ de l'activité scientifique.

 

On peut d'abord justifier son utilité par son implication dans les divers domaines de l'activité humaine évoqués ci-dessus (physique, biologie, écologie, psychologie ou sociologie). Chaque domaine de connaissance a, en fonction des besoins ressentis, engendré des sous-domaines spécialisés intégrant, de façon étroite, les apports de la Statistique. Ainsi, les développements les plus récents, au regard de l’histoire des sciences, concernent :

 

            (a) en physique : la physique statistique, la météorologie et la climatologie, la géologie ;

 

            (b) en biologie : la biométrie ;

 

            (c) en écologie : la synécologie, l’écosystémique ;

 

            (d) en psychologie : la psychométrie ;

 

            (e) en sociologie : la linguistique quantitative, la sociométrie, l'économie (économétrie, recherche opérationnelle), l'industrie et ses technologies (technométrie), l'assurance (actuariat), la démographie (démométrie), etc.

 

Inversement, chaque domaine de connaissance a contribué à la naissance ou au développement de concepts, méthodes ou résultats spécifiquement statistiques. Ceux-ci étaient parfois, au départ, propres au domaine. Mais l'expérience a montré qu'ils pouvaient souvent être transposés ou étendus avec fruits à d'autres disciplines.

 

En effet, de façon générale, le progrès scientifique procède par consolidation de trois piliers :

 

            (a) amélioration des appareils d'observation statistique, ou dispositifs d’observation, spécifiques de chaque domaine (instruments d'observation plus « fins ») (cf système d’observation). Ainsi (physique), l'usage des satellites permet de mieux observer les phénomènes météorologiques ou climatiques, par rapport aux relevés au sol ou par ballons-sondes antérieurs. Les sondes spatiales permettent de mieux observer l’univers et d’en repousser, dans une certaine mesure, la profondeur du champ d’observation. De même (biologie), l'imagerie médicale (rayons X, puis scanner et RMN) a amélioré l'observation des pathologies, qui était auparavant principalement « clinique », ainsi que les procédés d’endoscopie et de traitements (qui possèdent progressivement un caractère moins invasif ou moins traumatisant). Ou encore (écologie), le baguage de la faune a permis de mieux en connaître la démographie ou les migrations ;

 

            (b) meilleure utilisation des méthodes existantes. Ainsi, l'existence de points aberrants (cf aberration) dans certaines statistiques fausse les analyses standards (calcul de moyennes ou régressions, par exemple). Or l'interprétation correcte de ce problème (mélange de lois) a permis de concevoir des tests de détection, utilisés simultanément avec des méthodes robustes (cf robustesse), pour pallier ces inconvénients ;

 

            (c) développement de méthodes nouvelles. Ces dernières sont d'ailleurs souvent produites par associations d'idées (concepts ou méthodes). Ainsi, l'analyse des séries temporelles non stationnaires (cf processus non stationnaire) a conduit à l'élaboration de notions (eg donnée intégrable, intégration, cointégration) aptes à traiter ces particularités, tout en utilisant des concepts et méthodes dérivés de l'analyse des séries stationnaires (cf processus stationnaire, stationnarité).

 

Ce sont donc les trois piliers précédents que la Statistique contribue à renforcer.

 

2. Ce qui précède justifie que la connaissance statistique soit plus poussée et aussi mieux répartie dans les différentes sphères de l'activité humaine.

 

            2.0. En effet, des limites importantes existent encore en matière de connaissance et de compréhension statistiques, tant au niveau de la formation initiale (enseignement) que de la formation ultérieure (formation professionnelle). Un effort, personnel aussi bien que public, visant à améliorer cette connaissance ne peut que dynamiser la recherche scientifique.

 

Or, en bénéficiant des effets attendus d’une telle « révolution », chaque pays pourrait connaître des progrès, économiques ou autres, aidant à combattre ses difficultés, contre laquelle les démarches positives actuelles semblent limitées. Il s’agit, en effet, de difficultés structurelles et récurrentes : physiques (séismes et tsunamis), biologiques (pandémies nouvelles), écologiques (dégradation environnementale massive et activité anthropique), sociologiques (surpopulation mondiale, disparités économiques intranationales et internationales, intégrismes).

 

Aujourd’hui, seule une accélération du progrès peut sérieusement aider à contourner ces difficultés. Il est donc urgent de ne pas attendre, notamment en raison (a) d’effets-retards (hystérésis) (ainsi, une formation statistique demande du temps), (b) d’effets en chaîne et (c) de l’existence d’irréversibilités nombreuses dans ce type de situations.

 

On rencontre aussi de nombreuses limites au niveau des mentalités, des préjugés répandus dans le « public ». Ainsi, on doit corriger des idées reçues fréquentes, telles que les suivantes :

 

            2.1. La Statistique est censée ne pouvoir traiter que des observations nombreuses. Cette opinion ignore qu’il existe des possibilités pour valoriser des données rares :

 

            (a) soit les lois mises en jeu lors de l'observation d’un phénomène sont connues. Connaître ces lois signifie complète connaissance du phénomène (cf nombre au hasard, simulation). Ceci est généralement la situation en calcul des probabilités, mais non pas en Statistique, puisque la loi gouvernante (celle qui est sous-jacente à un phénomène donné) est en général inconnue ;

 

            (b) soit une répétition, ou un renouvellement, du phénomène sont réalisables (expérimentation), ce qui permet d’ « atteindre » les lois intervenant dans le mécanisme de ces phénomènes (plans d’expérience, propriétés asymptotiques, grands nombres, limites centrales) ;

 

            (d) soit la vérification (test) d'hypothèses de stationnarité permet de mener une analyse à partir d'une seule observation (au lieu de plusieurs, en général) (cas de la trajectoire d’un processus) (cf monographie) ;

 

            (d) soit la théorie bayésienne est applicable : celle-ci, d'une certaine manière, pallie la « rareté » de l'information à l’aide d’une « croyance a priori » (elle-même pouvant résulter d'autres travaux similaires, antérieurs ou contemporains) ;

 

            2.2. La Statistique n'est concernée que par des situations expérimentales, par nature répétitives, et non par des situations de type « historique » (uniques, par nature). Cette idée procède d'une méconnaissance des possibilités offertes par la méthodologie statistique.

 

Il est sans doute vrai que l'expérimentation (plans d'expérience) constitue un mode d'obtention de données classique dans les sciences dites « expérimentales » (physique ou biologie). Mais il existe d'autres moyens d'investigation (sondages, relevés d'observation divers), assortis de méthodes d'analyse adaptées, pour répondre aux questions relevant de sciences dites « non expérimentales » (cf production statistique).

 

On peut observer que les procédés d’expérimentation interviennent de plus en plus dans des sciences non expérimentales, et inversement. Autrement dit, la confusion, encore faite (ou entretenue), entre science et expérimentation tend à s’estomper au profit d’une démarche scientifique plus générale et plus systématique, au sein de laquelle la Statistique a donné son style.

 

            2.3. La Statistique permet d'analyser des informations quantitatives (données numériques) mais non des données de nature « qualitative ». Cette croyance est démentie par une distinction, classique en Statistique, entre variable qualitative et variable quantitative (concepts de base du statisticien). Des notions connexes (codage-décodage, modèle qualitatif ou modèle mixte, etc) permettent d'ailleurs de passer d'un type de données à l'autre.

 

En outre, dans la mesure où une finalité de la science (donc, nécessairement, de la Statistique) est de répondre aux questions que l’Homme peut se poser, il paraît nécessaire d’introduire et de conclure un travail scientifique, généralement formalisé et rédigé en « jargon professionnel », à l’aide d’attendus ou d’explications intelligibles par l’Homme, c’est à dire par une personne n’ayant aucune connaissance particulière de la matière et de ses méthodes. Autrement dit, malgré la difficulté pédagogique qui se présente, il semble hautement souhaitable de parvenir à tenir un discours purement littéraire (donc habituellement de nature qualitative) lorsqu’une étude scientifique est présentée au mandant initial (cf contrat social supra).

 

            2.4. La Statistique est de la mathématique appliquée.

 

En fait, il s'agit d'une science dont la situation est très particulière et dont il convient de clarifier le statut.

 

2.4.1. D'une part, la Statistique constitue une branche des mathématiques (ou de la Mathématique) à part entière, puisqu'elle utilise les raisonnements hypothético-déductifs et les « outils » mathématiques fondamentaux (logique, théorie des ensembles, algèbre, analyse, etc). Elle ne constitue donc pas un savoir « appliqué ».

 

Par ailleurs, si le calcul des probabilités s’intéresse à une loi de probabilité connue (ou « théorique ») et en étudie les propriétés mathématiques (cf transformation des lois, processus, etc), la Statistique comporte un angle de vue différent (voire inverse). En effet, elle suppose, de façon très générale, que la « vraie » loi (en principe, inconnue) gouvernant un phénomène étudié appartient à une famille de lois potentielles : c’est l’observation du phénomène qui permet d’obtenir des informations relative à cette loi.

 

Le calcul des probabilité, aussi bien que la Statistique, enrichissent, en retour, les mathématiques : tous deux généralisent le « déterminisme » mathématique par plongement dans un contexte aléatoire : ainsi, une équation différentielle usuelle devient une équation différentielle stochastique, l’équation intégrale devient une équation intégrale stochastique, la géométrie usuelle devient la géométrie stochastique, etc. Le calcul des probabilités étudie les propriétés stochastiques des objets précédents. La Statistique en étudie les propriétés inférentielles : l’observation informe sur la loi de probabilité de ces objets aléatoires.

 

On peut illustrer quelques passages entre contexte « déterministe » (mathématique) et contexte « stochastique » (probabiliste) à l’aide d’exemples élémentaires.

 

La Statistique n'est donc pas plus « appliquée » que n'importe quelle autre branche des mathématiques : cet aspect est souvent ignoré du public, qui confond généralement cette science avec les faits chiffrés qu'elle contribue à construire (production statistique) ou à analyser (étude scientifique et diffusion de l'information) (cf statistique et statistiques).

 

La confusion provient aussi de l’association implicitement faite par le public entre « la » Statistique et « les » statistiques relatives à des domaines concrets (données météorologiques, évaluations démographiques, prix, etc). Cependant, les mathématiques aussi ont, très généralement, eu pour origine l’élucidation de problèmes concrets : ainsi en est-il de l’algèbre et des dénombrements (comptages de population, relevés d’impôt, pesages, etc), de la géométrie et de l’étude de figures dans l’espace (astronomie, formes et techniques architecturales, cartes et plans), etc. Ces deux savoirs, initialement provoqués par des besoins de résolution de problèmes concrets, se sont ensuite organisés (systématisation, formalisation, etc) pour constituer des « outils » de nature mathématique (au sens abstrait actuel).

 

2.4.2. D'autre part, la Statistique est un « pont » entre théorie scientifique et observation phénoménale.

 

Les méthodes utilisées dans certaines situations ne requièrent pas toujours d'instruments statistiques sophistiqués : estimation du coefficient de dilatation linéaire d'une barre métallique, ou choix d’un instrument de mesure (horloge, thermomètre) dans un magasin. Une approche statistique « inconsciente » permet donc de résoudre des problèmes courants (Mr JOURDAIN fait aussi de la Statistique !).

 

Souvent, même dans des contextes exigeant de la rigueur, il n’est n’est pas vraiment nécessaire de connaître le substrat statistique des méthodes utilisées dans diverses activités ou décisions. Ainsi :

 

            (a) un « praticien » utilise les résultats d'une analyse « biologique » (composants chimiques) ou physiologique (EEG, ECG, etc) issus de calculs statistiques (tables statistiques). Les « fourchettes » qui s'en déduisent servent généralement de repères et d'aides au diagnostic ou au pronostic : cependant, elles ne supposent pas nécessairement une connaissance des techniques statistiques mises en oeuvre pour élaborer ces tables ;

 

            (b) de même, un ingénieur peut utiliser des tables de résistance des matériaux (étirement ou traction, pression, flexion, torsion, etc) sans avoir connaissance du mode d’élaboration de ces tables. Ces tables résultent généralement d’expériences statistiquement contrôlées, dans lesquelles divers « facteurs » (types de matériaux, dimensions, volumes, masses, pressions, températures, etc) varient et influencent les capacités de résistance.

 

3. Les considérations précédentes, généralement peu connues du public, ont guidé la conception d'ensemble de ce dictionnaire. On raisonne à la fois en largeur et en profondeur.

 

3.1. Ce travail ne se limite pas à l’exposé de notions générales, comme c’est le cas des ouvrages de base. Au contraire, un large éventail des outils existant dans la panoplie du statisticien a été ouvert afin de couvrir une grande variété de situations concrètes : en effet, chaque situation peut être abordée de façon efficace à l'aide d'instruments figurant dans cette panoplie.

 

On peut souhaiter établir un jour un « mode d’emploi général » dans lequel chaque type de problème rencontré, une fois décrit et résumé à l’aide de « mots-clefs », se verrait associer un choix de démarches statistiques possibles (méthodes préconisées).

 

Pour initialiser un mouvement dans ce sens, on a ébauché une aide au traitement de problèmes statistiques. Cette aide, très modeste, devrait contribuer, dans certains cas, à faciliter le rassemblement des divers éléments (concepts, méthodes ou résultats) propres à traiter un problème scientifique donné. Elle gagnerait donc à être développée.

 

3.2. Par ailleurs, la maîtrise d'un nombre limité de notions de base (information, exhaustivité, liberté, invariance), jointe à quelques distinctions élémentaires (donnée et inconnue, théorique, empirique, paramètre et observation, observabilité et inobservabilité), permet d'aborder d'emblée une large gamme de questions fondamentales : décision et optimalité (cf optimisation), plan d'expérience, sondage, estimation, prévision, test d'hypothèses, classification, etc.

 

L'apport unificateur de la théorie de la décision statistique justifie la place centrale qu’elle occupe ici.

 

On peut, au passage, rendre hommage à un très grand statisticien, Ronald A. Fisher qui, pendant la première moitié du XXème siècle, a mis en évidence la plupart des concepts statistiques fondamentaux : liberté, ancillarité (cf statistique ancillaire), exhaustivité, invariance, vraisemblance, expérimentation rationnelle, « randomisation », théorie fiducielle, etc, largement exploités et développés depuis.

 

3.3. A l'inverse, un problème de taille était à résoudre : en effet, une compilation de ce genre ne peut raisonnablement prétendre traiter de toute la Statistique, déjà au seul niveau des théories, et encore moins à celui des applications qui sont extrêmement foisonnantes. S'il paraît utile d'approfondir différentes parties de la Statistique, on ne peut se perdre dans les labyrinthes de méthodes sophistiquées, ni incorporer des notions éphémères (eg créées pour les seuls besoins d'une démonstration).

 

Le contenu et l'agencement de ce site sont les résultantes de ces arbitrages, lesquels comportent toujours une part ... d'arbitraire.

 

4. Malgré la difficulté, on peut chercher à résumer l'ensemble des critères retenus pour circonscrire le champ à couvrir.

 

Une oeuvre de cette nature ne peut que constituer un compromis entre des objectifs ou des exigences multiples (cf avant-propos) et des nécessités pratiques de (dé)limitation. L'orientation générale étant d'élaborer une oeuvre à la fois scientifique et multidisciplinaire, sa conception a donc suivi les orientations suivantes.

 

4.1. D'abord, et ceci le différencie d'autres ouvrages, on a souhaité rassembler des définitions théoriques et rigoureuses des concepts et des méthodes statistiques sans, cependant, tomber dans l'abstraction pure. Ces définitions sont, autant que possible, données sous forme concise et suffisamment générale pour couvrir la plupart des situations rencontrées en pratique. Elles ne requièrent donc pas de connaissances, et surtout de développements, qui se situeraient au niveau de la recherche : ceci est un point de vue délibéré.

 

En effet, afin d'être accessible au plus grand nombre, la définition des notions, la description des méthodes ou l’explicitation des résultats ne sont pas toujours données dans leur plus grande généralité. La contrainte majeure est de ne pas définir, ou de décrire, à une endroit une notion ou une méthode utilisées ailleurs avec un niveau de généralité ou d'abstraction supérieur.

 

L’intégration d'un « environnement » mathématique décrivant les méthodes mathématiques de la Statistique peut constituer une aide utile : algèbre (notamment algèbre linéaire), analyse (topologie, théorie de la mesure et de l'intégration, optimisation, etc), géométrie élémentaire.

 

4.2. D'autre part, le texte proprement statistique (donc mathématique), dont le formalisme nécessaire n'est pas à justifier, est généralement assorti de commentaires littéraires dont le but est pédagogique. Le système des renvois (liens hypertextes) doit aider à trouver les notions cherchées ou leurs développements.

 

Ainsi, sans trop sacrifier aux exigences de rigueur, assorties d'un discours formalisé se suffisant à lui-même, des explications « littéraires » sont largement réparties dans le corps des articles.

 

Les articles purement mathématiques possèdent, par leur formalisme, l'avantage de fixer les notations utilisées, mais nécessitent en général peu d'explicitations.

 

4.3. Cette compilation est sous-tendue par un double effort de synthèse.

 

4.3.1. Une première synthèse existe d'abord au niveau de chaque article. On a cherché à faire le point des connaissances, au moins élémentaires, et de façon aussi concise que possible.

 

4.3.2. La deuxième synthèse est implicite. Elle se situe au niveau d'ensemble : on a cherché à présenter une vue, à la fois large et approfondie, des différents corps constitués de la Statistique.

 

Tous les résultats produits par la recherche Statistique (passée et actuelle) ne peuvent évidemment être reportés. Le lecteur peut, le cas échéant, compléter le contenu de certains articles en fonction de ses centres d'intérêt ou de ses nécessités : les articles en question peuvent alors jouer le rôle de point de départ pour la rédaction de nouvelles « fiches de travail ».

 

Ceci explique pourquoi nous ne sommes pas allés trop loin dans les développements. En effet :

 

            (a) d'une part les notions complexes sont généralement constituées par association de notions simples, donc plus accessibles. De plus, lorsqu'on se réfère à eux, les textes spécialisés définissent, si besoin, ces notions complexes. L’aide sommaire proposée pour le traitement de problèmes statistiques (cf infra § 3.1.) illustre ce phénomène d’agglutination ;

 

            (b) d'autre part, l'intelligibilité du site aurait été affaiblie s'il avait été conçu selon une structure d'ensemble trop détaillée. Dans cette optique, une structure linéaire est plus simple qu'une arborescence, et cette dernière est plus simple qu'une structure en réseau. On a donc dû limiter le système des renvois, car un tel système devient très vite combinatoire, donc de plus en plus difficile à gérer.

 

Afin d’assurer la plus grande pérennité possible, un tri a été tenté entre des apports supposés éphémères ou secondaires dans l'abondante littérature spécialisée contemporaine, et des apports qui, par leur pertinence ou leur originalité, sont susceptibles de développements futurs d'intérêt général ou d'utilité pratique reconnue. Ces choix ont aussi tenu compte de l'importance (relative) du rôle joué actuellement par la Statistique dans chaque domaine de connaissance. Ici aussi, une part d'arbitraire est inévitable.

 

Les articles ont ainsi, en général, une étendue allant de quelques lignes à quelques « pages ».

 

4.4. Ce travail comporte des articles contenant des synthèses résolument originales.

 

Un dictionnaire ne saurait être une oeuvre d'auteur. En effet, une compilation de ce type lui confère ipso facto une sorte d'indépendance ou d’« universalité », au moins dans son contenu : les matières traitées sont toutes du domaine public de la Statistique.

 

Néanmoins, l'effort de synthèse qu’il implique a conduit, dans plusieurs cas, à rédiger des présentations inédites et détaillées sur des thèmes qui sont souvent rapidement décrits, voire ignorés, dans les manuels. Ainsi en est-il des articles fondamentaux exposant :

 

            (a) les notions de domaine de connaissance, de phénomène, de système, de structure ;

 

            (b) des concepts relatifs à l’organisation du travail scientifique et statistique : observation, système statistique, production statistique, consommation statistique, situation statistique ;

 

            (b) des théories de base du calcul des probabilités et de la Statistique : théorie des processus, théorie des plans d'expérience, théorie des sondages ;

 

            (c) diverses notions importantes : centralité et dispersion (ou variabilité), conditionnement et régression (cf aussi modèle de régression), robustesse, forme, etc.

 

On a explicité le contenu « intuitif » des notions présentées et, le cas échéant, cherché à montrer comment elles sont naturellement apparues dans le but de combler divers besoins, concrets aussi bien que théoriques.

 

5. On doit aussi préciser ce qui ne figure pas, ou n'est qu'effleuré, dans ce dictionnaire.

 

5.1. En premier lieu, les notions mathématiques élémentaires (du niveau des lycées) ne sont pas, sauf exceptions, incorporées au texte. D'autres dictionnaires traitent directement ces sujets : ceux de A. WARUSFEL, de L. CHAMBADAL, ou encore de F. LE LIONNAIS et collaborateurs (Presses Universitaires de France, 1979). Divers sites Internet (communautaires ou universitaires) contiennent une matière importante portant sur ces sujets.

 

5.2. Les informations liées à des domaines tels que la théorie des indices de prix (nombres indices) ou la démographie sont résolument ignorées. Ces domaines, parfois présents dans les manuels de Statistique (généralement plus anciens), comportent un intérêt et des difficultés propres. Mais leur nature n'est pas spécifiquement statistique, au sens entendu ici, mais sociologique (démographique ou économique). Lorsqu'ils font référence à des lois spéciales (fonction de survie, lois de mortalité, etc), ou à des caractéristiques telles qu'indices, rapports, taux ou quotients, ces domaines comportent alors des aspects statistiques, mais il s’agit d’applications de la Statistique, même si ces domaines sont à l’origine de concepts premiers.

 

En matière de démographie, on peut se référer eg au Dictionnaire de démographie de R. PRESSAT (Presses Universitaires de France, 1979).

 

5.3. Pour des raisons voisines, on ne fait qu'effleurer le contrôle de réception (contrôle de qualité). Il s'agit d'un domaine d'applications spécialisées dont les techniques (carte de contrôle, etc) n'apportent guère à la Statistique mais, au contraire, lui doivent certaines solutions (test d'hypothèses, théorie séquentielle, etc). Il en va de même pour ce qu'il est convenu d'appeler la recherche opérationnelle.

 

Sur ces sujets, divers organismes, comme l'Association française de normalisation (A.F.NOR.) (http://www.afnor.org/), ont publié des documentations spécifiques. Cette matière relève aussi bien de la normalisation que de la règle de droit.

 

5.4. N'étant pas particulièrement orienté vers les applications mais plutôt vers la compréhension de la Statistique, ce travail ne contient pas de détails excessifs sur les questions suivantes :

 

            (a) imagerie et visualisation. Le rôle des représentations graphiques est très important en Statistique, notamment appliquée. De nombreuses techniques ont été développées à cette fin ; ces techniques ont été améliorées grâce à l'évolution des fonctionnalités de l’outils informatique. Plusieurs graphiques (à caractère « théorique ») ont été intégrés lorsqu'ils semblaient utiles pour la pédagogie d'un concept, d'une méthode ou d'un résultat. A défaut (formes des familles de densités, etc), les informations nécessaires à l'élaboration des graphiques sont, en général, explicitées de façon à en faciliter le tracé ;

 

            (b) tables statistiques. Cette limitation résulte de considérations de volume évidentes. Certaines revues spécialisées contiennent des programmes informatiques, parfois même utilisables sous forme de codes sources (programmes associés à des méthodes publiées : calculs de nombres au hasard, tabulations de lois particulières, etc) ;

 

Les tables des lois de probabilité et de leurs caractéristiques empiriques figurent eg dans le « Handbook of mathematical functions, with formulas, graphs and mathematical tables » (notamment au Chapitre 26), par Milton ABRAMOVITZ et Irene A. STEGUN, Editors, décembre 1972 (Dover Publications, Inc., New York).

 

Les familles de lois de probabilité utilisées en Statistique sont très variées. Cependant, on pourra noter que les propriétés asymptotiques énoncées dans ce dictionnaire permettent souvent de se ramener à des tables usuelles, notamment à celles des lois de probabilité les plus simples (cf approximation des lois).

 

            (c) les méthodes de calcul numérique mises en oeuvre en Statistique. Elles ont leurs difficultés propres, mais les logiciels informatiques actuels utilisent des procédures de calcul performantes, dont ils décrivent généralement les principales propriétés numériques (précision, nombre d'itérations, etc). On peut cependant observer la persistance d’une course-poursuite entre l’accroissement de la puissance de calcul et l’accroissement de consommation dûe à des besoins de plus en plus sophistiqués. L’augmentation de puissance permet, en effet, d’atteindre et de traiter des situations antérieurement inaccessibles (en matière de nombres au hasard, de sondages, de simulations, etc).

 

5.5. Enfin, les vieilles tournures (eg « résumé exhaustif ») ainsi que les jargons et anglicismes qui dénaturent la langue française sans nécessairement rendre l'exposé plus clair.

 

Certains anglicismes notoires ont parfois été conservés et explicités lorsqu'ils ne comportent pas d'équivalent français : par exemple, « randomisation », « studentisation », « winsorisation ». Pour limiter cet inconvénient, notamment lorsqu'une expression est attachée à des noms d'auteurs, on l'associe simplement à ces derniers. Ainsi :

 

* « studentisation » peut s'exprimer par « transformation de STUDENT » ;

* « winsorisation » peut s'exprimer par « transformation de WINSOR » ;

* « bootstrap » peut s'exprimer par « méthode de EFRON » ;

* « Jack-knife » (ou « jacknife ») devient « méthode de QUENOUILLE » (ou de QUENOUILLE-TUKEY).

 

5.6. Un dictionnaire est un instrument de travail, et non pas une encyclopédie de culture générale.

 

Les aspects biographiques ou historiques n'y figurent donc pas sauf, implicitement, à travers des noms d'auteurs, lorsque ceux-ci sont restés attachés à un concept important, à une méthode de base ou à un résultat fondamental. Aucune recherche de paternité n'a été tentée : c’est l'usage qui a globalement prévalu. Il arrive souvent que plusieurs auteurs soient à l'origine d'une même notion, ou aient contribué de façon significative à l'extension, à la généralisation ou à l'étude approfondie des propriétés relatives à cette notion : dans ces cas, leurs noms apparaissent  simplement et systématiquement dans l'ordre alphabétique. Ainsi, l'inégalité dite « de FRÉCHET-DARMOIS » en France et « de CRAMER - RAO » dans les pays anglo-saxons, a été appelée « inégalité de CRAMER-DARMOIS-FRÉCHET-RAO ».

 

5.7. Des raisons allant dans le même sens ont aussi entraîné l'exclusion de toute référence bibliographique. Des allusions sont possibles : elles sont implicites dans l'index des auteurs, à travers des dates - dates biologiques (naissance, décès) et dates fonctionnelles (principales publications) des auteurs - ou encore à travers leurs « domaines d'intervention » (principaux types de travaux, classifiés par thèmes selon la classification thématique générale).

 

6. Il existe actuellement (2015) un certain nombre de documents appelés dictionnaire de Statistique ou encyclopédie de Statistique. Il se présentaient traditionnellement sous forme d’ouvrages mais, progressivement, des sites Internet proposent en ligne des contenus équivalents. Ainsi :

 

6.1. Ouvrages en langue française :

 

* Dictionnaire de Statistique de E. MORICE (Editions DUNOD, 1968) ;

 

* Glossaire systématique quadrilingue (anglais-français-espagnol-russe) de la terminologie des méthodes statistiques, élaboré par Isaac PAENSON et ses collaborateurs (1970) et publié sous l'égide de l'ONU ;

 

* Recueil de normes de la Statistique (deuxième édition, 1978), édité par l'AFNOR.

 

6.2. Ouvrages en langue anglaise

 

Sans être exhaustive, la liste ci-dessous peut se révéler utile :

 

* Dictionary of statistical terms (dictionnaire de terminologie statistique) de M.G. KENDALL et W.R. BUCKLAND (cinquième édition par F.H.C. MARRIOTT, 1990 ; sixième édition par Y. DODGE, 2003). Cet ouvrage est publié depuis de nombreuses années pour le compte de l'Institut International de Statistique (IIS) ;

 

* International encyclopaedia of Statistics (Encyclopédie internationale de la Statistique), éditée par W. KRUSKAL (1978) ;

 

* Encyclopaedia of statistical sciences (Encyclopédie des sciences statistiques) (9 tomes), éditée par Samuel KOTZ et Norman L. JOHNSON, avec Campbell B. Read (1981 - 1989), chez Wiley Interscience ;

 

* Concise statistical vocabulary : english - french - chinese (précis de vocabulaire statistique anglais - français - chinois), par Véronique Alexandre et Jean Alain Monfort, sous la direction de Pascal Mazodier, publié par le State statistical bureau (SSB), Beijing, 1998.

 

6.3. Sur Internet

 

La liste ci-après ne prétend pas, non plus, à l’exhaustivité :

 

* sites universitaires ou de grandes écoles (accès à des pages de statistique : notes de cours, etc), eg :

 

** Lyon 2 (http://eric.univ-lyon2.fr/~ricco/cours/cours/Probabilites_et_Statistique.pdf) ;

** INSA de Lyon (http://rfv.insa-lyon.fr/~jolion/STAT/poly.html) ;

** Paris 5 Descartes (http://w3.mi.parisdescartes.fr/smel/cours/sd/sd.html) ;

** CNAM de Montpellier (http://www.agro-montpellier.fr/cnam-lr/statnet/cours.htm) ;

 

* Wikipedia, site à vocation encyclopédique, contient :

 

** des pages de probabilités (http://fr.wikipedia.org/wiki/Probabilit%C3%A9) ;

** des pages de statistique (http://fr.wikipedia.org/wiki/Statistiques).

 

L'apport des supports d’information précédents en matière de terminologie est incontestable : ils contribuent progressivement à établir une certaine « normalisation » du vocabulaire statistique, parfois encore « flottant ». Cependant, on peut parfois regretter le caractère « scolaire » ou « partiel » de certaines présentations, qui risquent de réduire la Statistique à des fonctions seulement calculatoires ou procédurales (cf in limine).

 

Les objectifs recherchés dans ces textes ne coïncident pas nécessairement avec ceux du présent dictionnaire. Les encyclopédies ont souvent aussi l'inconvénient de ne pas être de mise en pratique immédiate (inclusion de biographies, etc) ou d'inclure (notamment lorsque divers contributeurs interviennent) des redites ou des doubles emplois (eg références bibliographiques redondantes), ainsi que des systèmes de notation différents qui rendent moins commodes les transitions d'un article à un autre.

 

7. Un dictionnaire peut a priori comporter plusieurs organisations possibles.

 

7.1. Son architecture peut s’inspirer des idées directrices  suivantes :

 

* au sens « étroit », une structure sans liens comporte des articles présentés de façon indépendante les uns des autres, alors même que des liens (logiques ou autres) existent ;

 

* au sens le plus large, une structure en réseau représente la forme la plus générale, et aussi la plus neutre, d’organisation. Elle consiste à relier toutes les notions statistiques, même, le cas échéant, lorsque certains liens n’ont guère de pertinence (réseau global « en aveugle »).

 

Cette deuxième structure manque évidemment de pertinence, puisque seul un sous-graphe du réseau correspond à des relations intéressantes. Mais elle est évoquée ici pour situer la question dans un contexte global. De plus, compte tenu de l’intérêt des association d'idées, cette structure peut préfigurer des liens à venir entre notions statistiques actuellement non reliées.

 

* entre les deux extrêmes précédents, on peut concevoir des situations intermédiaires. Ainsi :

 

            ** une structure de type linéaire présente, indépendamment les unes à la suite des autres, des notions statistiques sans préciser de façon détaillée les liens entre elles. Ainsi, chaque article renvoie à un seul autre. Les inconvénients de cette structure sont évidents ;

 

            ** une structure de type emboîté, propice à une démarche thématique, inclut, sous un thème donné, l'ensemble des notions se rapportant à ce thème. Son défaut vient des imputations multiples, un même article relevant de plusieurs thèmes ;

 

7.2. Finalement, une solution intermédiaire, de type mixte, a été suivie. Elle adopte une structure en réseau « raisonnée » : on y trouve des liens privilégiés (thèmes) lorsque les articles correspondent à une même « branche de la Statistique », ou une absence locale de lien lorsque les articles se suffisent à eux-mêmes (outils mathématiques de la Statistique, ou articles banalisés en raison de leur polyvalence). Ainsi, ce dictionnaire incorpore :

 

* des articles généraux relatifs à des théories ou à des méthodes, lesquels présentent, de façon succincte mais structurée, la plupart des notions (concepts ou expressions conceptuelles, méthodes ou procédures, principaux résultats) qui se rapportent aux articles en question ;

 

* des articles plus spécialisés, ou à caractère technique, conçus en vue de préciser certaines notions (concepts ou méthodes), les principales propriétés qui leur sont attachées (ie pour lesquelles ces notions ont été conçues) ainsi que les notations en usage.

 

Les inconvénients possibles de cette architecture sont cependant limités grâce à l'usage des liens hypertextes, qui facilite la navigation interne. Le lecteur a d'emblée une vue générale qui lui permet de situer, grâce au système des renvois, les principaux corrélats associés à ces articles ou à ces notions. Ces corrélats permettent, si besoin, d'approfondir les notions étudiées.

 

8. Aucune démonstration (au sens mathématique du terme) ne peut tenir de place dans un dictionnaire. En inclure aurait augmenté sensiblement sa taille et réduit sa lisibilité. De plus, celà reviendrait à un mélange de genres : dictionnaire vs manuel. En contrepartie, on a dû observer un soin scrupuleux dans la vérification des formules, afin de limiter les risques d'erreurs (symboles utilisés, formules reproduites).

 

9. Un mot doit être dit sur l'important problème du symbolisme. Etant donné la variété des situations décrites, et malgré le lien unificateur de la théorie de la décision (statistique), il est impossible d'adopter une notation uniforme de bout en bout. Sauf à adopter un système de notations complexe, voire compliqué (augmentation du nombre de symboles, augmentation des artéfacts : indices, exposants, groupages, etc), des incohérence s’introduisent rapidement (cf infra, § 9.2.).

 

9.1. Pour les notations plus ou moins consacrées par l'usage, ou notations « standards », les symboles usuels sont conservés dans l'ensemble des articles, quitte à en indiquer des « variantes » dans d'autres articles. Plusieurs thèmes - pour ne citer que les principaux abordés en calcul des probabilités et en Statistique - se prêtent assez bien au maintien d'un symbolisme homogène : théorie des processus, théorie de la décision, théorie de l'estimation, théorie des tests, théorie des sondages, théorie des plans d'expérience ;

 

9.2. Dans d'autres domaines, les notations ont été rendues aussi uniformes que possible.

 

Mais cet exercice rencontre vite des limites (incohérences formelles). Ainsi :

 

            (a) lorsqu'un indice i varie, par valeurs entières, de 1 à n dans une définition, et que celle-ci renvoie à un article dans lequel on utilise le symbole n comme indice variant par valeurs entières de 1 à N, le lecteur devra effectuer les transcriptions ad hoc, soit mentalement dans les cas simples, soit par écrit, à l'aide d'une table de passage entre les deux systèmes de notations, dans des cas plus complexes. C’est d’ailleurs cette démarche qui a été suivie ici pour élaborer des articles de synthèse résultant de plusieurs écrits (articles de revues, manuels) ;

 

            (b) lorsque T désigne l'ensemble des temps d'un processus ou d'une série temporelle, il arrive que cet ensemble soit écrit {1 ,..., T} (cas discret) ou [0,T] (cas continu) : autrement dit, on pourra noter à l’aide du même symbole l'ensemble des temps et sa « borne » supérieure ;

 

            (c) de même, la notation adoptée pour un processus {(W, T, P), (X, B), (Xt)t Î T} conduit à utiliser la lettre w pour désigner un élément de W (ou une trajectoire particulière) ; or, cette lettre peut aussi désigner (eg en analyse spectrale) une fréquence. Dans de tels cas, cependant, le contexte permet de lever la difficulté.

 

Ce type d'inconvénient, que nous avons essayé de réduire, semble compensé par le fait qu'une notion est ainsi rendue autonome, en termes de notations, et qu'elle peut donc être utilisée dans des contextes différents (ceci est notamment le cas des articles banalisés, relatifs aux « méthodes mathématiques de la Statistique ») : l'inconvénient de la « traduction » est balancé par la « polyvalence notationnelle » des définitions.

 

Finalement, la plupart des notations adoptées, parmi les plus répandues, permet de couvrir une large gamme de situations, telles que celles exposées ici. Le lecteur prévenu ne devrait guère rencontrer d'ambiguïté qu'il ne sache résoudre aisément. L'index des principales notations sert aussi de guide de réflexion.

 

10. D'un point de vue pratique, l'utilisation du dictionnaire peut s'effectuer comme suit.

 

            10.1. Des index analytiques renvoient aux articles, à raison d'un index par lettre de l'alphabet (avec regroupement des lettres « rares »). On peut accéder à la plupart des notions par le biais de ces index et de leurs liens hypertextes ;

 

            10.2. Un index des principales notations ;

 

            10.3. Un index des noms d'auteurs (avec imputations thématiques et datations) ;

 

            10.4. Une classification thématique générale, élaborée à partir des principales classifications existantes :

 

* celle de l'American Statistical Association ;

* celle de l'Institut International de Statistique (Statistical theory and Method abstracts, vol. 31, n° 4, 1990) ;

* celle de la revue « Communications in Statistics, Theory and Methods » (Ed. in chief D.B. OWEN, chez Marcel DEKKER, Inc.).

 

*

*             *

*

 

Nées, au départ, de diverses notes de lecture accumulées par l'auteur depuis le début des années 1980, le matériel ainsi rassemblé a été organisé en cherchant à faire preuve à la fois d'un esprit de système (pour les questions de synthèse et de normalisation), d'un esprit de pertinence (pour les choix effectués) et d’un esprit d’organisation (pour la présentation adoptée). Diverses personnes (collègues, étudiants, professionnels divers) intéressées par cette démarche, ont aidé à améliorer cette organisation.

 

Toutes suggestions susceptibles d’augmenter encore la qualité de ce site seront aussi les bienvenues.

 

Saint Georges de Monclar

1980-2014

 

® n ¬