Recherche et statistique sur la petite entreprise

Project sur les entreprises en croissance : principales constations

Annexe A

Les bases de données longitudinales de Statistique Canada sur les entreprises, la mesure de l'emploi et la faisabilité des tabulations–: Renseignements de base et discussion

Élaboration de données longitudinales sur les entreprises

Statistique Canada est engagé à élaborer des bases de données longitudinales des entreprises depuis 1972. Un tel effort combine l'information de son Registre des entreprises (qui, en soi, est un cadre d'évolution et d'amélioration considérable sur les entreprises employeuses au Canada – et, depuis, 1998, sur les entreprises non employeuses) avec les données sur la liste de paie en provenance de l'Agence des douanes et du revenu Canada (ADRC). L'intention initiale était de mesurer le roulement de l'emploi – c'est-à-dire la mesure dans laquelle de nouveaux emplois sont créés dans des entreprises nouvelles identifiées et en croissance et perdus dans les entreprises qui ne sont plus identifiées et en déclin.Note 1 Le nom de l'initiative, Programme d'analyse longitudinale de l'emploi, est devenu le nom du fichier, le PALE. Le produit Variations de l'emploi de Statistique Canada – une comparaison paires à paires, et d'une année à l'autre, des entreprises continues, entrantes et sortantes et de leur emploi associé – est un sous-produit du PALE. Le fichier englobe l'univers des entreprises employeuses au Canada, c'est-à-dire toutes les entités qui maintiennent une liste de paie et présentent de l'information à l'ADRC.

Le fichier utilise les données au niveau des entreprises obtenues par les dossiers fiscaux de Revenu Canada, qui ne correspondent pas bien aux données au niveau des établissements qui sont fréquemment utilisées dans les enquêtes de Statistique Canada. L'établissement, bien qu'il se prête mieux à la classification industrielle car il comprend une série plus homogène d'activités, n'a aucun équivalent dans les données fiscales de Revenu Canada. Les entreprises peuvent couvrir un ou plusieurs établissements et inclure des employeurs privés et publics. Un suivi attentif de l'information sur l'emploi tant au niveau des entreprises qu'au niveau des établissements permet de déclarer des données sur les entreprises, identifiées au niveau industriel du code CTI à trois chiffres, par province. Toute l'analyse dans le présent projet est au niveau des entreprises. (Voir ci-dessous pour plus de renseignements sur le concept d'entreprise et les limites de divulgation des données.)

Au moment de créer le fichier, des efforts considérables sont déployés pour identifier l'exploitation continue réelle ou, réciproquement, la fausse apparition ou la fausse disparition des établissements, des sociétés et des entreprises. Les essais ont démontré qu'une recherche informatisée de la continuité dans l'emploi en faisant concorder les numéros d'assurance sociale est un outil très efficace. Dans une deuxième ronde, des exercices plus coûteux de jumelage de noms rehaussent l'exactitude de l'attribution des identificateurs longitudinaux.

La version 1983-2000 du fichier est récemment devenue disponible; cette version reflète la situation d'affaires actuelle et corrige les erreurs antérieures. Le PALE a été relié avec succès au fichier d'information sur les impôts des sociétés de Statistique Canada. On prévoit, au printemps prochain, une mise à jour de ce fichier relié pour couvrir la période de 1983-2001.

Mesure de l'emploi

La mesure de l'emploi dans le PALE est obtenue en divisant la liste de paie d'une entreprise par le chiffre le plus approprié des gains annuels moyens disponibles dans l'Enquête sur l'emploi, la rémunération et les heures de travail (EERH; ses données sur les gains sont, pour chaque province, spécifiques à l'industrie et à la catégorie de tailleNote 2). La mesure qui en résulte est ce qu'on appelle une unité de travail moyenne ou UTM. Les UTM mesurent le nombre de personnes, en moyenne, qui ont travaillé pour une entreprise au cours de l'année.

Une version élargie du PALE contient des données du Fichier des petites régions (FPR), ce qui ajoute plus de détails à la dimension géographique. Mais le PALE/FPR offre également une autre mesure de l'emploi : l'unité de travail individuelle ou l'UTI. Contrairement à l'UTM, une UTI n'exige pas un salaire moyen industriel pour qu'on puisse la dériver. La mesure tient compte plutôt du nombre de feuillets T4 présentés par les entreprises. Dans le cas des récipiendaires du feuillet T4 qui ont travaillé pour plus d'un employeur, leur « unité » est divisée proportionnellement à leurs salaires. Ainsi, l'UTI est une mesure du nombre de personnes qui ont travaillé pour un employeur au cours d'une année. Dans le cadre du présent projet, on disposait de la version 1983-1999 du PALE/FPR.

Ni l'UTM ni l'UTI ne tiennent compte du travail à temps partiel ou du travail saisonnier.Note 3 Toutefois, sous réserve qu'une entreprise se conforme à sa moyenne industrielle, l'UTM mesurera avec exactitude ce qu'elle a pour objectif de mesurer, même si le travail est à temps partiel ou saisonnier.Note 4 Le quantum total des UTI dans l'économie (15,1 millions en 1999) est donc supérieur au quantum total des UTM (12,8 millions).Note 5 En autant qu'on reconnaisse ce qui est mesuré, l'une ou l'autre des deux mesures conviendrait au chapitre de sa capacité de tenir compte du travail autre que le travail à temps plein. Un problème se dégage dans la mesure où les tendances du travail à temps partiel et saisonnier ont changé au cours de la période visée – une considération qui nécessite une étude ultérieure.

Dans le cadre de la présente étude, nous avons choisi d'utiliser les UTI pour mesurer l'emploi, compte tenu du fait que les entreprises en croissance peuvent s'écarter considérablement des moyennes de l'industrie – au chapitre de leur rémunération ou en ce qui concerne l'emploi de travailleurs à temps partiel. De plus, il y a lieu de croire que le modèle de croissance de leurs salaires est différent. L'utilisation des UTI permet de calculer des taux de salaire moyens spécifiques aux entreprises, en plus de permettre des comparaisons des taux de salaire moyens entre les entreprises et à travers les groupes de croissance. Dans l'une ou l'autre de ces conditions, la mesure de l'UTM serait biaisée. Comme on l'a mentionné dans le texte principal, les résultats de cette phase du projet indiquent que les entreprises en croissance commencent, en effet, par des salaires moins élevés pour ensuite les augmenter plus rapidement.

Enfin, il faut garder à l'esprit que ni l'UTM ni l'UTI ne tiennent compte des propriétaires-exploitants qui ne figurent pas sur leur propre liste de paie. À ce titre, la taille globale du secteur des PME est sous-évaluée. Dans le même ordre d'idées, la création d'emplois mesurée par le nombre des naissances d'entreprises exclut les personnes qui ne figurent pas sur leur liste de paie. Plus une entreprise est petite, plus il y a de risques que le propriétaire-exploitant ne soit pas pris en considération ici. La participation au marché du travail sous forme d'un travail contractuel n'est pas non plus prise en considération, à moins que le travailleur se trouve dans la liste de paie d'une entité quelconque.

Le concept d'entreprise

Dans le cadre de ce projet sur les entreprises en croissance, un autre choix important a été la décision de tabuler les données au niveau des entreprises. Il s'agit également du niveau auquel sont publiées les données de l'EERH selon la taille d'entreprise.Note 6 Bien que les données au niveau des établissements conviennent le mieux aux analyses axées sur les emplacements, nous avons jugé que, pour dégager les modèles de croissance, la prise de décision (et, par ricochet, l'analyse la plus utile) se trouverait au niveau des entreprises.

Le choix de l'entreprise en tant que niveau de l'analyse a des implications importantes pour la dimension géographique des tabulations. Dans les tabulations à l'échelle du Canada, les établissements sont agrégés en entreprises au niveau national. Dans les tabulations par province, l'exploitation d'une entreprise dans plusieurs provinces est comptée dans chaque province où elle apparaît – une « entreprise » provinciale est donc créée. Par conséquent, il y a 199 000 entreprises en exploitation continue dans les tabulations nationales, par rapport à 203 600 dans la somme de toutes les tabulations provinciales. Dans le même ordre d'idées, la classification des entreprises selon les types d'entreprises en croissance, leur apparition et leur disparition est basée sur ces « entreprises provinciales ». Dans la même veine, les données sous-provinciales tiendraient compte des « entreprises » au niveau des régions métropolitaines de recensement (RMR) – la représentation d'une entreprise probablement nationale dans une RMR donnée. Les tabulations régionales pour ce projet sont strictement des sous-totaux des tabulations provinciales.

Limites de divulgation

Les tabulations détaillées par province, et même les tabulations croisées nationales selon l'industrie et la taille, font d'emblée face à des contraintes en matière de confidentialité. Par contre, les tabulations par région (Atlantique, Québec, Ontario, Prairies, Colombie-Britannique) sont plus faisables. Dans les tabulations à la fois nationales et régionales, sept catégories de tailleNote 7 sont distinguées et 70 industries à deux chiffres.

L'agrégation à huit ou dix sous-groupes d'industries peut permettre une plus grande divulgation, mais un examen préliminaire suggère des renseignements moins utiles et moins pertinents à l'analyse de la croissance à un tel niveau élevé d'agrégation. Cette question sera davantage examinée. La désagrégation au niveau à trois chiffres aboutirait rapidement à des problèmes de divulgation.

Pour obtenir une divulgation accrue, il est également possible de diminuer la barre pour les entreprises à hyper croissance. Ainsi, la compression des classifications de taille – toutes à l'extrémité élevée – fournirait peu de protection. À ce titre, une grande quantité de suppressions (dans les tabulations croisées par industrie) entraînent des agrégations de « 20+ » et « 50+ »; il n'y a guère de problèmes de divulgation pour les micro-entreprises (moins de 5 employés).


Note 1 John Baldwin, Richard Dupuy et William Penner, « Development of Longitudinal Panel Data from Business Registers: Canadian Experience », Statistique Canada, document n° 49 de la Direction des études analytiques documents de recherche, 1992, p. 3. Voir aussi Cat. N°. 18-501E (1988).

Note 2 Voici les catégories de taille pour calculer l'UTM : moins de 19, 20 à 49, 50 à 199, et plus de 200.

Note 3 En particulier, selon une croyance très répandue, les UTM représentent un équivalent à temps plein. Or, tel n'est généralement pas le cas. Supposons qu'une entreprise paie un travailleur 50 $ pour une semaine de dix heures et un autre travailleur 150 $ pour une semaine de 40 heures, pour une paie totale de 200 $. Supposons que le salaire moyen pertinent de l'industrie est de 100 $/semaine. La mesure de l'UTM qui en résulte est 2, alors que l'équivalent à temps plein est 1¼.

Note 4 Pour un exemple extrême, supposons qu'une entreprise compte 12 employés au cours de l'année, un employé pour chaque mois. Dans l'hypothèse que les autres entreprises dans l'industrie en font de même en moyenne et paient le même salaire, l'UTM serait de 1 – en moyenne, une personne a été employée. En omettant les employeurs multiples, l'UTI serait de 12 – un total de 12 personnes ont été employées.

Note 5 Le grand total de l'emploi, d'après l'Enquête sur la population active pour cette année se chiffrait à 14,5 millions. D'après l'Enquête sur l'emploi, la rémunération et les heures de travail (qui exclut l'agriculture et certaines autres industries), ce chiffre était de 11,6 millions.

Note 6 Les données sur les salariés inscrits sur les listes de paie, selon la catégorie de taille, sont régulièrement publiées dans le Bulletin trimestriel de la petite entreprise.

Note 7 Les catégories de taille étaient les suivantes : moins de 5 UTI, 5 à 19, 20 à 49, 50 à 99, 100 à 199, 200 à 499, et plus de 500.