Description de produit : données bibliographiques et textes complets sur les brevets

De : Office de la propriété intellectuelle du Canada

Format de fichier

Les données sont fournies en format XML et des fichiers XML individuels sont créés pour chaque brevet. La structure de fichiers XML est régie par la norme ST.36 sur les données sur les brevets de l'Organisation mondiale de la propriété intellectuelle (OMPI).

Contenu des fiches et des données

Les fichiers sur les demandes de brevets et sur les brevets octroyés sont inclus. Les données sur les brevets sont mises à la disponibilité du public après une période de confidentialité pouvant aller jusqu'à 18 mois après la première date de dépôt de la demande. Par conséquent, les fichiers de brevets comprennent soit une demande de brevet, soit un brevet ayant déjà été émis ou délivré.

Chaque fichier XML comprend les types de renseignements suivants sur le brevet délivré ou la demande de brevet :

Calendrier de production : hebdomadaire et annuelle

Production hebdomadaire

Toutes les semaines, des fichiers XML sont produits pour toutes les nouvelles demandes de brevets et les brevets nouvellement délivrés, ainsi que pour les demandes de brevets et les brevets octroyés qui ont été mis à jour. Ces collections de fichiers nouveaux et mis à jour sont disponibles pour l'année civile en cours. On retrouve donc 52 collections hebdomadaires dont la taille varie entre 50 Mo et 120 Mo, selon le volume d'activité.

En vertu de la convention d'appellation en vigueur, le nom des fichiers XML doit contenir le numéro du brevet et la date d'extraction. Outre les fichiers XML, un fichier « Log » et un fichier « OpStat » sont produits pour les nouveaux brevets et les brevets qui sont mis à jour. Le fichier « Log » renferme une liste de tous les brevets extraits et le fichier « OpStat » renferme des statistiques relatives au processus d'extraction.

Production annuelle

Tous les ans, une collection complète et à jour de fichiers XML renfermant des données bibliographiques et les textes complets sur les brevets est produite. Ces collections annuelles englobent tous les brevets datant de 1869 à la plus récente année civile et sont classées par année en fonction de la date de délivrance des brevets ou de la date de mise à jour du fichier dans le cas des demandes.

En date de 2017, la collection de données actualisées sur les brevets comprenait 236 fichiers totalisant approximativement 28 Go. En vertu de la convention d'appellation en vigueur, le nom des fichiers XML doit contenir le numéro du brevet et la date d'extraction.

Date de modification :