Depuis la création du Système harmonisé de désignation et de codification des marchandises (SH, ou HS en anglais) en janvier 1988 et sa mise en œuvre à l’échelle mondiale au cours des années qui ont suivi (par exemple, aux États-Unis, le 1er janvier 1989), la classification des produits (c’est-à-dire l’association de chaque produit tangible à un code SH spécifique) fait partie intégrante du système douanier international. Utilisés sur les déclarations d’importation (et d’exportation), les codes SH identifient les droits applicables aux différents types de marchandises, sont liés aux statistiques, offrent aux régulateurs la possibilité de lier des droits antidumping (ADD) et des droits compensateurs (CVD) aux produits, établissent la manière d’appliquer un traitement préférentiel et peuvent régir les exigences en matière de documents et de licences. La liste est donc conséquente – et une classification adéquate du code SH constitue un élément d’information important, d’autant plus qu’une classification incorrecte peut entraîner des pénalités et des retards à l’importation.
Aux États-Unis, avec un éventail d’environ 16 000 codes SH, une base de données des décisions douanières pour les seules classifications américaines (CROSS) comptant 206 000 références, des modifications constantes des droits de douane et une révision quinquennale d’envergure initiée par l’Organisation mondiale des douanes (à nous 2022 !), il n’y a rien d’étonnant à ce que la classification figure en permanence sur la liste des préoccupations exigeant une attention constante de la part des professionnels de la conformité des échanges.
Pour couronner le tout, en dépit de l’harmonisation internationale à six chiffres, les différents pays sont autorisés à opérer une différentiation locale à « n » chiffres (pour un total habituel de huit ou dix) et ils ne se privent pas de le faire. Ainsi, les États-Unis et l’Union européenne utilisent tous deux des codes SH à dix chiffres, mais la plupart ne correspondent pas et ne représentent pas les mêmes produits. Et dans la mesure où les déclarations à l’import sont déposées localement, pour chaque pays importateur, un code SH différent doit être défini et maintenu pour tout produit expédié vers ce pays. Le calcul est simple : un catalogue de 50 000 pièces expédiées vers 50 pays différents représente un total de 2,5 millions de références. On ne peut donc pas vraiment se contenter de noter sa liste au dos d’une enveloppe – à moins qu’il ne s'agisse d'une très, très grosse enveloppe, avec des gommes et des crayons gratuits.
Les besoins en matière de classification sont extrêmement divers – qu’il s’agisse d’envoyer deux t-shirts en coton vendus en ligne et nécessitant un code SH pour un calcul rapide du coût total frais de port inclus, des matières premières ou des produits semi-finis à des industriels, ou encore un unique moteur d’usine à 10 millions de dollars. Il n’est donc pas étonnant que toute solution ou tout consultant GTM (Global Trade Management – Gestion du commerce international) digne de ce nom se fasse un plaisir d’aider les entreprises qui ont un besoin vital de ces classifications. Et il n’est pas non plus étonnant que, depuis le début des années 2000, de nombreux éditeurs de logiciels tentent de résoudre le mystère de l’auto-classification.
La diversité des motivations initiales de la classification implique une diversité des critères de réussite. Pour un site de vente en ligne, un outil d’autoclassification peut résoudre de nombreux problèmes (par exemple des retours rapides, la classification immédiate d’un volume important d’articles), mais il peut s’avérer difficile d’obtenir un bon niveau de précision. Or, les importateurs ne peuvent se permettre un manque de précision lorsque, par exemple, la classification détermine si l’import est soumis à des droits antidumping, implique de fortes contraintes de licences ou est soumis à des quotas. Fondamentalement, la classification (automatique) est une autoroute et, en fonction de leurs besoins spécifiques, les entreprises peuvent emprunter différentes voies.
Un projet de classification (automatique) réussi comporte trois éléments clés – au-delà du fait, bien évidemment qu’un niveau d’expertise raisonnable en matière de classification peut s’avérer utile pour classifier ou construire un outil.
Premièrement, la qualité de la description des produits. Le principe informatique du GIGO (Garbage in, garbage out – déchet en entrée, déchet en sortie) s’applique également à la classification. De mauvaises descriptions, un manque de détails sur les produits ou même des spécifications incorrectes conduiront probablement à un code SH incorrect, avec toutes les conséquences que cela implique. Pour des descriptions de bonne qualité, les responsables produits ou les développeurs peuvent s’impliquer en fournissant les informations techniques nécessaires, car certaines décisions de classification sont prises en fonction de ces éléments.
Deuxièmement, la logique de classification. Que la classification soit effectuée par une personne ou un outil, la logique de classification ne doit en aucun cas manquer de… logique. Les implications sont nombreuses : des règles qui déterminent de classer un vêtement unisexe comme un textile pour femme ou pour homme (le traitement en l’espèce est différent aux États-Unis et dans l’UE) ; une nomenclature basée sur des règles et facilitant une classification adéquate grâce à une matrice de décision ; la possibilité d’ignorer des informations non pertinentes pour la classification (par exemple la couleur) ; ou la possibilité d’observer des caractéristiques qui peuvent être nécessaires dans un cas mais pas dans un autre (par exemple le poids), à l’inclusion de la composition des marchandises, qui est généralement très importante. La logique doit également intégrer une forme de « recherche intelligente », ou de recherche parmi différentes références permettant de générer des résultats : synonymes, langage naturel, jargon industriel, voire des images. La logique de classification doit également intégrer l’intelligence artificielle (IA) et l’apprentissage automatique (Machine Learning) dans l’application, de sorte que les résultats s’améliorent automatiquement, afin d’augmenter à la fois le nombre d’éléments classifiés et la qualité des classifications, sans intervention humaine.
Troisièmement, la base de données de référence des classifications. La logique de classification doit chercher à faire correspondre une description à un code SH, d’une part en la faisant correspondre à un « mot dans le tarif », mais également à des notes explicatives et, de préférence, pour un contexte plus large, à une référence en langage naturel. Cela peut inclure une référence au manifeste d’expédition ou des informations obtenues en consultant des importations antérieures et des répertoires de classification de produits similaires. Quoi qu’il en soit, tous les types de références doivent être examinés avant que la classification finale ne soit déterminée. La logique se doit de reposer sur des fondations solides.
Il faut également garder à l’esprit que les références sont un domaine où les entreprises doivent s’entraider, pour le bien des échanges dans leur ensemble. Et sans occulter les questions de protection des données, il doit exister un moyen de réaliser un « crowdsourcing » des références : cela pourrait considérablement réduire les efforts et les ressources consacrés à la classification – pour créer une autoroute de la classification encore mieux balisée et plus performante pour tous.