Dans le projet SANUM (2017-2018), nous nous sommes intéressées à l’utilisation de capteurs NIR et les applications dans l’agroalimentaire pour le contrôle qualité dans les petites entreprises .
Le projet a été financé par l’Union Européenne avec le soutien de la Région autonome de la Sardaigne et Sardegna Ricerche (POR FESR Sardegna 2014-2020) . Dans ce blog, nous vous dirons ce que nous avons fait et vous montrerons quelques résultats .
Le contexte
Nous l’avons tous lu, les problèmes de santé liés à la nutrition tels que les allergies alimentaires, l’obésité, le diabète et les maladies cardiovasculaires ont augmenté dans des proportions épidémiques . De plus ils causent un lourd tribut à notre société et à nos systèmes de santé . Pour cette raison, la Commission européenne a lancé un défi aux entreprises des TIC, le Prix Horizon, pour le développement d’une solution mobile économique et non invasive qui permettrait aux utilisateurs de mesurer et d’analyser directement les aliments . Enjeu : 1 million d’euros ! Trois entreprises se sont partagées ce prix .
Nous nous sommes demandées pourquoi ne pas essayer d’utiliser ces nouvelles technologies dans le cadre de la R&D de Nurideas? Et les intégrer dans la traçabilité et le contrôle qualité que nous développions pour les micro-entreprises du secteur agroalimentaire ?
Et c’est ainsi que nous avons présenté, en 2017, un projet de recherche et développement en réponse à l’appel d’offres « Filiera Biomed » de Sardegna Ricerche (POR FESR 2014-2020) pour tenter de répondre à cette question .
Parcours scientifique
L’objectif du projet SANUM était l’étude de nouvelles fonctions, liées à la traçabilité alimentaire et à la nutrition personnalisée. Pour les intégrer ensuite dans l’écosystème des produits et services développés par Nurideas . Et ainsi augmenter le niveau d’innovation de notre pipeline . Le projet comprenait un processus de validation scientifique des capteurs divisé en quatre phases :
- collecte d’un nombre suffisant d’échantillons auprès d’entreprises du secteur laitier ;
- analyse des échantillons dans les laboratoires de spectrométrie RMN et GC-MS de l’Université de Cagliari ;
- en parallèle, analyse des mêmes échantillons à travers les capteurs actuellement disponibles dans le commerce ;
- validation des résultats obtenus .
Nous avons testé seulement 2 des 3 capteurs qui ont remporté le prix du scanner européen Horizon Price Food en 2016 . L’objectif était double : d’une part analyser le niveau de sensibilité des capteurs et valider leur fonctionnement . D’autre part comprendre si les micro et petites entreprises agroalimentaires pouvaient les utiliser facilement.
Les capteurs NIR
Les capteurs NIR utilisés dans le projet sont : SCiO (www.consumerphysics.com) e Tellspec (www.tellspec.com).
Les deux capteurs utilisent la technologie NIR (InfraRouge proche – Near InfraRed). Mais fonctionnent dans différentes gammes de longueurs d’onde (SCiO: 750-1040 nm; Tellspec: 900-1700 nm) .
Les deux capteurs communiquent avec le smartphone de l’utilisateur via la connexion Bluetooth. Chaque capteur a sa propre app .
D’un point de vue technique, les capteurs sont constitués d’une source lumineuse qui irradie l’échantillon alimentaire. Ensuite un capteur optique (spectromètre) fait converger les rayons lumineux réfléchis par l’échantillon et renvoie un spectre . Les spectres que nous obtenons sont envoyés au serveur cloud de la société de développement où ils sont analysés. Ils sont ensuite renvoyés vers l’app sur le smartphone de l’utilisateur .
Échantillonnage
Pour le projet SANUM nous avons impliqué 3 entreprises laitières et une entreprise agritouristique multifonctionnelle situées dans différentes parties de la Sardaigne . Au cours de la période comprise entre décembre 2017 et juillet 2018, nous avons analysé différents types de lait (chèvre, brebis et mixte chèvre-brebis) et fromages .
Au total, nous avons collecté 367 échantillons correspondant à 16 produits différents. Et nous avons obtenu un total de 2319 spectres . Nous pouvons considérer ces spectres comme une empreinte digitale de chaque produit .
Les spectres
Les résultats obtenus avec les capteurs NIR ont été comparés aux données obtenues avec des instruments plus sophistiqués (NMR et GC-MS) dans les laboratoires de l’Université de Cagliari. d’une part le Département des sciences biomédicales avec le groupe de métabolomique clinique du Prof. Luigi Atzori . De l’autre Département des sciences de la vie et de l’environnement (DISVA) avec le Prof. Luigi Caboni.
Validation des résultats
Ensuite, pour la validation des capteurs, nous avons effectué des analyses comparatives entre les données obtenues par RMN/GC-MS et celles obtenues par les capteurs .
Pour illustrer, nous vous montrons un exemple d’analyse comparative représenté par la comparaison des résultats obtenu sur les trois types de fromages échantillonnés : frais (« lavorazione formaggio » c’est à dire transformation du fromage), demi-affiné (environ 5-6 mois) et affiné (plus de 12 mois) .
Des différences marquées entre les spectres NIR des fromages frais et ceux à différents degrés d’affinage sont visibles sur les images .
Les spectres RMN montrent également des différences entre ces trois types de fromages :
- le lactose n’est présent que dans le fromage frais ;
- l’arginine, la lysine, le glutamate, la glutamine, l’histamine sont beaucoup plus concentrées dans les fromages vieillis. Par contre elles sont absentes dans les produits frais .
Analyse des données
Pour les analyses nous avons utilisé les outils proposés par l’application « TheLab » sur le site ConsumerPhysics (développeur du capteur SCiO) . TheLab nous permet d’effectuer une analyse PCA sur les spectres analysés et de visualiser les résultats sous forme graphique .
Analyse en Composante Principale
PCA (Principal Component Analysis ou Analyse en Composante Principales) est une technique utilisée pour accentuer les variations et faire ressortir des motifs forts dans les données . Dans notre cas, la PCA est utilisée pour rendre les données plus faciles à explorer et à visualiser, en réduisant le spectre entier d’un vecteur de 330 valeurs (une par longueur d’onde) à un vecteur plus court (généralement de 3-6 valeurs) . Sans pour autant perdre trop d’informations présentes dans le spectre d’origine .
Dans un premier temps, nous analysons 4 fromages que nous reconnaissons facilement . Voyons si les capteurs détectent également les différences .
En particulier, nous allons chercher des « clusters » ou nuages de données qui partagent les mêmes propriétés . Nous avons réalisé ce type d’analyse pour tous les échantillons. Ceci nous a permis de filtrer ainsi tous les spectres anormaux (valeurs aberrantes) . Ensuite nous avons procédé au nettoyage des données pour la création ultérieure des modèles .
Ce qui ressort clairement de cette analyse, c’est la distinction entre provola et ricotta . Au contraire les nuages liés respectivement au stracchino et à la mozzarella sont plus proches, moins distincts .
Cette première étape permet de visualiser la qualité des données et de trouver les spectres anormaux, les « valeurs aberrantes » . Une fois l’ensemble de données nettoyé, les modèles peuvent être créés pour être utilisés ultérieurement pour la reconnaissance de nouveaux échantillons de fromage .
Modèles
Pour créér modèle d’exploration de données (data-mining) on applique un algorithme aux données . C’est un ensemble de données, de statistiques et de schémas qui sont ensuite appliqués à de nouvelles données. Et génèrent ainsi des prédictions et des inférences sur les relations .
En général, deux types de modèles peuvent être créés :
Modèle de classification
La classification est la différenciation entre les catégories, basée sur l’empreinte spectrale des composants de chaque catégorie . Ce type de modèle, par exemple, vous permet de classer les échantillons par type de lait, par type d’alimentation de l’animal, par type de fromage . Les utilisateurs peuvent ensuite scanner leur propre échantillon et identifier la famille d’appartenance .
Modèle d’estimation
Le modèle d’estimation fonctionne sur une collection d’échantillons qui ont un attribut numérique commun, comme la teneur en sucre, la teneur en matières grasses, etc. Sur la base d’échantillons mesurés précédemment qui ont une plage complète de l’attribut cible, les utilisateurs peuvent analyser leur échantillon et découvrir la valeur de l’attribut pour cet échantillon .
Le nombre d’échantillons et les données collectées nous ont seulement permis de créer des modèles de classification pour tester la validité de l’approche . Pour utiliser ces modèles « en production », nous avons besoin d’un plus grand nombre d’échantillons .
Voici un exemple de notre approche d’un modèle de classification .
1 – Première analyse
Nous avons fait la première analyse en fusionnant les collections de fromages de deux des fromageries du projet. Celles-ci produisent et transforment du lait de brebis obtenu à partir de deux races ovines différentes : mouton noir sarde et mouton blanc, respectivement . Nous avons sélectionné quatre types de fromages : mozzarella, provola, ricotta et stracchino . Nous avions collecté suffisamment d’échantillons et de spectres NIR associés .
Comme nous l’avons vu dans l’analyse PCA précédente, nous voyons 4 nuages, 1 pour chaque type de fromage . Cependant, les nuages de mozzarella et de stracchino ont des chevauchements . Nous retrouverons ce comportement également dans le modèle .
2 – Génération du modèle
En utilisant l’outil de génération de modèle dans « TheLab », nous avons créé un modèle de classification pour ces quatre produits .
Dans la figure qui montre la « matrice de confusion », nous voyons les performances du modèle de classification .
Comme prévu suite à l’analyse PCA, le modèle résultant montre une certaine confusion . Ceci parce que nous analysons principalement des échantillons de fromages frais. Et que ceux-ci ne présentent pas d’énormes différences entre eux (voir mozzarella et stracchino) . Les valeurs dans les cases en dehors de la diagonale (celles en rose) représentent cette confusion . En fait, pour que le modèle différencie bien les différents produits, les cases vertes sur la diagonale doivent avoir des valeurs> 90% et aucune autre case (rose) ne doit avoir des valeurs > 5-10% .
3 – Test du modèle
Pour tester le modèle et vérifier sa validité, nous avons utilisé les échantillons de type ovin de l’agrotourisme. Nous n’avons pas utilisé ces échantillons pour créer le modèle . Les résultats correspondent au modèle : la ricotta est bien reconnue. Par contre, les échantillons de « lavorazione formaggio » sont eux reconnus en tant que mozzarella ou stracchino .
4 – Conclusions
Pour développer un modèle plus précis, il nous faudra analyser plus d’échantillons pour chaque type de fromage . Il nous faudra aussi éventuellement impliquer un plus grand nombre d’entreprises . Et certainement développer l’échantillonnage sur une ou plusieurs années de production . En effet, nous devons prendre en compte les différences dues à la saisonnalité, aux conditions climatiques etc. Rappelons nous que ces produits sont fabriqués à la main. Ils ont donc beaucoup plus de variabilité qu’un produit industriel .
Le projet SANUM (2017-2018) a été financé par l’Union européenne avec le soutien de la Région autonome de Sardaigne et Sardaigne Ricerche (POR FESR Sardaigne 2014-2020) . Ce projet nous a permis d’analyser des capteurs NIR et leurs applications dans le secteur agroalimentaire. Ainsi il ouvre la porte à de nouveaux développements pour Nurideas .
Search
Recent Posts
- Capteurs NIR et applications dans l’agroalimentaire 22 avril 2020
- Comment interroger les bases de données nutritionnelles 17 avril 2020
- Startup School 2017 en ligne du YCombinator! 6 décembre 2019
- À SINNOVA avec de nouveaux développements et produits 11 juin 2019
- Le monde des codes QR : un petit tour 11 juin 2019