banner

Notizia

Aug 31, 2023

Applicazioni del machine learning nella classificazione dei pinoli

Rapporti scientifici volume 12, numero articolo: 8799 (2022) Citare questo articolo

1128 accessi

2 citazioni

2 Altmetrico

Dettagli sulle metriche

I pinoli non sono solo un importante agente per la riproduzione e il rimboschimento dei pini, ma anche una noce comunemente consumata con alti valori nutritivi. Tuttavia, è difficile distinguere tra i pinoli a causa della somiglianza morfologica tra le specie. Pertanto è importante migliorare la qualità dei pinoli e risolvere il problema della adulterazione in modo rapido e non distruttivo. In questo studio, sette pinoli (Pinus bungeana, Pinus yunnanensis, Pinus thunbergii, Pinus armandii, Pinus massoniana, Pinus elliottii e Pinus taiwanensis) sono stati utilizzati come specie di studio. Sono stati raccolti 210 spettri del vicino infrarosso (NIR) da sette specie di pinoli, cinque metodi di apprendimento automatico (Decision Tree (DT), Random Forest (RF), Multilayer Perceptron (MLP), Support Vector Machine (SVM) e Naive Bayes (NB)) sono stati utilizzati per identificare le specie di pinoli. 303 immagini sono state utilizzate per raccogliere dati morfologici per costruire un modello di classificazione basato su cinque modelli di rete neurale convoluzionale (CNN) (VGG16, VGG19, Xception, InceptionV3 e ResNet50). I risultati sperimentali della spettroscopia NIR mostrano che il miglior modello di classificazione è MLP e la precisione è vicina a 0,99. Un altro risultato sperimentale delle immagini mostra che il miglior modello di classificazione è InceptionV3 e la precisione è vicina a 0,964. Si è scoperto che quattro importanti gamme di bande d'onda, 951–957 nm, 1.147–1.154 nm, 1.907–1.927 nm, 2.227–2.254 nm, sono altamente correlate alla classificazione dei pinoli. Questo studio dimostra che l’apprendimento automatico è efficace per la classificazione dei pinoli, fornendo soluzioni e metodi scientifici per una classificazione rapida, non distruttiva e accurata di diverse specie di pinoli.

Esistono più di 113 specie formalmente riconosciute di Pinus Linn distribuite principalmente nell'emisfero settentrionale1, 2 e costituiscono una parte importante degli ecosistemi forestali. I pinoli sono i semi dei pini, sono una noce comunemente consumata e un importante agente di rimboschimento e riproduzione3. I pinoli sono ricchi di proteine, acidi grassi, minerali e vitamine. Contengono inoltre acido oleico, acido linolenico e altri acidi grassi insaturi, che facilitano la prevenzione delle malattie cardiovascolari4. Il riconoscimento della specie di pinoli è importante per la sicurezza alimentare e la qualità dei pinoli. Negli ultimi anni l’aumento del prezzo dei pinoli ha portato enormi benefici economici. La produzione globale di pinoli nel periodo 2020-2021 è di circa 381.700 tonnellate. La Cina è il principale paese di importazione ed esportazione di pinoli nel mondo. Considerando la somiglianza visiva tra i pinoli, la possibilità di adulterazione dei prodotti è molto elevata e il problema dell’adulterazione ha un grande impatto sulla salute e sull’economia. Pertanto, come individuare i prodotti adulterati nei pinoli in modo conveniente, veloce e non distruttivo è una sfida per la sicurezza alimentare dei pinoli.

Attualmente, i metodi comuni di identificazione delle specie includono l'analisi morfologica5, la tecnologia dei marcatori molecolari6,7,8,9, l'elettroforesi delle proteine10, la cromatografia liquida11, l'analisi spettrale12,13,14 e il riconoscimento delle immagini15. L'analisi morfologica richiede un elevato livello di competenza che non è facilmente acquisibile e come tale, a causa della grande somiglianza morfologica tra alcune specie, il tasso di identificazione accurata è basso16. Sebbene l’uso dei marcatori molecolari restituisca un tasso di riconoscimento più elevato e una maggiore accuratezza, si tratta di una metodologia distruttiva, dispendiosa in termini di tempo e limitata dal numero di marcatori pubblicati nei database pubblici. Pertanto, questo studio stabilisce modelli di apprendimento automatico per la classificazione dei pinoli basati sulla spettroscopia e sulle immagini del vicino infrarosso (NIR).

La spettroscopia NIR è una metodologia che utilizza le vibrazioni molecolari nello spettro infrarosso del materiale. Il processo di spettroscopia NIR prevede che l'apparato NIR emetta una luce infrarossa che entra nel campione. Qui viene riflesso, rifratto, diffuso e assorbito e infine riporta le informazioni del campione nel rilevatore. Questa metodologia è conveniente, rapida, non distruttiva ed economica. È stato utilizzato in molti campi agricoli, inclusa la ricerca sulla produzione di grano17, soia18, fagiolo dall'occhio19 e riso12. Finora, ci sono pochi rapporti sull’applicazione della spettroscopia NIR nella ricerca sulla silvicoltura e sui pinoli. Nello specifico, Tigabu et al.20 hanno raccolto dati spettrali nel visibile NIR delle noci di Pinus sylvestris in diverse aree e hanno preelaborato i dati spettrali mediante la correzione della dispersione moltiplicativa (MSC). La sorgente nut è stata costruita tramite il Soft Independent Modeling of Class Analogy (SIMCA) e l'analisi discriminante dei minimi quadrati parziali (PLS-DA). Loewe et al.21 hanno raccolto dati spettrali NIR del Pinus pinea mediterraneo dalle piantagioni cilene per la classificazione. Moscetti et al.22 hanno raccolto i dati spettrali NIR delle noci di P. pinea e Pinus sibirica in diverse regioni e hanno stabilito un modello di classificazione spettrale utilizzando i metodi PLS-DA e Interval PLS-DA (IPLS-DA). Tuttavia, gli effetti di altri diversi modelli di classificazione necessitano ancora di essere ulteriormente discussi in più specie di pinoli.

 0.80, with MLP and SVM providing an accuracy of > 0.93. With pre-process of data, the performance of the MLP and SVM models have been greatly improved, the accuracy of the MLP model reaches 0.99, while the SVM model reaches 0.94. Overall, these results show that the RF model is a better classification method when the data are not normalized, while the MLP model is the best for normalized data./p>

CONDIVIDERE