Oct 30, 2019

Il contesto di business

Immaginiamo di dover ordinare della merce per la nostra compagnia. Nota la quantità di beni presenti in magazzino, se conoscessimo i quantitativi che i nostri clienti ordineranno nelle successive settimane, il nostro compito sarebbe molto semplice: potremmo pianificare le quantità degli ordini di acquisto in maniera tale che le rimanenze di magazzino siano minime e la domanda dei clienti sia soddisfatta.

Questo compito può sembrare banale, ma se chiedessimo ad un qualunque supply manager, ci direbbe che il suo lavoro non è affatto facile come sembra. La difficoltà nasce dal fatto che l’informazione relativa alla domanda dei clienti non è disponibile. 

Questa informazione risulta ugualmente importante in altre situazioni, per esempio, in termini di ordini di produzione: pianificare le quantità che devono essere prodotte in modo da soddisfare la domanda dei clienti senza saturare il magazzino di rimanenze.

Le Predictive Analytics sono in grado di prevedere la domanda dei nostri clienti ed aiutarci ad ottimizzare la produzione o i nostri acquisti riducendo al minimo le scorte di magazzino, permettendoci di prendere decisioni con la consapevolezza di un approccio data driven.

Un motore integrato di Advanced Analytics

Le Predictive Analytics, o più in generale le Advanced Analytics, stanno diventando sempre più diffuse e semplici da implementare. Ciò nonostante, in molti casi è necessario investire in un nuovo sistema ad hoc dedicato all’unico scopo di eseguire analisi predittive.

Tradizionalmente, il sistema predittivo è un server R che comunica con un database in cui il dato da prevedere è conservato. È necessario che la comunicazione avvenga in entrambe le direzioni: i dati grezzi devono essere importati nel sistema predittivo che, una volta elaborati i dati, deve restituire i risultati al database, dove le applicazioni di data visualization sono generalmente implementate.

Inoltre, ogni volta che si vuole avere una nuova previsione è necessario ripetere l’intero processo, spesso rendendo necessario l’intervento di un data scientist, rendendo l’operazione costosa in termini di tempo e risorse.

È qui che entra in gioco la SAP Predictive Analysis Library (PAL). Si tratta di un insieme di algoritmi di Advanced e Predictive Analytics incorporata nel database SAP HANA. Il vantaggio principale, rispetto allo scenario descritto pocanzi, è che l’elaborazione può avvenire all’interno del data warehouse stesso. Ciò significa che non è necessaria manutenzione su un nuovo sistema né di ETL (Extract, Transform, Load) per la comunicazione tra il database e il sistema predittivo.

Inoltre, SAP HANA consente di automatizzare la previsione in modo tale che non sia necessario alcun intervento umano una volta sviluppata l'applicazione. Ciò consente di calcolare nuovi risultati con la frequenza desiderata su base giornaliera o su richiesta.

È anche possibile sfruttare le prestazioni computazionali offerte da SAP HANA e la sua capacità di gestire e trasformare i dati.

01

Panoramica su PAL

SAP HANA Predictive Analysis Library (PAL), è un sottoinsieme di algoritmi della libreria AFL (Application Function Library). Queste funzioni possono essere utilizzate in SAP HANA SQL Script per eseguire analisi predittive. Esistono molte categorie di algoritmi all’interno di questa libreria di funzioni che consentono di essere utilizzate in molti possibili contesti aziendali, ad esempio:

o   Time Series: previsione di futuri valori di vendita a partire da un set di dati storici;

o   Clustering: raggruppamento dei propri clienti basato su dati anagrafici e comportamento di acquisto;

o   Classificazione: identificazione del comportamento del cliente in base ai suoi dati anagrafici;

o   Regressione: analisi della relazione tra campagne di marketing e andamento delle vendite per valutarne l’impatto.

 

L’applicazione in un contesto aziendale reale: risultati

I risultati che seguono sono riferiti ad un'applicazione sviluppata per un'azienda nel settore del food & beverage. L’obbiettivo del progetto era prevedere la domanda di prodotti al fine di ottimizzare gli ordini di produzione e il livello delle scorte di magazzino e soddisfare così i volumi degli ordini di vendita previsti.

 Gli algoritmi utilizzati appartengono alla classe delle Time Series. La previsione con le Time Series consiste nell'uso di un algoritmo statistico per prevedere i valori futuri basandosi solo su valori precedentemente osservati. Serie distinte sono considerate indipendenti l'una dall'altra.

In questo contesto, ogni serie rappresenta la storia delle vendite associate ad un determinato prodotto.

Il grafico seguente mostra la differenza tra l’andamento del Forecast (il dato Previsto, linea rossa) e quello dell’Actual (i valori osservati, linea blu) e può essere utilizzato per valutare l'accuratezza della previsione.

02

Gli andamenti risultano molto vicini. Questo significa che la previsione ottenuta si discosta poco dai valori effettivi che erano ignoti al momento della previsione.

Inoltre, l’applicazione permette di aumentare il livello di dettaglio e analizzare l’andamento di Forecast e Actual per ogni prodotto.

Nella tabella seguente è possibile notare che oltre il 90% dei volumi è stato previsto con un errore (MAPE, Mean Absolute Percentage Error) inferiore al 20%:

03

Conclusioni

Come abbiamo visto nell’ultimo paragrafo, le Advanced Analytics ed in particolare, la SAP HANA Predictive Analysis Library (PAL) ci permettono di rispondere alla domanda posta all’inizio dell’articolo in maniera semplice, avendo a disposizione una previsione affidabile della domanda del cliente.

Questo risultato è possibile perché siamo stati in grado di estrarre nuove informazioni dai nostri dati storici. Ora possiamo usare queste insights per guidare le nostre decisioni .