Passaggi futuri: machine learning su larga scala attraverso la modellazione unificata

0
5

Migliora la tua tecnologia e strategia per i dati aziendali a Transform 2021.

L'apprendimento automatico è diventato pervasivo nelle aziende di tutti i settori man mano che la tecnologia è maturata negli ultimi anni. Uno studio Deloitte del 2020 ha rilevato che il 67% delle organizzazioni intervistate ha messo in pratica l'apprendimento automatico e il 97% si aspettava di implementarlo in qualche forma nell'anno a venire. Con questo utilizzo in espansione, stanno emergendo nuove considerazioni, vale a dire il significativo investimento di risorse necessarie per la manutenzione dei modelli.

I singoli modelli possono contare a centinaia anche per un'azienda di medie dimensioni, come una banca. Ogni modello richiede l'attenzione del personale e potenza di calcolo ogni volta che deve essere eseguito o aggiornato. Inoltre, con l'aumentare del volume di output da modelli separati di machine learning, l'interpretazione e il processo decisionale diventano ancora più complessi. Il nostro team di Credit Sesame stava sperimentando tutto questo mentre aggiungevamo prodotti e continuavamo a far crescere la nostra attività. Per assicurarci che il nostro lavoro di apprendimento automatico potesse continuare a dare impulso all'organizzazione, abbiamo fatto un passo indietro rispetto alle nostre routine e abbiamo deciso di cercare opzioni scalabili.

La modellazione unificata che abbiamo sviluppato è un approccio in cui un singolo modello, piuttosto che un insieme di modelli correlati ma separati, viene creato per alimentare un processo o un prodotto. Un modello unificato, da non confondere con un linguaggio di modellazione unificato, è facilitato raggruppando i dati necessari insieme in un singolo array che viene passato nel modello, consentendo a tutti i risultati di essere consegnati in un'unica esecuzione piuttosto che chiamando una serie di modelli in sequenza.

Per sviluppare il nostro approccio, abbiamo prima selezionato una serie di modelli che erano probabili candidati all'unificazione. Ci siamo resi conto che c'era un livello molto alto di sovrapposizione tra le caratteristiche principali. Successivamente, abbiamo sviluppato un piano per unificare i modelli lavorando con le caratteristiche passate nel modello combinato. Quindi abbiamo eseguito un proof of concept per testare l'accuratezza del modello unificato rispetto alle singole versioni. Siamo stati lieti di vedere una precisione uguale o migliorata dal modello unificato.

La nostra esperienza con questo approccio ha dimostrato che è possibile raccogliere una serie di vantaggi passando a modelli di machine learning unificati. Abbiamo riscontrato miglioramenti quantificabili, come una riduzione del 60% delle ore di lavoro necessarie per mantenere ed eseguire modelli che supportano una delle offerte chiave dell'azienda. I nostri guadagni hanno aumentato il tempo del team, migliorato l'efficienza dei processi, ridotto significativamente i costi di manutenzione e altro ancora.

Tuttavia, l'applicazione di un approccio di modellazione unificato presenta una serie di sfide. La modellazione unificata non è una soluzione adatta a tutti, quindi è essenziale comprendere i casi d'uso appropriati.

Quando un modello unificato ha senso

L'unificazione dei modelli può essere utile per molti tipi di problemi di apprendimento automatico. La nostra esperienza con i modelli predittivi, ampiamente utilizzati dalle organizzazioni di tutti i settori, ha mostrato tre importanti condizioni che dovrebbero essere soddisfatte per adottare un approccio di modellazione unificato:

  • È necessaria una previsione per la stessa variabile di destinazione su un gran numero di entità correlate o partizioni
  • Ogni partizione utilizza lo stesso insieme di funzionalità
  • I modelli devono essere aggiornati frequentemente

Queste condizioni sono tipicamente presenti quando si cerca di prevedere i valori delle variabili target per entità strettamente correlate a scopo di confronto, o classificazione e selezione, ad esempio se è necessario prevedere, tra molti istituti di credito, quello con la probabilità più alta di approvare un particolare prestito. I modelli unificati producono previsioni personalizzate per ciascuna partizione (ad esempio, nel nostro esempio, predirebbe simultaneamente la probabilità di approvazione per ogni prodotto di prestito).

Potenziali vantaggi di un approccio modello unificato

Quando la situazione è giusta per la modellazione unificata, ci sono una serie di vantaggi che puoi ottenere. Abbiamo testato come il passaggio a questo metodo potrebbe migliorare sei metriche chiave. Come mostrato nella tabella seguente, ci sarebbe probabilmente un miglioramento complessivo del 23% tra le metriche combinate, con quattro che mostrano miglioramenti dalla modellazione unificata e uno che rimane lo stesso.

Uno sguardo più approfondito ai vantaggi della nostra esperienza nel mondo reale ha mostrato che per l'importante area dell'efficienza dei processi, l'impatto è stato significativo. Mentre il nostro team è passato dall'implementazione di dozzine di modelli che alimentavano ciascuna una particolare offerta all'utilizzo di un solo modello unificato, abbiamo registrato una riduzione del 75% dei passaggi totali eseguiti. La modifica ha consentito una riduzione del 60% delle ore lavorative, che ha creato notevoli risparmi sui costi e ha aperto la larghezza di banda per il team per perseguire altri progetti.

Inoltre, un modello unificato aiuta a ridurre drasticamente i costi di manutenzione. Invece di lavorare con dozzine di modelli separati ogni volta che si verifica un'esigenza aziendale, un team di data science è molto più facilmente in grado di mantenere un modello integrato aggiornandolo più frequentemente con una cadenza proattiva e regolare.

Anche la velocità con cui vengono forniti i risultati è fondamentale per qualsiasi azienda, soprattutto quando i risultati sono necessari in tempo reale. Unificando in un modello, si migliora la latenza poiché tutte le previsioni vengono fornite contemporaneamente. Abbiamo osservato miglioramenti alla latenza di circa il 66% nel nostro lavoro. Inoltre, questi miglioramenti sono diventati più pronunciati con l'aumentare del numero di partizioni nel set di dati.

La precisione è sempre una considerazione importante. Nel nostro passaggio a un modello unificato, abbiamo visto un aumento della precisione fino al 4% tra le partizioni utilizzate. Nella nostra esperienza, mettere insieme i dati tra le partizioni e adattare un modello predittivo su questi dati combinati non deteriora la qualità dei risultati.

Procedi con cautela

I vantaggi della modellazione unificata possono essere significativi per un'organizzazione. Tuttavia, ci sono una serie di considerazioni da tenere in primo piano quando si implementa questo approccio, inclusi gli squilibri dei dati, i rollback e le esigenze di avvio a freddo.

Squilibri di dati
Quando si sviluppa un modello di classificazione, è comune riscontrare uno squilibrio di classe nella variabile di destinazione. Per i modelli unificati, i dati vengono raggruppati da diverse partizioni e può esserci un secondo livello di squilibrio perché alcune partizioni potrebbero essere sovrarappresentate. Un team può correggere questo problema sovracampionando i dati per le partizioni sottorappresentate per promuovere l'equità.

Rollback
Con i modelli unificati, i team perdono una certa flessibilità nell'affrontare i problemi poiché non è possibile selezionare e scegliere singole partizioni per il rollback (o il roll forward). Un team può risolvere questo problema riqualificando il modello unificato al di fuori del normale ciclo di aggiornamento. In alternativa, se necessario, il modello può essere ripristinato per tutte le partizioni contemporaneamente, su tutta la linea. Ad esempio, se hai creato un modello unificato per prevedere la domanda per l'intera gamma o un set di prodotti della tua azienda, potresti riscontrare, dopo aver distribuito il modello, problemi con i risultati per un prodotto. Sarà quindi necessario eseguire il rollback o riaddestrare il modello completo.

Necessità di avviamento a freddo
A volte potrebbe esserci una lacuna nei dati storici quando viene introdotta una nuova partizione o viene riattivata una vecchia. Sebbene non esista una soluzione semplice per gestire questa situazione, un'opzione consiste nel creare proxy dalle partizioni esistenti che possono essere utilizzate fino a quando non vengono raccolti dati sufficienti per quella nuova. È probabile che le organizzazioni si trovino in questa situazione quando introducono nuovi prodotti nei loro inventari.

Evoluzione continua

La modellazione unificata può portare vantaggi significativi a un'organizzazione quando vengono soddisfatti i criteri giusti e i team di implementazione dispongono di strategie pronte per affrontare le sfide che possono emergere. Poiché gli usi dell'apprendimento automatico continuano a diffondersi ulteriormente nelle organizzazioni e ad aumentare in complessità, la disciplina deve continuare a maturare. Tecniche come l'approccio di modellazione unificata che ho descritto qui sono una parte fondamentale dell'evoluzione in corso che aiuterà a soddisfare la crescente domanda da parte delle organizzazioni di soluzioni di machine learning per risolvere le sfide aziendali critiche e contribuire a creare vantaggi competitivi.

Pejman Makhfi è Chief Technical Officer di Credit Sesame.

VentureBeat

La missione di VentureBeat è quella di essere una piazza cittadina digitale per i responsabili delle decisioni tecniche per acquisire conoscenze sulla tecnologia trasformativa e sulle transazioni.

Il nostro sito fornisce informazioni essenziali sulle tecnologie dei dati e sulle strategie per guidarti mentre guidi le tue organizzazioni. Ti invitiamo a diventare un membro della nostra community, per accedere a:

  • informazioni aggiornate sugli argomenti di tuo interesse
  • le nostre newsletter
  • contenuti gated leader di pensiero e accesso scontato ai nostri eventi pregiati, come Trasforma il 2021: Per saperne di più
  • funzionalità di rete e altro ancora

Diventare socio