In che modo Hasty utilizza l'automazione e il feedback rapido per addestrare i modelli di intelligenza artificiale e migliorare l'annotazione

0
72

La visione artificiale sta svolgendo un ruolo sempre più centrale in tutti i settori industriali, dal monitoraggio dei progressi nei cantieri all'implementazione della scansione intelligente dei codici a barre nei magazzini. Ma addestrare il modello di intelligenza artificiale sottostante per identificare con precisione le immagini può essere uno sforzo lento e ad alta intensità di risorse che non è garantito per produrre risultati. La neonata startup tedesca Hasty vuole aiutare con la promessa di strumenti di "prossima generazione" che accelerano l'intero processo di addestramento del modello per l'annotazione delle immagini.

Hasty, fondata a Berlino nel 2019, ha annunciato oggi di aver raccolto 3,7 milioni di dollari in un round seed guidato da Shasta Ventures. L'azienda di Silicon Valley VC ha una serie di uscite degne di nota al suo nome, tra cui Nest (acquisita da Google), Eero (acquisita da Amazon) e Zuora (IPO). Altri partecipanti al round includono iRobot Ventures e Coparion.

Il mercato globale della visione artificiale è stato fissato a $ 11,4 miliardi nel 2020, una cifra che si prevede salirà a oltre $ 19 miliardi entro il 2027. La preparazione e l'elaborazione dei dati è una delle attività che richiedono più tempo nell'intelligenza artificiale, rappresentando circa l'80% del tempo dedicato a progetti correlati. Nella visione artificiale, l'annotazione o l'etichettatura è una tecnica utilizzata per contrassegnare e classificare le immagini per dare alle macchine il significato e il contesto dietro l'immagine, consentendo loro di individuare oggetti simili. Gran parte di questo lavoro di annotazione ricade su fidati vecchi umani.

Il problema che Hasty sta cercando di risolvere è che la stragrande maggioranza dei progetti di data science non arriva mai in produzione, con risorse significative sprecate nel processo.

"Gli attuali approcci all'etichettatura dei dati sono troppo lenti", ha detto a VentureBeat il cofondatore e CEO di Hasty Tristan Rouillard. "Gli ingegneri del machine learning spesso devono attendere da tre a sei mesi per i primi risultati per vedere se la loro strategia e il loro approccio di annotazione funzionano a causa del ritardo tra l'etichettatura e l'addestramento del modello".

Fare in fretta

Hasty viene fornito con 10 assistenti AI automatizzati integrati, ciascuno dedicato a ridurre il lavoro umano. Dextr, ad esempio, consente agli utenti di fare clic su solo quattro punti estremi su un oggetto per evidenziarlo e suggerire annotazioni.

Sopra: l'assistente di intelligenza artificiale Dextra di Hasty

E l'assistente per la "segmentazione delle istanze" di Hasty crea annotazioni più rapide quando trova più istanze di un oggetto all'interno di un'immagine.

Sopra: rapida segmentazione dell'istanza AI

L'assistente osserva mentre gli utenti annotano e può dare suggerimenti per le etichette una volta raggiunto un punteggio di affidabilità specifico. E l'utente può correggere questi suggerimenti per migliorare il modello mentre riceve feedback sull'efficacia della strategia di annotazione.

"Questo dà alla rete neurale una curva di apprendimento – impara sul progetto mentre etichetti", ha detto Rouillard.

Esistono già innumerevoli strumenti progettati per semplificare questo processo, tra cui SageMaker di Amazon, Labelbox supportato da Google, V7 e Dataloop, che ha annunciato un nuovo round di finanziamento da 11 milioni di dollari proprio il mese scorso.

Ma Hasty afferma di poter rendere l'intero processo molto più veloce con la sua combinazione di automazione, addestramento del modello e annotazione.

Come con piattaforme simili, Hasty utilizza un'interfaccia attraverso la quale gli esseri umani e le macchine collaborano. Hasty può creare annotazioni suggerite dopo essere stato esposto a poche immagini annotate da persone, con l'utente (ad esempio l'ingegnere di apprendimento automatico) che accetta, rifiuta o modifica quel suggerimento. Questo feedback in tempo reale significa che i modelli migliorano quanto più vengono utilizzati in quello che viene spesso definito "volano dei dati".

“Tutti stanno cercando di costruire un volano di dati auto-migliorante. Il problema con la visione (computerizzata) AI sta nel far girare il volano in primo luogo, [as] è super costoso e funziona solo il 50% delle volte: è qui che entriamo in gioco ", ha detto Rouillard.

Feedback rapido

In effetti, le reti neurali di Hasty apprendono mentre gli ingegneri costruiscono i loro set di dati, quindi le sfaccettature di "costruzione", "distribuzione" e "valutazione" del processo avvengono più o meno contemporaneamente. Un tipico approccio lineare potrebbe richiedere mesi per arrivare a un modello di IA verificabile, che potrebbe essere profondamente difettoso a causa di errori nei dati o di ipotesi cieche fatte all'inizio del progetto. Ciò che Hasty promette è l'agilità.

Non è del tutto nuovo, ma Rouillard ha affermato che la sua azienda considera l'etichettatura automatizzata simile alla guida autonoma, in quanto tecnologie diverse operano a livelli diversi. Nella sfera dei veicoli a guida autonoma, alcune auto possono solo frenare o cambiare corsia, mentre altre sono in grado di raggiungere quasi la piena autonomia. Tradotto in annotazione, Rouillard ha affermato che Hasty porta l'automazione oltre molti dei suoi concorrenti, in termini di riduzione al minimo del numero di clic necessari per etichettare un'immagine o gruppi di immagini.

"Tutti predicano l'automazione, ma non è ovvio cosa viene automatizzato", ha spiegato Rouillard. "Quasi tutti gli strumenti hanno buone implementazioni dell'automazione di livello 1, ma solo pochi di noi si prendono la briga di fornire i livelli 2 e 3 in modo da produrre risultati significativi."

Poiché i dati sono essenzialmente il carburante per l'apprendimento automatico, ottenere più dati (accurati) in un modello di intelligenza artificiale su larga scala è fondamentale.

Sopra: Hasty: livelli di etichettatura automatizzati

Oltre a uno strumento di ricerca manuale degli errori, Hasty offre un rilevatore di errori basato sull'intelligenza artificiale che identifica automaticamente i probabili problemi nei dati di formazione di un progetto. È una funzione di controllo della qualità che elude la necessità di cercare errori nei dati.

"Questo ti consente di dedicare il tuo tempo alla correzione degli errori invece di cercarli e ti aiuta a creare rapidamente fiducia nei tuoi dati mentre annoti", ha detto Rouillard.

Sopra: Hasty: Error finder

Hasty sostiene circa 4.000 utenti, un mix abbastanza uniforme di aziende, università, startup e sviluppatori di app che abbracciano quasi tutti i settori. "Abbiamo tre delle prime 10 società tedesche di logistica, agricoltura e vendita al dettaglio che utilizzano Hasty", ha aggiunto Rouillard.

Un tipico caso d'uso agricolo potrebbe comportare la formazione di un modello di intelligenza artificiale per identificare colture, parassiti o malattie. Nella logistica, il modello può essere utilizzato per addestrare le macchine a smistare automaticamente i pacchi per tipo. Rouillard ha aggiunto che Hasty viene utilizzato anche nel regno dello sport per fornire analisi e statistiche di gioco in tempo reale per la copertura del calcio.

Con 3,7 milioni di dollari in banca, la società intende accelerare lo sviluppo del prodotto ed espandere la propria base di clienti in Europa e Nord America.

Iscriversi per Finanziamento settimanale per iniziare la tua settimana con le migliori storie di finanziamento di VB.

LASCIA UN COMMENTO

Per favore inserisci il tuo commento!
Per favore inserisci il tuo nome qui