Dbt Labs raccoglie 150 milioni di dollari per aiutare gli analisti a trasformare i dati nel magazzino

433

Qual è la posizione della tua azienda nella curva di adozione dell'AI? Partecipa al nostro sondaggio sull'intelligenza artificiale per scoprirlo.

Lascia il Newsletter OSS Enterprise guida il tuo viaggio nell'open source! Iscriviti qui.

Fishtown Analytics, la società dietro uno strumento di "ingegneria analitica" open source chiamato dbt (strumento di creazione di dati), ha annunciato oggi di aver rinominato Dbt Labs e ha raccolto $ 150 milioni in un round di finanziamento di serie C con una valutazione di $ 1,5 miliardi.

L'ingegneria analitica, per chi non lo sapesse, è un ruolo relativamente nuovo che descrive il processo di acquisizione dei dati grezzi dopo che sono entrati in un data warehouse e di preparazione per l'analisi. Il ruolo stesso funge da ponte tra le sfere dell'ingegneria dei dati e dell'analisi dei dati, richiedendo loro di trasformare i dati in un modulo utilizzabile che può essere facilmente interrogato da altri (ad esempio i professionisti del marketing) all'interno dell'azienda. Dbt Labs giustappone il ruolo a quello di un analista di dati in questa descrizione:

Gli ingegneri analitici forniscono set di dati puliti agli utenti finali, modellando i dati in un modo che consenta agli utenti finali di rispondere alle proprie domande. Mentre un analista di dati trascorre il proprio tempo ad analizzare i dati, un ingegnere di analisi passa il proprio tempo a trasformare, testare, distribuire e documentare i dati.

Fondata a Filadelfia nel 2016, Dbt Labs ha trascorso gli ultimi cinque anni a progettare un set di strumenti per aiutare gli analisti di dati a "creare e diffondere la conoscenza dell'organizzazione", come si dice. Ciò ha significato in gran parte offrire servizi di consulenza oltre al progetto dbt open source, utilizzato da importanti aziende tra cui HubSpot, GitLab e Jetblue.

Ma cos'è il dbt, esattamente? In poche parole, dbt è uno strumento da riga di comando che consente agli analisti di dati di trasformare i dati grezzi scrivendo codice dbt nel loro normale editor di testo e quindi richiamando dbt dalla riga di comando. Dbt quindi compila il codice in SQL e lo esegue nel database dell'azienda. Pertanto, dbt è un ambiente di sviluppo che "parla il linguaggio preferito degli analisti di dati" (è SQL, nel caso ve lo stiate chiedendo).

Sopra: Utente che interagisce con dbt

Per il contesto, un moderno stack di dati aziendali comprende una miriade di componenti, che abbracciano strumenti di acquisizione dei dati come Fivetran e data warehouse basati su cloud come Snowflake e BigQuery di Google. I dati possono essere "trasformati" all'ingresso nel data warehouse come parte di un processo noto come "estrazione, trasformazione, caricamento" (ETL), che è il punto in cui entrano in gioco aziende come Matillion. Ma i dati possono anche essere trasformati in un secondo momento eseguendo script SQL direttamente nel magazzino, attraverso un processo noto come "estrai, carica, trasforma" (ELT). Quest'ultimo raggiunge tempi di caricamento più rapidi ma richiede una maggiore potenza di elaborazione poiché i dati devono essere trasformati su richiesta: è qui che la potenza dei moderni database di analisi come Snowflake e BigQuery brilla davvero.

In parole povere, dbt è la "T" in ELT: è costruito per trasformare i dati che già vivono in un data warehouse. "Dbt è un elemento chiave nel moderno stack di dati: si collega alla piattaforma di dati cloud e sfrutta tutta la potenza di calcolo di queste piattaforme per trasformare, testare e distribuire set di dati", ha dichiarato a VentureBeat Tristan Handy, CEO e cofondatore di Dbt Labs.

Dopo la trasformazione, le aziende possono utilizzare questi set di dati per qualsiasi cosa desiderino, che si tratti di addestrare modelli di apprendimento automatico o di alimentare strumenti di business intelligence (BI) come Tableau o Looker.

Contents

La storia così lontana

Secondo Handy, inizialmente ha sviluppato dbt sulla base delle proprie esperienze come analista di dati.

"Ho lavorato come analista di dati per un decennio e mezzo e sono sempre stato rallentato da flussi di lavoro terribili: inviare e ricevere fogli di calcolo tramite e-mail, scaricare enormi file .CSV, salvare file SQL sul mio desktop", ha affermato.

Avanti veloce di cinque anni e Handy ha affermato che l'adozione di dbt è cresciuta del 200% ogni anno dal suo lancio e nel primo trimestre del 2021 le entrate aziendali della sua azienda sono raddoppiate di anno in anno. La principale forza trainante dietro questo, come sembra essere il caso di quasi tutte le nuove tecnologie in questi giorni, è la rapida transizione dall'infrastruttura on-premise al cloud computing, in questo caso, piattaforme di dati basate su cloud come Databricks, BigQuery, Snowflake e Amazon Redshift.

"Il grande cambiamento per il nostro settore è la transizione al cloud", ha affermato Handy. “Le moderne piattaforme dati cloud sono tutte una classe fondamentalmente nuova di “cosa” che semplicemente non era possibile nel mondo on-premise di dieci anni fa. I dati crescono molto rapidamente e i carichi di lavoro di elaborazione su questi dati sono molto variabili. Entrambi questi fattori significano che l'elasticità del cloud è estremamente importante ed è nostra convinzione che tutti, o in modo apprezzabile tutti, i carichi di lavoro di dati migreranno al cloud nel prossimo decennio".

La scalabilità e l'elasticità offerte dal cloud aprono le porte a cose che prima non erano un'opzione, come la capacità di eseguire la trasformazione dei dati nel magazzino che accelera notevolmente le cose.

"Lo sblocco fondamentale del cloud ha fatto sì che le prestazioni diventassero molto meno problematiche, il che ha consentito agli analisti di dati di assumere il controllo dell'intero processo di generazione di informazioni dettagliate", ha continuato Handy. "Questo, a sua volta, ha portato all'ascesa dell'ingegneria analitica, la pratica con cui gli analisti costruiscono pipeline moderne su piattaforme di dati cloud".

Mostrarmi il denaro

In precedenza, Dbt Labs aveva raccolto circa 42 milioni di dollari, la cui totalità è arrivata negli ultimi 14 mesi attraverso due round di finanziamento separati. Con la sua ultima iniezione di denaro, che è stata co-guidata da Sequoia Capital, Andreessen Horowitz e Altimeter, la società ha affermato che raddoppierà lo sviluppo della sua piattaforma open source principale.

"In questo momento il nostro obiettivo è migliorare la nostra offerta principale e supportare la sua crescita esponenziale come fondamento di una delle aree a più alta crescita in tutto il software aziendale", ha affermato Handy. "Abbiamo anche messo gli occhi su alcune nuove aree sperimentali di sviluppo del prodotto, ma non siamo ancora pronti a condividere nulla".

Per quanto riguarda il rebrand, anche questo ha molto senso dato come Fishtown Analytics e dbt si sono evoluti negli ultimi cinque anni. Inizialmente, dbt era puramente un prodotto open source senza componenti commerciali: Fishtown Analytics era il principale contributore e utente del progetto e vendeva servizi di consulenza oltre al progetto open source. Negli anni successivi, tuttavia, dbt ha acquisito i propri piani premium Team ed Enterprise, che includono accesso API, single sign-on, servizi professionali e altro ancora. Per questo motivo non c'è bisogno che due “marchi” separati monetizzino lo stesso prodotto, cosa che potrebbe anche creare confusione.

"Questa confusione è stata una grande motivazione per cambiare il nostro nome da Fishtown Analytics", ha detto Handy. "Nel rinominare l'azienda, stiamo dichiarando sia il nostro rapporto con dbt, che abbiamo creato e manteniamo, sia l'impegno per il suo successo a lungo termine".

Sopra: interfaccia Dbt

Il fattore OSS

Secondo Dtb Labs, ci sono circa 15.000 "professionisti dei dati" nella comunità dbt Slack, 5.500 aziende che utilizzano dbt e 1.000 clienti cloud dbt che pagano per l'accesso centralizzato tramite un'interfaccia basata sul web.

Tuttavia, dato che dbt è rilasciato sotto una licenza permissiva di Apache 2.0, ciò significa che ci sono pochissime restrizioni su come il mondo commerciale lo adotta. Quindi questo non potrebbe significare che altre società con tasche profonde potrebbero cercare di costruire sul dbt? Potrebbe davvero, ed è in parte il motivo per cui Dbt Labs ha scelto di raccogliere un'altra considerevole fetta di fondi così presto dopo i due round precedenti.

"Dbt guida un'enorme quantità di utilizzo su molte delle principali piattaforme di dati cloud, il che rende dbt e la sua comunità molto strategici per queste piattaforme", ha affermato Handy. “Sappiamo anche che i principali provider di cloud amano vendere versioni gestite di software open source. Metti insieme queste due cose e la nostra aspettativa è che almeno una, se non di più, delle piattaforme cloud lancerà una sorta di servizio dbt gestito nel prossimo anno. Il nostro spazio si sta riscaldando e questo ci costringe ad accelerare la nostra capacità di costruire prodotti differenziati. Ecco perché abbiamo rilanciato".

VentureBeat

La missione di VentureBeat è quella di essere una piazza cittadina digitale per i responsabili delle decisioni tecniche per acquisire conoscenze sulla tecnologia trasformativa e sulle transazioni.

Il nostro sito fornisce informazioni essenziali sulle tecnologie e sulle strategie dei dati per guidarti nella guida delle tue organizzazioni. Ti invitiamo a diventare un membro della nostra community, per accedere a:

  • informazioni aggiornate sugli argomenti di tuo interesse
  • le nostre newsletter
  • contenuti gated leader di pensiero e accesso scontato ai nostri eventi preziosi, come Trasforma 2021: Per saperne di più
  • funzioni di rete e altro

Diventare socio