Il formato Apache Arrow IPC Stream (.arrow) è un formato di file binario progettato per il trasferimento e l'archiviazione efficiente dei dati, in particolare all'interno dell'ecosistema Apache Arrow. È un formato di memoria colonnare, il che significa che i dati sono organizzati per colonne anziché per righe, il che è estremamente vantaggioso per i carichi di lavoro analitici. Questo formato facilita la condivisione di dati a "zero-copy" (copia zero) tra processi e sistemi, riducendo significativamente l'overhead e migliorando le prestazioni. I flussi Arrow IPC sono tipicamente utilizzati per trasferire grandi set di dati tra applicazioni che supportano il formato Arrow, come motori di elaborazione dati, database e framework di machine learning. Il formato include metadati che descrivono lo schema dei dati, consentendo uno scambio di dati auto-descrittivo. È ottimizzato per una serializzazione e deserializzazione rapide, rendendolo ideale per l'elaborazione dati in tempo reale e il calcolo ad alte prestazioni. Il formato è indipendente dal linguaggio (language-agnostic), con implementazioni disponibili in vari linguaggi di programmazione, tra cui Python, Java, C++ e R. L'estensione di file .arrow rappresenta tipicamente un flusso di dati Arrow, che può essere un singolo batch o una sequenza di batch che rappresentano un set di dati più grande. Il formato è progettato per essere estensibile e supporta vari tipi di dati e codifiche.