El ARFF (Formato de Archivo de Relación de Atributos) es un formato de archivo de texto desarrollado por el Grupo de Aprendizaje Automático (Machine Learning Group) de la Universidad de Waikato para describir conjuntos de datos utilizados en el aprendizaje automático (machine learning). Se utiliza principalmente con el software WEKA (Waikato Environment for Knowledge Analysis), pero también es compatible con otras herramientas de machine learning. Un archivo ARFF consta de dos secciones principales: una sección de encabezado (header) y una sección de datos (data). La sección de encabezado es crucial, ya que define el nombre de la relación (el nombre del conjunto de datos) y los atributos (características o columnas) que componen los datos. Cada atributo se declara especificando su nombre y su tipo de dato, que puede ser numérico, nominal, cadena de texto (string) o fecha. La sección de datos contiene las instancias de datos reales, donde cada instancia se presenta como una lista de valores de atributos separados por comas. Los valores faltantes (missing values) se representan convencionalmente mediante un signo de interrogación (?). Los archivos ARFF están diseñados para ser legibles por humanos y fácilmente analizados (parsed) por algoritmos, lo que los convierte en una opción popular para el almacenamiento e intercambio de datasets en la comunidad de machine learning, dada su versatilidad para manejar datos tanto numéricos como categóricos.