HDF5(Hierarchical Data Format version 5)是一种多功能、开源的文件格式,旨在存储和组织大量的数值数据。它特别适用于科学和工程应用,在这些应用中,数据集通常复杂、异构,并且需要高效的存储和检索。与CSV或纯文本等简单格式不同,HDF5允许在单个文件中存储多个数据集,以及描述数据结构、单位和其他相关信息的元数据(metadata)。这种分层结构使用户能够逻辑化地组织数据,从而更容易导航和访问特定信息子集。HDF5支持广泛的数据类型,包括整数、浮点数、字符串和数组,并且可以处理远大于可用内存的数据集。其自描述性(self-describing nature)确保即使没有外部文档,数据也能被正确解释。该格式还支持压缩(compression),可以显著减小文件大小,并支持分块(chunking),从而无需将整个文件加载到内存中即可高效访问数据子集。由于其灵活性和性能,HDF5广泛应用于天文学、气候科学、医学成像和计算流体动力学等领域。