数据采集与预处理是大数据处理分析的第一个阶段,也是大数据的关键技术之一。在数据获取的过程中,采集到的原始数据可能包含很多冗余或无用的数据,因此,在进行数据的存储和使用之前要进行数据预处理操作。本章简单介绍数据采集与预处理的相关知识。