学习 Spark MLlib 特征工程(二):VectorAssembler

VectorAssembler 用于将多个列合并为一个向量列,列的类型可以是数值型、布尔型和向量类型。

举🌰

样例数据:

id hour mobile userFeatures clicked
0 18 true [0.0, 10.0, 0.5] 1.0

样例代码:

new VectorAssembler()  
      .setInputCols(Array("hour", "mobile", "userFeatures"))
      .setOutputCol("features")

输出:

clicked features
1.0 [18.0,1.0,0.0,10.0,0.5]