MinMaxScaler
是 Scikit-Learn 库中用于数据归一化的函数。它可以将数据缩放到指定的最小值和最大值之间,通常用于数据预处理步骤,使得不同尺度的特征具有可比性。
以下是 MinMaxScaler
的基本使用方法:
- 导入
MinMaxScaler
函数:
from sklearn.preprocessing import MinMaxScaler
- 准备数据,这里以 NumPy 数组为例:
data = np.array([[1, 1000], [5, 1500], [10, 2000]])
- 创建
MinMaxScaler
对象:
scaler = MinMaxScaler()
- 使用
fit_transform
方法对数据进行归一化处理:
scaled_data = scaler.fit_transform(data)
fit_transform
方法会先通过 fit
方法学习数据的范围,然后使用 transform
方法对数据进行转换。
- 打印归一化后的数据:
print(scaled_data)
运行上述代码后,你将得到归一化后的数据,其值位于指定的 feature_range
内,默认是 [0, 1]
。
如果你需要指定其他的 feature_range
,可以在创建 MinMaxScaler
对象时传入 feature_range
参数,例如:
scaler = MinMaxScaler(feature_range=(0.1, 0.9))
这将把数据缩放到 0.1
到 0.9
的范围内。
需要注意的是,MinMaxScaler
不会改变数据的分布,它仅仅是对数据的数值进行缩放,使得它们落入指定的范围内。