基于Python第三方库sklearn,选择make_blobs数据集的参数说明。
from sklearn.datasets.samples_generator import make_blobs
X, y = make_blobs(n_samples=2000, n_features=2, centers=[[-2,-2],[0,0], [1,1], [3,3]], cluster_std=[0.4, 0.2, 0.2, 0.2],random_state =9)
首先导入数据集,其次调用该数据集的一个样本:X为样本特征,Y为样本簇类别, 共2000个样本,每个样本2个特征,共产生4个簇,簇中心分别在[-2,-2], [0,0],[1,1], [3,3],簇方差分别为[0.4, 0.2, 0.2,0.2]。