scikit-learn中的一个数据集make_blobs参数说明

  • 发布日期:2019-10-25
  • 难度:简单
  • 类别:聚类分析、数据集说明
  • 标签:Python、sklearn.datasets、make_blobs

1. 问题描述

基于Python第三方库sklearn,选择make_blobs数据集的参数说明。

2. 程序实现

In [1]:
#导入数据集语句
from sklearn.datasets.samples_generator import make_blobs
#调用该方法的一个具体实例
centers = [[1, 1], [-1, -1], [-1, 1]]
X, labels_true = make_blobs(n_samples=1000, centers=centers, cluster_std=0.4,random_state=0)

选择1000个样本,确定3个具体的中心点(1,1),(-1,-1)和(-1,1),聚类标准差设为0.4。

  • X为样本特征,labels_true为样本簇类别。
  • n_samples为样本个数。
  • centers为簇中心,分别在[1,1],[-1,-1],[-1,1]。
  • cluster_std为浮点数或浮点序列,默认值为1,代表各个类别的标准差。