聚类

聚类算法分析

Apr 14, 2026 · 2 分钟阅读 · 聚类机器学习算法 ·

1import pandas as pd 1from sklearn.datasets import make_blobs #足球数据 1 # 数据量列数类别标准差随机种子 2X, y = make_blobs(n_samples=150, n_features=4, centers=3) 1data = pd.DataFrame(data=X) 2data[4] =y 1data 0 1 2 3 4 0 -8.317893 0.698439 -10.349959 4.291286 0 1 -5.663915 7.060548 0.330762 4.576624 1 2 -9.276754 1.625037 …

数据挖掘通讲：聚类算法

Apr 14, 2026 · 4 分钟阅读 · 聚类数据挖掘算法 ·

分享到:

考试情况： 1.大多时候以填空题的形式出现，但是也出现过要自己完整编写的情况。 2.读取数据、特征缩放、建模(kmeans、birch、SpectralClustering)、建模时会使用枚举法调参，建模时同时会进行模型评估(轮廓系数、兰德系数)、绘图(折线图、3D散点图) 3.正式建模之前一定确保数据没有缺失值、并且数据没有object类型 1注意点： 2 1.birch、SpectralClustering这两个算法非常耗资源可能考试环境中的资源不足，运行时会内存溢出，找监考老师。和她说不运行只截图是否可以。 1.读取数据 1import pandas as pd 2import numpy as np 1df = …

聚类算法分析

Apr 11, 2026 · 2 分钟阅读 · 聚类机器学习算法 ·

分享到:

1import pandas as pd 1from sklearn.datasets import make_blobs #足球数据 1 # 数据量列数类别标准差随机种子 2X, y = make_blobs(n_samples=150, n_features=4, centers=3) 1data = pd.DataFrame(data=X) 2data[4] =y 1data 0 1 2 3 4 0 -8.317893 0.698439 -10.349959 4.291286 0 1 -5.663915 7.060548 0.330762 4.576624 1 2 -9.276754 1.625037 …

数据挖掘通讲：聚类算法

Apr 11, 2026 · 4 分钟阅读 · 聚类数据挖掘算法 ·

分享到:

1注意点： 2 1.birch、SpectralClustering这两个算法非常耗资源可能考试环境中的资源不足，运行时会内存溢出，找监考老师。和她说不运行只截图是否可以。 1.读取数据 1import pandas as pd 2import numpy as np 1df = pd.read_csv('./data.csv',encoding='gbk') 2df.head() 客户编号套餐品牌信用等级是否使用4GUSIM卡是否4G资费网龄当月ARPU 当月MOU 当月DOU 视频流量 \ 0 10942 2 5 0 1 204 2201.08 2611 54557 22 1 13382 2 5 0 0 201 …