分类

数据挖掘通讲：分类算法

Apr 14, 2026 · 9 分钟阅读 · 分类数据挖掘算法 ·
分享到:

考试情况： 1.题目形式没有较大的变化，填空题目数量有增加。如果填空题较多一定注意考试时间。 2.论述题上，目前几次去考试。题目都是集中在聚类和集成算法上。 3.z-scale(特征缩放),scale。推荐使用这种方式进行解答from sklearn.preprocessing import scale 4.能够掌握具体的方法的使用再去考试。 5.多去看sklearn的文档数据挖掘流程：读取数据：数据预处理：缺失值处理()、异常值处理、特征缩放()、特征离散化、特征编码()、特征选择()、特征降维(***)。拆分数据：分类：数据拆分聚类：不拆分数据建模：分类、聚类模型评估：分类模型评估(交叉验证)、聚类模型评估模 …

阅读更多
数据挖掘通讲：分类算法

Apr 11, 2026 · 8 分钟阅读 · 分类数据挖掘算法 ·
分享到:

1import pandas as pd 2import numpy as np 3import warnings 4warnings.filterwarnings('ignore') 1.读取除表头外的前五行\读取数据前五行 1df = pd.read_csv('./titanic_trains.csv',encoding='utf8') 2df.head(5) 3df.shape (891, 12) 2.缺失值处理(没有要求就遵循80%原则) 2.1.查看缺失值情况，输出缺失值比例、列名、缺失值数量 1for x in df.columns: 2 zb = df[x].isnull().sum()/df.shape[0]*100 …

阅读更多