Clarity
open-menu closeme
首页
编程语言 icon
Java Python Pandas教程 SciPy教程
AI icon
机器学习 CS229课程 深度学习
前端 icon
HTML/CSS
数据科学 icon
数据分析 数据结构与算法
系统与网络 icon
操作系统 计算机网络 数据库
其他 icon
音视频技术 面试
归档
关于
  • 数据挖掘通讲:分类算法

    calendar Apr 14, 2026 · 9 分钟阅读 · 分类 数据挖掘 算法  ·
    分享到: twitter facebook linkedin copy

    考试情况: 1.题目形式没有较大的变化,填空题目数量有增加。如果填空题较多一定注意考试时间。 2.论述题上,目前几次去考试。题目都是集中在聚类和集成算法上。 3.z-scale(特征缩放),scale。推荐使用这种方式进行解答from sklearn.preprocessing import scale 4.能够掌握具体的方法的使用再去考试。 5.多去看sklearn的文档 数据挖掘流程: 读取数据: 数据预处理:缺失值处理()、异常值处理、特征缩放()、特征离散化、特征编码()、特征选择()、特征降维(***)。 拆分数据: 分类:数据拆分 聚类:不拆分数据 建模:分类、聚类 模型评估: 分类模型评估(交叉验证)、聚类模型评估 模 …


    阅读更多
  • 数据挖掘通讲:分类算法

    calendar Apr 11, 2026 · 8 分钟阅读 · 分类 数据挖掘 算法  ·
    分享到: twitter facebook linkedin copy

    1import pandas as pd 2import numpy as np 3import warnings 4warnings.filterwarnings('ignore') 1.读取除表头外的前五行\读取数据前五行 1df = pd.read_csv('./titanic_trains.csv',encoding='utf8') 2df.head(5) 3df.shape (891, 12) 2.缺失值处理(没有要求就遵循80%原则) 2.1.查看缺失值情况,输出缺失值比例、列名、缺失值数量 1for x in df.columns: 2 zb = df[x].isnull().sum()/df.shape[0]*100 …


    阅读更多

Jane Doe

Technologist, perpetual student, teacher, continual incremental improvement.
阅读更多

最新文章

  • 1 Array Creation Routines
  • 1 Array Creation Routines Solution
  • 1.numpy Beginner
  • 1.scipy Intro
  • 10 Minutes To Pandas
  • 10 Random Sampling
  • 10 Random Sampling Solutions
  • 10.scipy Spatial

分类

PYTHON 165 编程语言 92 机器学习 48 AI 39 JAVA 26 PYTHON标准库 26 PYTHON教程 25 NUMPY教程 23 THEANO教程 19 PYTHON面向对象编程 13 MATPLOTLIB教程 10 SCIPY教程 10 CYTHON教程 8 数据挖掘 7
所有分类
AI39 C++1 CYTHON教程8 HTML-CSS2 JAVA26 MATPLOTLIB教程10 NUMPY教程23 PANDAS教程3 PYTHON165 PYTHON标准库26 PYTHON教程25 PYTHON面向对象编程13 SCIPY教程10 SYNTAX1 THEANO教程19 编程语言92 操作系统6 机器学习48 计算机视觉2 计算机网络2 面试4 前端2 深度学习2 数据分析5 数据结构与算法7 数据可视化4 数据库1 数据挖掘7 数学2 音视频技术6 云计算/运维1
[A~Z][0~9]

专栏

DATAMINING 18 数据挖掘 18 THEMES GUIDE 1

标签

PYTHON 204 NUMPY 53 SCIPY 20 THEANO 19 打卡 18 OOP 13 MATPLOTLIB 11 PANDAS 11 算法 8 数据分析 7 数据挖掘 7 CYTHON 6 多媒体 6 机器学习 6
所有标签
ANACONDA1 BASEMAP1 C++1 CARTOPY1 CLASSMETHOD1 CNN2 COLLECTIONS1 CS2292 CSV1 CTYPES1 CYTHON6 C库1 C语言1 DATETIME1 DECORATOR1 DF1 DROP1 EVAL1 FUNCTOOLS1 GLOB1 GPU1 GZIP1 HTTP1 HUGO1 IPYTHON2 ITERTOOLS1 JSON1 LAMBDA1 LOGGING1 MATLAB1 MATPLOTLIB11 MEMORYVIEWS1 NBA1 NNET1 NUMPY53 OOP13 OPERATOR1 ORM1 OS1 PANDAS11 PICKLE1 PPRINT1 PYTHON204 RE1 REQUESTS1 SCIPY20 SDL1 SHUTIL1 SOFTMAX1 SQL1 STRING1 SUPER1 SYS1 TARFILE1 TD1 TH1 THEANO19 WITH1 YIELD1 ZIPFILE1 阿里巴巴1 编程1 编译1 标准库3 插值1 打卡18 地图2 迭代器1 动态执行1 对象1 对象模型1 多媒体6 多重继承1 访问控制1 分类2 分片1 封装格式2 赋值1 共享单车2 股票3 函数2 机器学习6 积分1 集合2 计算机视觉2 继承1 建模1 接口1 金庸1 警告1 聚类4 矩阵2 卷积1 卷积神经网络1 考试1 科学计算1 可视化5 扩展模块2 类1 列表2 流媒体协议1 逻辑回归1 面向对象1 命名空间1 模块1 模拟1 配置2 奇异值分解2 曲线拟合1 缺失1 日期时间1 日志1 入门1 上下文管理器1 深度学习5 神经网络1 生成器1 视频编码1 视频解码1 手写数字识别2 输出1 属性1 数据分析7 数据格式1 数据结构1 数据可视化1 数据库2 数据类型2 数据挖掘7 数学表达式1 数字1 算法8 随机数1 索引1 特殊方法1 特征向量2 条件判断1 条件语句1 统计学1 图表1 图结构1 图例1 图像处理1 外部库1 微分方程1 文本1 文件1 文件IO1 文件操作1 稀疏矩阵2 线性代数4 线性回归1 性能1 性能分析1 序列化1 循环3 样式1 异常1 音频编码1 音视频6 优化1 元组1 张量2 张量操作1 正则表达式1 重构1 注释1 装饰器2 字典1 字符串2 作用域1
[A~Z][0~9]
Copyright © 2008–2018, Steve Francia and the Hugo Authors; all rights reserved.

Copyright  COPYRIGHT © 2008–2018, STEVE FRANCIA AND THE HUGO AUTHORS; ALL RIGHTS RESERVED.. All Rights Reserved

to-top