聚类分析 -凯发k8网页登录
无监督学习方法,用于查找数据中的自然分组和模式
聚类分析,也称为分割分析或分类分析,可将样本数据分成一个个组(即簇)。同一簇中的对象是相似的,不同簇中的对象则明显不同。statistics and machine learning toolbox™ 提供了几种聚类方法和相似性测度(也称为距离测度)来创建簇。此外,簇计算可以按照不同的计算标准确定数据的最佳簇数。聚类可视化选项包括树状图和轮廓图。该工具箱还提供了几种异常检测方法来识别离群值和新奇值。
聚类分析基础知识
类别
生成一系列嵌套的簇
通过最小化均值距离或中心点距离进行聚类并计算马氏距离
通过使用 dbscan 算法来计算簇和离群值
使用基于图的算法计算簇
使用期望最大化算法,基于高斯混合模型进行聚类
使用穷举搜索或 kd 树搜索查找最近邻
用于生成数据的马尔可夫模型
检测离群值和新奇值
绘制数据簇并计算最佳簇数