Newtank

个人站

欢迎来到我的个人站~


聚类方法

目录

层次方法

分割式:初始为一个大类,逐渐分解为多个子类

合并式:初始各自为类,逐渐合并为稳定的大类

有BIRCH、CURE等方法

模型方法

根据概率估计来分类

每个簇有一个模型。

生成模型:

  • 选择簇的概率
  • 生成一个簇内对象的概率

根据似然或MAP模型选择最大概率

使用EM算法

聚类评估:测试集的似然概率

神经网络

神经元:簇

层:类型层次

密度方法

发现高密度的地方,然后把高密度的点连成一片,从而发现簇

DBSCAN

方式:在某个点以某个半径画圆,得到领域。数领域里有多少点,点的数量称为密度值。当密度达到阈值时,则这个点为高密度点。

如果一个高密度点出现在另一个高密度点的圈内,则它们可以连接起来。这些互相连接的高密度点和其圈组成一个簇。