层次方法
分割式:初始为一个大类,逐渐分解为多个子类
合并式:初始各自为类,逐渐合并为稳定的大类
有BIRCH、CURE等方法
模型方法
根据概率估计来分类
每个簇有一个模型。
生成模型:
- 选择簇的概率
- 生成一个簇内对象的概率
根据似然或MAP模型选择最大概率
使用EM算法
聚类评估:测试集的似然概率
神经网络
神经元:簇
层:类型层次
密度方法
发现高密度的地方,然后把高密度的点连成一片,从而发现簇
DBSCAN
方式:在某个点以某个半径画圆,得到领域。数领域里有多少点,点的数量称为密度值。当密度达到阈值时,则这个点为高密度点。
如果一个高密度点出现在另一个高密度点的圈内,则它们可以连接起来。这些互相连接的高密度点和其圈组成一个簇。