边界点
定义
边界点是拓扑空间的基本概念之一,边界概念是康托尔(Cantor,G.(F.P.))在研究欧几里得空间的子集情形时首先引入的。边界点及边界的定义如下:
注:将A的全部内点组成的集合记为Ao,则有
举例
例1 设A=[-1,0)∪{1/n | n∈N},则
例2 考虑有理点集Q,则
拓展
边界点处理在数据挖掘技术中有重要意义,它们代表了一类归属并不明确的个体,如果单纯地依靠某种方法把其归类到一个特定的簇中,其效果往往适得其反。边界点不同于孤立点和噪声点。孤立点是一类在统计上处于少数地位的对象,噪声点是一类对统计产生干扰或者偏离一定分布的对象,它们通常位于数据空间的低密区域中,而边界点则不同,它们是数据空间中处于高密区域边沿的一类数据对象,它们的一侧是高密区域,一侧是相对的低密区域。
聚类技术的研究是近几年研究的一个热点,已经提出的许多聚类算法,但是,对聚类边界模式的探讨还不多。聚类的边界点是指位于高密聚类边沿的一类数据对象,它代表了游离在两个或多个类别之间的一类个体对象,其归属并不明确,它们常常具有两个或两个以上的聚类特徵。边界点研究有着重要的套用价值。
定义 边界点(Boundary point):一个边界点p是指满足下列两个条件的数据对象:
(1)它位于一个高密的区域IR;
(2)p的附近存在一个区域IR’,Density(IR) >> Density(IR’),或者Density(IR) << Density(IR’)。
聚类的边界代表了一种潜在的模式,对数据挖掘的着重要的意义。但是目前涉及的边界的算法并不多,对其的研究远远不够。
本文由'修永丶小可爱'发布,不代表演示站立场,转载/删除联系作者,如需删除请-> 关于侵权处理说明。