物质的相似性检索会产生一组与您的查询结构最相似的候选物质,并将候选物质按相似度分值范围分组。相似度分值使用Tanimoto相似性度量进行二维小分子对比。
Tanimoto 相似性度量根据 CAS 结构描述符 (structure descriptors) 获分配一个分值,公式如下:
Score = (100 * C)/((QS + FS) - C)
其中:
C = 查询结构和结果集结构共有的描述符数量
QS = 查询结构中的描述符数量
FS = 结果集结构中的描述符数量
结构描述符
物质相似度分值是根据以下结构描述符来计算的:
- 原子数
- 环数
- 原子排序(Atom sequence)
- 键的排序(Bond sequence)
- 增强原子(Augmented atoms)
- 连接度
- 元素组成
- 环的类型
相关结构评分
结构描述符不包括立体或同位素标记、氢原子(带电氢除外)或非氢原子上的电荷等数据,因此对于仅因这些结构特征而不同的结构,其相似度分值相同。
多组分物质
在与查询结构对比时,多组分物质中的每个组分都会被分配一个分值。分配给任何组分的最高分值被用作该多组分物质的分值。