什么是相似度分值?

  • Updated
Download Icon Download

物质的相似性检索会产生一组与您的查询结构最相似的候选物质,并将候选物质按相似度分值范围分组。相似度分值使用Tanimoto相似性度量进行二维小分子对比。

Tanimoto 相似性度量根据 CAS 结构描述符 (structure descriptors) 获分配一个分值,公式如下:

Score = (100 * C)/((QS + FS) - C)

其中:

C = 查询结构和结果集结构共有的描述符数量
QS = 查询结构中的描述符数量
FS = 结果集结构中的描述符数量

结构描述符

物质相似度分值是根据以下结构描述符来计算的:

  • 原子数
  • 环数
  • 原子排序(Atom sequence)
  • 键的排序(Bond sequence)
  • 增强原子(Augmented atoms)
  • 连接度
  • 元素组成
  • 环的类型

相关结构评分

结构描述符不包括立体或同位素标记、氢原子(带电氢除外)或非氢原子上的电荷等数据,因此对于仅因这些结构特征而不同的结构,其相似度分值相同。

多组分物质

在与查询结构对比时,多组分物质中的每个组分都会被分配一个分值。分配给任何组分的最高分值被用作该多组分物质的分值。