查找生物序列-Motif

  • Updated
Download Icon Download

查找与查询序列匹配的生物序列,可直接输入蛋白/核苷酸序列进行检索。

  1. 输入或复制粘贴蛋白质/核苷酸序列。见 Motif Patterns
  2. 根据被输入的序列类型选择Sequence Type 
  3. 勾选Include NCBI Sequences 的复选框,在检索结果中包含NCBI数据库中的序列。
  4. 通过total sequence result limit 限定检索结果数量,结果数量的选择范围为10-20000(默认数量为100)。
  5. 通过Advanced Biosequence Search,更改 Query Coverage %E-Value设置,同时可勾选Combine Motif Results 将所有变量查询式的检索结果进行合并。
  6. 点击Start Biosequence Search 开始序列检索。

SF-SequenceSearch-Motif.png

然后返回主页面,查看每个检索的完成状态或点击 View Results 查看结果。

重要提示:生物序列检索结果在首次生成之日起 30 天后到期。

SF-SequenceSearch-Motif-RecentSearchHistory-ViewResult.png

 

Motif 简并码和正则表达式语法规则

氨基酸简并码

为氨基酸创建正向评分错配(例如,带有 B 的序列检索将保留 B,B 将对命中目标序列中的 D 或 N 产生正向评分)。

Degenerate Code

Logical Meaning

X

Any amino acid

B

D or N

Z

E or Q

J

I or L

 

核苷酸简并码

查询多个核苷酸,其中简并密码由其代表的核苷酸替换。

Degenerate Code

Logical Meaning

N

A or C or G or T

R

A or G

Y

C or T

M

A or C

K

G or T

S

C or G

W

A or T

H

A or C or T

B

C or G or T

V

A or C or G

D

A or G or T

 

正则表达式语法规则

Degenerate Code

Logical Meaning

.

Translated to X for protein

Enumerates to A, G, C, and T for nucleotide (generates four search terms)

{m,n}

At least m and maximum n residues length

{n}

Exactly n length

[XYZ]

Any nucleotide or amino acid listed within the square brackets

^XYZ$

Search for the exact sequence XYZ