查找与查询序列匹配的生物序列,可直接输入蛋白/核苷酸序列进行检索。
- 输入或复制粘贴蛋白质/核苷酸序列。见 Motif Patterns。
- 根据被输入的序列类型选择Sequence Type 。
- 勾选Include NCBI Sequences 的复选框,在检索结果中包含NCBI数据库中的序列。
- 通过total sequence result limit 限定检索结果数量,结果数量的选择范围为10-20000(默认数量为100)。
- 通过Advanced Biosequence Search,更改 Query Coverage %和E-Value设置,同时可勾选Combine Motif Results 将所有变量查询式的检索结果进行合并。
- 点击Start Biosequence Search 开始序列检索。
然后返回主页面,查看每个检索的完成状态或点击 View Results 查看结果。
重要提示:生物序列检索结果在首次生成之日起 30 天后到期。
Motif 简并码和正则表达式语法规则
氨基酸简并码
为氨基酸创建正向评分错配(例如,带有 B 的序列检索将保留 B,B 将对命中目标序列中的 D 或 N 产生正向评分)。
Degenerate Code |
Logical Meaning |
X |
Any amino acid |
B |
D or N |
Z |
E or Q |
J |
I or L |
核苷酸简并码
查询多个核苷酸,其中简并密码由其代表的核苷酸替换。
Degenerate Code |
Logical Meaning |
N |
A or C or G or T |
R |
A or G |
Y |
C or T |
M |
A or C |
K |
G or T |
S |
C or G |
W |
A or T |
H |
A or C or T |
B |
C or G or T |
V |
A or C or G |
D |
A or G or T |
正则表达式语法规则
Degenerate Code |
Logical Meaning |
. |
Translated to X for protein Enumerates to A, G, C, and T for nucleotide (generates four search terms) |
{m,n} |
At least m and maximum n residues length |
{n} |
Exactly n length |
[XYZ] |
Any nucleotide or amino acid listed within the square brackets |
^XYZ$ |
Search for the exact sequence XYZ |