![fb89fb9232e82dee8f523fd650080fa3.png](https://img-blog.csdnimg.cn/img_convert/fb89fb9232e82dee8f523fd650080fa3.png)
基础知识
首先我们了解一些基础知识(注:文中图片皆可点击放大查看!):
启动子(promoter):与RNA聚合酶结合并能起始mRNA合成的序列。转录起始点(TSS):转录时,mRNA链第一个核苷酸相对应DNA链上的碱基,通常为一个嘌呤。
UTR(Untranslated Regions):即非翻译区,是信使RNA(mRNA)分子两端的非编码片段。 5'-UTR从mRNA起点的甲基化鸟嘌呤核苷酸帽延伸至AUG起始密码子,3'-UTR从编码区末端的终止密码子延伸至多聚A尾巴(Poly-A)的末端。
![9a611fddfacd773dbf88c8b99dda13e6.png](https://img-blog.csdnimg.cn/img_convert/9a611fddfacd773dbf88c8b99dda13e6.png)
1查找基因的启动子区域-NCBI
1. 打开PubMed:https://www.ncbi.nlm.nih.gov/pubmed
![18b7007ca4b036581d80961a0689a626.png](https://img-blog.csdnimg.cn/img_convert/18b7007ca4b036581d80961a0689a626.png)
2. 选择Gene,输入IL17A,点击search,结果如下图,点击第一个:
![73db9e56abcee3e0faadbe4abab4d7f3.png](https://img-blog.csdnimg.cn/img_convert/73db9e56abcee3e0faadbe4abab4d7f3.png)
3. 下拉到下图位置,可以看到该基因的以下信息:
![cad8fd044be36045cbc6c43fee97edf0.png](https://img-blog.csdnimg.cn/img_convert/cad8fd044be36045cbc6c43fee97edf0.png)
点击Tools,选择Sequence Text View:
![99162fae5a7540084032c950b12ac94c.png](https://img-blog.csdnimg.cn/img_convert/99162fae5a7540084032c950b12ac94c.png)
还可以看到如下序列信息:
![0ddefd2530820fb7930b4ec411b2620d.png](https://img-blog.csdnimg.cn/img_convert/0ddefd2530820fb7930b4ec411b2620d.png)
4. 以上只是该基因的一些信息,可以用于查找相应的UTR等区域,下面进入正题,寻找promoter区域。还是拉到如下图位置,点击FASTA:
![1933f73df7c07f1ea7fa0bc9ced4a1f9.png](https://img-blog.csdnimg.cn/img_convert/1933f73df7c07f1ea7fa0bc9ced4a1f9.png)
5. 基因位置信息如下图:
![2263aa5ccd998be0589b8bb62640fc40.png](https://img-blog.csdnimg.cn/img_convert/2263aa5ccd998be0589b8bb62640fc40.png)
6. 一般认为基因上游2 kb区域为该基因的promoter区域,所以将基因上游2 kb序列调出来:
![2cd83448a5c16f2994a5ac5825e8cd1f.png](https://img-blog.csdnimg.cn/img_convert/2cd83448a5c16f2994a5ac5825e8cd1f.png)
7. 复制上述序列就是基因的启动子序列了。
2查找基因的启动子区域-UCSC
1. 打开UCSC:http://www.genome.ucsc.edu/,点击Table Browser:
![3c7a94cecfb4c38bcc23fda86cc62cdc.png](https://img-blog.csdnimg.cn/img_convert/3c7a94cecfb4c38bcc23fda86cc62cdc.png)
2. 按照下图所示填好基因相关信息,点击get output:
![9df7357335160c7411db9b85e2c330e5.png](https://img-blog.csdnimg.cn/img_convert/9df7357335160c7411db9b85e2c330e5.png)
3.选择genomic:
![88fa650eae6ce5c4e1e4ec348628d75e.png](https://img-blog.csdnimg.cn/img_convert/88fa650eae6ce5c4e1e4ec348628d75e.png)
4. 勾选Promoter/Upstream by选项,并将其改为2000 bases,然后点击get sequence:
![f75a4517eb8ed958f41387429b68c6e8.png](https://img-blog.csdnimg.cn/img_convert/f75a4517eb8ed958f41387429b68c6e8.png)
5. 得到下面的序列信息,开头直到第一个大写字母前面的所有小写字母序列即为该基因的promoter序列,你可以跟NCBI上得到的序列比对一下,看看是不是一样的呢?
![21f60591bf62c7fd71a77fc772ba43aa.png](https://img-blog.csdnimg.cn/img_convert/21f60591bf62c7fd71a77fc772ba43aa.png)
6. 当然查找promoter的网站有很多,比如UCSC,在这里就不介绍了,大家可以自行探索,或者加小编微信amateur_1988交流。
3转录因子结合位点的预测
1. 打开http://jaspar.genereg.net/(我这边这个网址暂时打不开了,所以我登录了这个网址:http://jaspardev.genereg.net/),输入转录因子NFAT,点击Quick Search:
![e91fbd98051890e1b65db0914b911bb8.png](https://img-blog.csdnimg.cn/img_convert/e91fbd98051890e1b65db0914b911bb8.png)
2. 将promoter序列粘贴进入右下角的框中,选中左侧转录因子,点击SCAN:
![9623dbabf3c6ab6b962f7a10298521f5.png](https://img-blog.csdnimg.cn/img_convert/9623dbabf3c6ab6b962f7a10298521f5.png)
3. 得到28条转录因子NFAT与IL17A的结合位点,其中Strand -1没有特殊意义,只需选择Strand 1即可。
![94cac541a68e636470188b309af00557.png](https://img-blog.csdnimg.cn/img_convert/94cac541a68e636470188b309af00557.png)
4. 好了,转录因子与promoter结合位点已经有了,接下来就是愉快的通过实验验证了!Luciferase、点突变、截短、ChIP等统统拉上来就可以了!
文章转自微信公众号科研小助手