上海生命科学研究院考研——专业课复习笔记分子遗传学资料篇

文件信息
文件来源	免费考研网
文件作者	免费考研网
更新时间	2005-9-7 22:53:15
添加编辑

辅助信息
打印功能	打印本文
背景颜色	杏黄秋褐胭红芥绿天蓝雪青炭灰奶白
字体大小	特大号字大号字中号字小号字
免责声明	本网站所有文章均来自网络，仅提供预览形式，不提供纸张形式，若涉及到版权的文章，请购买正版，毕竟在电脑上看也不舒服啊，呵呵，这是viewsnake个人网站，纯粹交流学习资料的地方。无商业行为。

选择更多免费考研资料：

阅读正文内容

分子遗传学常用词汇

※ 腺嘌呤Adenine(A)：一种碱基，和胸腺嘧啶T结合成碱基对。

※ 等位基因(Alleles)：同一个基因座位上的多种表现形式。一般控制同一个性状，比如眼睛的颜色等。

※ 氨基酸（Amino Acid）：共有20种氨基酸组成了生物体中所有的蛋白质。蛋白质的氨基酸序列和由遗传密码决定。

※ 扩增（Amplification）：对某种特定DNA片段拷贝数目增加的方法，有体内扩增和体外扩增两种。（参见克隆和PCR技术）

※ 克隆矩阵（Arrayed Library）：一些重要的重组体的克隆（以噬菌粒，YAC或者其他作载体），这些重组体放在试管中，排成一个二维矩阵。这种克隆矩阵有很多应用，比如筛选特定的基因和片段，以及物理图谱绘制等。从每种克隆得到的遗传连锁信息和物理图谱信息都输入到关系数据库中。

※ 自显影技术（Autoradiography）：使用X光片来显示使用放射性元素标记的DNA片段的位置，常用在使用凝胶将DNA片段按照片段大小分离之后，显示各个DNA片段的位置。

※ 常染色体(Autosome)：和性别决定无关的染色体。人是双倍体动物，每个体细胞中都含有46条染色体，其中22对是常染色体，一对是性染色体（XX或者XY）。

※ 噬菌体（Bacteriophage）：参见phage

碱基对(Base Pair，bp)：两个碱基（A和T，或者C和G）之间靠氢键结合在一起，形成一个碱基对。DNA的两条链就是靠碱基对之间的氢键连接在一起，形成双螺旋结构。

※ 碱基序列（Base sequence）：DNA分子中碱基的排列顺序。

※ 碱基序列分析（Base Sequence Analysis）：分析出DNA分子中碱基序列的方法（这种方法有时能够全自动化）

※ cDNA：参见互补DNA

※ 厘摩(cM)：一种度量重组概率的单位。在生殖细胞形成的减数分裂过程中，常常会发生同源染色体之间的交叉现象，如果两个标记之间发生交叉的概率为1％，那么它们之间的距离就定义为1cM。对人类来说，1cM大致相当于1Mbp。

※ 着丝点（Centromere）：在细胞的有丝分裂过程中，从细胞的两端发出纺锤丝，连接在染色体的着丝点上，将染色体拉向细胞的两级。

※ 染色体（Chromosome）：细胞核中能够自我复制的部分，包含承载遗传信息的DNA分子。原核生物中只有一个呈环状的染色体；而真核生物中一般包含多个染色体，每条染色体都由DNA和蛋白质构成。

※ 克隆库(Clone Bank)：参见基因组文库（genomic library）。

※ 克隆 (名词，Clones)：从同一个亲代细胞形成的一组细胞。

※ 克隆（动词，Cloning）：形成大量子细胞的无性繁殖过程，这些子细胞和亲代细胞完全相同，这个过程称为克隆。

※ 克隆载体（Cloning Vector）：通常采用从病毒、质粒或高等生物细胞中获取的DNA作为克隆载体，在载体上插入合适大小的外源DNA片段，并注意不能破坏载体的自我复制性质。将重组后的载体引入到宿主细胞中，并在宿主细胞中大量繁殖。常见的载体有质粒，噬菌粒，酵母人工染色体。

※ 互补DNA（cDNA）：以信使RNA为模板合成的DNA，常常采用互补DNA的一条链作为绘制物理图谱时的探针。

※ 互补序列（Complementary sequence）：以一条核苷酸链为模板，根据碱基互补规则形成的互补链，称为该模板的互补序列。

※ 保守序列（Conserved Sequence ）：指DNA分子中的一个核苷酸片段或者蛋白质中的氨基酸片段，它们在进化过程中基本保持不变。

※ 邻接图谱（Contig Map）：邻接图谱描述覆盖了整个染色体的小片段的顺序关系，这些小片段相互邻接，两个片段通过有重叠部分推断出两者相互邻接。

※ 邻接片段（Contigs）：染色体片段的克隆，两个片段通过有重叠部分推断出两者相互邻接

※ 噬菌粒（Cosmid）：人工构造的含有Lambda抗菌素的cos基因的克隆载体。噬菌粒能够引入到？？？Lambda抗菌素微粒中，然后注入到大肠杆菌中去，这样我们就可以将长达45kb的DNA片段引入到宿主细菌的质粒载体中。

※ 交叉（Crossing over）：在减数分裂时，来自父本的染色体和来自母本的染色体有时会发生断裂，然后交换断裂部分重新组合成新的染色体，这种交叉常常会导致等位基因的交换。

※ 胞嘧啶（Cytosine）：碱基的一种，和鸟嘌呤结合成碱基对C－G。

※ 双倍体（Diploid）：一整套遗传物质中包含成对的染色体，一条来自父本，一条来自母本。大多数动物的细胞（配子细胞除外）都含有双倍体的染色体。

脱氧核糖核酸DNA ：编码遗传信息的大分子。DNA是一种双链结构，两条链之间通过碱基对之间的氢键相互连接。相互配对的核苷酸之间有着严密的规则，因此我们能够通过一条链的顺序推断出另一条链的顺序。

※ DNA复制（replication）：以现有DNA的一条链为模板合成一条新的链。在人类和其他真核生物细胞中，DNA的复制在细胞核中进行。

※ DNA序列（sequence）：DNA片段、基因、染色体、基因组中的碱基排列顺序。

结构域（Domain）：蛋白质中一个有着特定功能的独立单元。多个结构域共同构成蛋白质的功能。

※ 双螺旋（Double Helix）：DNA的两条链互相缠绕在一起，形成一种双螺旋结构。

※ 大肠杆菌（E Coli）：细菌的一种。遗传学家对大肠杆菌研究得比较透彻，大肠杆菌的染色体比较小，通常没有致病性，易于培养。

※ 电泳技术（Electrophoresis）：分离大分子的一种方法，能够从一堆混杂在一起的DNA或者蛋白质中依据各个片段的大小将它们分开。一般在介质两端加电压，介质一端设有小槽，槽内放有待分离的大分子溶液，在电场的作用下，大分子会从一端向另一端运动，但是由于自身的大小或分子量的不同，它们的泳动速度是不同的，因此我们可以根据它们的位置将它们分离开来。常用的介质有琼脂糖和聚丙稀酰胺。

内切核酸酶（Endonuclease）：内切核酸酶能够在核酸底物的某个内部切点上切开。

※ 酶（Enzyme）：一种特殊的具有催化作用的蛋白质，它能够加快生化反应的速度，但是不改变反应的方向和产物。

※ 真核生物（Eukaryote）：细胞或生物自身有细胞膜包被，有结构独立的细胞核，以及发育完全的细胞器。除了病毒、细菌和蓝藻绿藻外，绝大多数生物都是真核生物。

※ 外显子（Exons）：基因中有编码蛋白质功能的部分。

※ 外切酶（Exonclease）：外切酶从DNA片段的自由端开始酶切。

※ 荧光原位杂交（FISH：fluorescence in situ hybridization）：荧光原位杂交方法是一种物理图谱绘制方法，使用荧光素标记探针，以检测探针和分裂中期的染色体或分裂间期的染色质的杂交。

※ 流式细胞术：根据细胞或者染色体的光吸收性和光发射性对材料进行分析的方法。

※ 配子（Gamete）：成熟的雄性或雌性生殖细胞（精子或卵子），只有单倍体的染色体。

※ 基因（Gene）：遗传的基本结构和功能单位。基因是特定染色体上特定位置的一段核苷酸片段，能够编码特定功能的蛋白质。

※ 基因表达（Gene Expression）：基因编码的信息转化为细胞结构并在细胞中行使功能的过程。包括转录成信使RNA接着翻译成蛋白质的基因，以及转录成RNA但是不翻译成蛋白质的基因。

※ 基因家族（Gene Families）：一组关系紧密，表达产物相似的基因。

※ 基因图谱（Gene Mapping）：在一个DNA分子上决定基因的顺序及其相互间的距离。包括遗传图谱和物理图谱。

※ 基因产物（Gene Product）：基因表达过程中形成的RNA或蛋白质。基因表达产物的多少常用来衡量一个基因的表达活性，如果一个基因的表达产物异常减少的话，这种基因产物的数量异常常常预示着疾病基因的存在。

※ 遗传密码（Genetic Code）：信使RNA上每三个一组的核苷酸序列，决定了蛋白质肽链上的一个氨基酸。DNA上的碱基序列控制形成信使RNA上的核苷酸序列，进而决定了蛋白质肽链上的氨基酸序列。

※ 遗传学（genetics）：研究特定性状的遗传行为的科学。

※ 基因组（Genome）：一种生物所有染色体上的遗传物质，称为基因组，基因组的大小常常采用碱基对的数目来表示。

基因组计划（Genome Project）：基因组计划的目标是绘制基因组的图谱，对基因组进行测序。

※ 基因组文库（Genomic Library）：对某个染色体，制备随机产生的、相互之间有重叠部分的片段的克隆。

※ 鸟嘌呤（Guanine）：碱基的一种，和胞嘧啶以氢键连接形成碱基对C-G.

※ 单倍体（Haploid）：单倍体细胞中只有一套染色体（是体细胞中的染色体数目的一半），比如动物的精子和卵子、植物的卵细胞和花粉都是单倍体细胞。

※ 杂和体（Heterozygosity）：同源染色体的某个位点上有不同的等位基因，这个细胞就称为杂和体。

※ Homeobox：很多基因中都会发现一些共同的碱基序列。对果蝇和人类的研究都发现了Homeobox的存在。在果蝇中存在一种Homeobox, 它能界定哪些基因在何时表达。。

※ 同源性（Homologies）：指同种类不同个体或者不同种类个体之间的，染色体或者蛋白质序列的相似性

※ 同源染色体（Homologous Chromosome）：一对染色体，分别来自父本和母本，染色体上有着相同的线性基因序列。

※ 基因治疗（Human Gene Therapy）：直接在细胞中引入正常的DNA以治疗遗传疾病的方法。

※ 人类基因组行动计划：是自1986年美国能源部领导的项目的总称。包括(1)：建立某个染色体的DNA片段的顺序（2）开发分析基因图谱和测序的算法（3）开发DNA检测和分析的新设备。现在的名称是人类基因组计划。而整个美国的有关工作则称为人类基因组项目，由美国能源部和国立卫生研究院共同领导。

※ 杂交（Hybridization）：两段互补的DNA单链，或者一段DNA单链和一段RNA依照碱基互补规则形成一条双链的过程。

※ 生物信息学（Informatics）：使用计算机和统计方法作为工具，管理从试验中得到的大量信息。生物信息学包括：数据库搜索的快速算法，对DNA的分析方法，从DNA序列来预测蛋白质的序列和结构。

※ 原位杂交（in situ hybridization）：使用DNA或者RNA探针来检测与其互补的另一条链在细菌或其他真核细胞中的位置。

分裂间期（interphase）：整个细胞周期中的一部分，在这个期间细胞完成染色体中DNA的复制和相关蛋白质的合成，染色体呈现出染色质的形态即长的细丝状。

※ 内含子（Introns）：基因中除了外显子，剩余的DNA序列就构成了内含子，内含子被转录成RNA，但是接着就被剪切掉，因此内含子不编码蛋白质。

※ 体外（in vitro）：在一个活体生物之外。比如DNA的体外复制，它不使用将外源DNA引入到宿主细胞内进行大量繁殖的方法。

※ 染色体组型（Karyotype）：描述一个生物体内所有染色体的大小、形状和数量信息的图象。这种组型技术可用来寻找染色体歧变同特定疾病的关系，比如：染色体数目的异常增加、形状发生异常变化等。

※ 文库（library）：从某条染色体上制取的DNA片段未经排序的克隆集合，克隆之间的顺序关系可以通过物理图谱来显示。

连锁关系（Linkage）：两个标记之间的邻接关系。如果两个标记间距离比较近的话，那么在减数分裂发生交叉，两个标记被分离的概率就比较小。

※ 连锁图谱（Linkage Map）：染色体上两个遗传位点之间相对位置的关系。两个位点之间的距离依据它们共同遗传的概率来确定。

※ 定位（Localize）：确定一个基因或者标记在染色体上的原始位置。

※ 位点（Locus：Loci as pl）：染色体上一个基因或者标记的位置。位点有时特指DNA上有表达功能的部分。

※ 酶切图谱（Macrorestriction Map）：描述限制性内切酶的酶切点的位置和距离信息的图谱。

※ 标记（Marker）：染色体上一个可以被识别的区域（比如限制性内切酶的酶切点，基因的位置等）。标记的遗传能够被检测出来。标记可以是染色体上有表达功能的部分（比如基因），也可以是没有编码蛋白质功能但遗传特性能够被检测出来的部分。

※ 减数分裂（Meiosis）：精母细胞或卵母细胞的染色体只复制一次，但是两次连续的分裂，最终产生4个子细胞，每个子细胞的染色体数目减半。

※ 信使RNA（MessengerRNA）：携带遗传信息，在蛋白质合成时充当模板的RNA。

四分体时期（Metaphase）：在有丝分裂和无丝分裂过程中，每条染色体经过复制都形成两条姐妹染色单体，这样两条同源染色体就包含4条染色单体，它们在纺锤丝的牵引下，排列在赤道板上。此时最适宜对染色体进行观察。

※ 有丝分裂（Mitosis）：细胞的一种繁殖方式，每个细胞都形成和亲代细胞两个完全相同的子细胞。

※ Multiplexing：一种同时采用多种样品的测序方法，能够大大提高测序速度。

※ 突变（Mutation）：DNA序列上任一种可以被遗传的变易。

※ 核苷酸（Nucleotide）：DNA和RNA的基本组成部分，通常包含一分子核糖，一分子磷酸和一分子碱基。多个核苷酸通过磷酸二酯键连接成一条链状。

※ 细胞核（Nucleos）：真核细胞中的一种细胞器，内含遗传物质。

癌基因（Oncogene）：一种能够导致癌症的基因。许多致癌基因都直接或间接地控制细胞的成长速度。

※ 噬菌体（phage）：一种以细菌为宿主细胞的病毒。

※ 物理图谱（Physics Map）：物理图谱描绘DNA上可以识别的标记的位置和相互之间的距离(以碱基对的数目为衡量单位)，这些可以识别的标记包括限制性内切酶的酶切位点，基因等。物理图谱不考虑两个标记共同遗传的概率等信息。对于人类基因组来说，最粗的物理图谱是染色体的条带染色模式，最精细的图谱是测出DNA的完整碱基序列。

※ 质粒（Plasmid）：质粒是细菌的染色体外能够自我复制的环状DNA分子。它能够和细胞核中的染色体明显地区别开来，而且并不是细胞生存的必要物质。一些质粒适宜于引入到宿主细胞中去，并利用宿主细胞的DNA大量繁殖，因此我们常常采用质粒作为外源DNA的载体，外源DNA借助于质粒在宿主细胞中大量繁殖。

※ 多基因病（Polygenic Disorder）：有多个基因位点共同决定的遗传病（如心脏病、糖尿病、一些癌症等）。这类疾病的遗传由多个基因位点共同控制，因而比单基因病的遗传更为复杂。

※ 多聚酶链式反应（PCR）：一种体外扩增DNA的方法。PCR使用一种耐热的多聚酶，以及两个含有20个碱基的单链引物。经过高温变性将模板DNA分离成两条链，低温退火使得引物和一条模板单链结合，然后是中温延伸，反应液的游离核苷酸紧接着引物从5‘端到3’端合成一条互补的新链。而新合成的DNA又可以继续进行上述循环，因此DNA的数目不断倍增。

※ 多聚酶（Polymerase）：多聚酶具有催化作用，能够加快游离的核苷酸和DNA模板结合形成新链的反应速度。

※ 多态性（Polymorphism）：多个个体之间DNA的差异称为多态性。DNA变异概率超过1％的变异，比较适宜作为绘制连接图谱的证据。

※ 引物（Primer）：预先制备的比较短的核苷酸链，在新链合成过程中作为引物，游离的核苷酸在引物之后按顺序和模板上的碱基结合，形成新链。

※ 原核生物（Prokaryote）：原核生物没有细胞膜，结构清晰的核以及其他细胞器。细菌是原核生物。

※ 探针（Probe）：是一条DNA单链或者一条RNA链，具有特定的序列，并且使用放射性元素或者免疫特性物质进行标记。探针和克隆库中的某条互补片段结合成一条双链结构，我们可以借助于探针的检测来获知与其互补的链的位置。

※ 启动子（Promoter）：DNA上的一个特定位点，RNA聚合酶在此和DNA结合，并由此开始转录过程。

※ 蛋白质（Protein）：一种由一条或者多条肽链构成的大分子。每条肽链上核苷酸的顺序是由基因外显子部分的碱基序列决定的。蛋白质是细胞、组织和器官的重要组成部分，每种蛋白质都具有特定的功能。酶、抗体和激素等都是蛋白质。

※ 嘌呤（Purine）：一种含氮的单环结构物。是核苷酸的重要组成部分，有腺嘌呤A和鸟嘌呤G两种。

※ 嘧啶（Pyrimidine）：一种含氮的双环结构，是核苷酸的重要组成部分。分为胞嘧啶C，胸腺嘧啶T和尿嘧啶U三种。

※ 重组克隆（Recombinant Clone）：将不同来源的DNA片段合成在一个DNA分子中，这种技术称为重组，得到的分子为重组克隆。

※ DNA重组技术（Recombinant DNA Technology）：在细胞体外将两个DNA片段连接成一个DNA分子的技术。在适宜的条件下，一个重组DNA分子能够被引入到宿主细胞中并在宿主细胞中大量繁殖。

※ 调控序列（regulatory regions and sequence）：一段控制基因表达的DNA片段。

※ 限制性内切酶（Restriction enzyme， endonuclease）：这种酶能够识别出DNA上特定的碱基序列，并在这个位点将DNA酶切。细菌中有400中限制性内切酶，能够识别出100中DNA序列。

※ 酶切位点（Restriction Enzyme cutting site）：DNA上一段碱基的特定序列，限制性内切酶能够识别出这个序列并在此将DNA酶切成两段。

※ 限制性长度多态性（Restriction fragment length polymorphsm）：从不同个体制备的DNA，使用同一种限制性内切酶酶切，切得的片段长度各不相同。酶切片段的长度可以作为物理图谱或者连接图谱中的标记子。通常是在酶切位点处发生突变而引发的。

※ 核糖核酸RNA（Ribonucleic acid）：从细胞的细胞核和细胞质部分分离出来的化学物质。在蛋白质合成和其他生化反应中起着重要作用，RNA的结构和DNA的结构类似，都是有核苷酸按照一定顺序排列成的长链。RNA可以分为信使RNA、转运RNA、核糖体RNA以及其他类型的RNA。

※ 核糖体RNA（Ribonsomal RNA rRNA）：存在于核糖体中的RNA。

※ 核糖体（Ribonsome）：细胞质中含有rRNA和相关蛋白质的细胞器，是蛋白质的合成场所。

序列位置标签（Sequence Tagged Site, STS）：一段短的DNA序列（200－500个碱基对），这种序列在染色体上只出现一次，其位置和碱基顺序都是已知的。在PCR反应中可以检测处STS来，STS适宜于作为人类基因组的一种地标，据此可以判定DNA的方向和特定序列的相对位置。ETS是cDNA上的STS。

※ 性染色体（Sex Chromosome）：在人类细胞中是X或者Y染色体，性染色体决定了个体的性别。雌性细胞中含有两个X染色体，而雄性细胞中含有1个X染色体和1个Y染色体。

※ 鸟枪法（Shotgun method）：使用基因组中的随机产生的片段作为模板进行克隆的方法。

※ 单基因病（Single Gene Disorder）：一个基因的等位基因之间发生了突变造成的疾病。

※ 体细胞（Somatic Cells）：个体中除了生殖细胞及其母细胞之外的细胞，都是体细胞。

※ 串联重复序列（Tandem repeat sequences）：在染色体上一段序列的多次重复，称为串联重复序列。常用来作为物理图谱中的标记子。

※ 端粒（Telomere）：是染色体的末端部分，这一特殊结构区域对于线型染色体的结构和稳定起重要作用。

※ 转录（Transcription）：以某一DNA链为模板，按照碱基互补原则形成一条新的RNA链的过程，是基因表达的第一步。

※ 转运RNA（tRNA）：转运RNA具有特殊的结构，其一端包含3个特定的核苷酸序列，能和信使RNA上的密码子按照碱基配对原则进行结合。另一端则带有一个氨基酸。因此转运RNA能够同细胞质中游离的氨基酸结合并运到核糖体上，核糖体按mRNA上的遗传信息将氨基酸装配成蛋白质。

※ 转化（Transformation）：将外源DNA整合到某一细胞基因组中的过程。。

※ 翻译（Translation）：mRNA上携带的遗传信息指导蛋白质的合成过程，称为翻译。

※ 病毒（Virus）：一种不具备细胞结构的生物体。只能寄生在宿主细胞中才能生存。病毒一般包含核酸以及外壳蛋白，有些动物的病毒的外面也偶尔覆盖一层细胞膜。病毒进入宿主细胞之后，利用宿主的合成机制复制出大量的后代。。

※ 酵母菌人工合成染色体（Yeast Artificial Chromosome）：一种能够克隆长达400Kb的DNA片段的载体，含有酵母细胞中必需的端粒、着丝点和复制起始序列。

(卜东波、伍树明翻译整理)

生物信息名词

§§§ BLAST （Basic Local Alignment Search Tool），基本的基于局部对准的搜索工具；一种快速查找与给定序列具有连续相同片断的序列的技术。

§§§ Entrez 美国国家生物技术信息中心所提供的在线资源检索器。该资源将GenBank序列与其原始文献出处链接在一起。

§§§ NCBI 美国国立生物技术信息中心（National Center for Biotechnology Information），1988年设立，为美国国家医学图书馆（NLM）和国家健康协会（NIH）下属部门之一。提供生物医学领域的信息学服务，如世界三大核酸数据库之一的GenBank数据库，PubMed医学文献检索数据库等。

§§§ Conserved sequence 保守序列。演化过程中基本上不变的DNA中的碱基序列或蛋白质中的氨基酸序列。

§§§ Domain 功能域。蛋白质中具有某种特定功能的部分，它在序列上未必是连续的。某蛋白质中所有功能域组合其起来决定着该蛋白质的全部功能。

§§§ EBI 欧洲生物信息学研究所（European Bioinformatics Institute）。 The National Center for Biotechnology Information (NCBI) at the NationalLibrary of Medicine (NLM), National Institutes of Health (NIH)

§§§ EMBL 欧洲分子生物学实验室（uropean Molecular Biology Laboratory）。

§§§ GenBank 由美国国家生物技术信息中心提供的核酸序列数据库。

§§§ Gene 基因。遗传的基本的物理和功能单位。一个基因就是位于某条染色体的某个位置上的核苷酸序列，其中蕴含着某种特定功能产物（如蛋白质或RNA分子）的编码。

§§§ DUST A program for filtering low complexity regions from nucleic acid sequences.

§§§ Gene expression 基因表达。基因中的编码信息被转换成行使特定功能的结构产物的过程。

§§§ Gene family 基因家族。一组密切相关的编码相似产物的基因。

§§§ Gene mapping 基因作图。对DNA分子（染色体或质粒）中基因的相对位置和距离进行确定的过程。

§§§ Genetic code 遗传密码。以三联体密码子的形式编码于mRNA中的核苷酸序列，决定着所合成蛋白质中的氨基酸序列。

Genome 基因组。某一物种的一套完整染色体组中的所有遗传物质。其大小一般以其碱基对总数表示。

§§§ Genomics 基因组学。从事基因组的序列测定和表征描述，以及基因活性与细胞功能关系的研究。

§§§ HGMP 英国剑桥的人类基因组绘图计划（Human Genome Mapping Project）。

§§§ Informatics 信息学。研究计算机和统计学技术在信息处理中的应用的学科。在基因组计划中，信息学的内容包括快速搜索数据库方法的开发、DNA序列信息分析方法的开发和从DNA序列数据中预测蛋白质序列和结构方法的开发。

§§§ Physical map 物理图谱。不考虑遗传，DNA中可识别的界标（如限制性酶切位点和基因等）的位置图。界标之间的距离用碱基对度量。对人类基因组而言，最低分辨率的物理图谱是染色体上的条带图谱；最高分辨率的物理图谱是染色体中完整的核苷酸序列。

§§§ Promoter 启动子。DNA中被RNA聚合酶结合并从此起始转录的位点。

§§§ Proteome 蛋白质组。一个基因组的全部蛋白产物及其表达情况。

§§§ Regulatory region or sequence 调控区或调控序列。控制基因表达的DNA碱基序列。

§§§ Ribosomal RNA 核糖体RNA。简写为rRNA。是一组存在于核糖体中的RNA分子。

§§§ Sequence tagged site 序列示踪位点，简写为STS。在人类基因组中只出现一次的位置和序列已知的长约200到500bp的短DNA序列片断。由于可以通过PCR检测到，STS在将来源于许多不同实验室的基因图谱和测序数据进行定位和定向时非常有用，并且STS在人类基因组的物理图谱中也具有界标的作用。表达的序列标签（ESTs）就是那些得自cDNAs的STSs。

§§§ Single-gene disorder 单基因病。由单个基因的等位基因的突变所导致的遗传病（如杜兴肌营养不良和成视网膜细胞瘤等）。

§§§ UniGene 美国国家生物技术信息中心提供的公用数据库，该数据库将GenBank中属于同一条基因的所有片断拼接成完整的基因进行收录。

§§§ 非蛋白质编码区（“Junk”DNA）占据了人类基因组的大部分，研究表明“Junk”是许多对生命过程富有活力的不同类型的DNA的复合体，它们至少包括以下类型的DNA成份或由其表达的RNA成分：内含子（intron）、卫星（Satellite）DNA、小卫星（minisatellite）DNA、微卫星（microsatellite）DNA、非均一核RNA（hmRNA）、短散置元（short interspersed elements）、长散置元（long interspersed elements）、伪基因（pseudogenes）等。除此之外，顺式调控元件，如启动子、增强子等也属于非编码序列。

双重序列对比两序列间的对比分析。最常见的方法为Needle-Wunsch方法。能够利用的软件如BLAST、FASTA等。

§§§ Autosome 常染色体。与性别决定无关的染色体，人双倍体染色体组含有46条染色体，其中22对常染色体，一对与性别决定有关的性染色体（X和Y染色体）。

sex chromosome. 包括序列（核酸与蛋白）搜索，结构比较，结构预测，蛋白质域，模体（Motif ），测序，发育与进化分析，双向电泳成像分析，质谱蛋白质鉴定，三维蛋白结构模建与成像，基因组图谱比较，基因预测，非编码区功能位点识别，基因组重叠群集装，后基因组功能分析，结构基因组学以及药物基因组学等等。

在BLAST2.0，2.05新版中启用了gapped BLAST、PSI-BLAST 和PHI-BLAST。gapped BLAST是比原BLAST 更灵敏更快的局部相似联配（俗称局部同源）搜索法；PSI- BLAST用迭代型的剖面打分算法，每次迭代所费时间与前者相同，它可检索弱同源的目标；PHI-BLAST 98年刚出台，是模体（Motif ）构造与搜索软件，是更灵敏的同源搜索软件。例如线虫§§§ 的CED4是apoptosis 的调控蛋白，含有涉及磷酸结合的P 环模体，在各种ATP 酶和GTP 酶中可发现。在用gapped BLAST搜索NR数据库时，CED4仅跟人凋亡调控蛋白Apaf-1显著同源或相似（其中含有P-loop保守区）。但PHI- BLAST搜索，另有一个显著同源（E=0.038 ）目标，是植物抗病蛋白Arabidopsis thaliana T7N9.18，证实此动物与植物蛋白确实在apoptosis 中有相似的功能。另有，按PHI- BLAST搜索在MutL DNA修复蛋白中的ATP 酶域，II型拓扑异构酶，组氨酸激酶和HS90家族蛋白，发现一个新的真核蛋白族，共有HS90型ATP 酶域。再有在古核tRNA核苷酸转移酶中发现核苷酸转移酶域，在细菌DNA 引物酶的古核同源体中发现螺旋酶超家族II的模体VI。用以往的搜索法这些是得不到的。

深层事项：

后基因组时期的主要任务：Data mining ，即从完全测序的基因组中预测功能。

1 、序列、结构和功能自分子生物学产生以来，均相信序列决定结构，结构决定功能。随着基因组学的发展，对此理解已有长足的深化。同源序列（具有共同祖先）未必具有相同的功能；相同功能未必源自同源序列。相异序列可能有相似的结构；序列与结构不相似的蛋白可能会有相似的功能。现在发现存在不相似（在序列与结构水平上）酶催化相同的生化反应。当然亦存在甚至结构水平上很相似的酶催化不同的生化反应。例如人与鼠的3?- 羟甾类脱氢酶，1AHH和1RAL；前者是Rossmann折叠，而后者是TIM-桶。肯定，这些相似酶不是共同祖先趋异的结果，而是不同祖先趋同的结果。如结构决定功能还是合理的，那么至少在功能活性位点具有相似结构特征（即3D- 功能模体）。属于今后研究的课题，对了解酶催化机制与功能蛋白的小分子模拟具有很大价值。何谓功能？功能有层次的：表型的，细胞的和分子的。目前开始高层功能预测，分子相互作用、代谢途径和调控网络。目前，已从结构基因组学，功能基因组学和蛋白质组学多种角度研究基因组功能。

2 、结构基因组学中的生物信息学希望大通量地测定和模建完全测序基因组的全部蛋白三维结构。生物信息学可以发挥作用，一方面规划好测定的对象，另一方面可靠地模建结构。

3 、功能基因组学中的生物信息学美国HGP 已编制1998-2003 的新五年计划。提出八项目标：其中目标7 特指生物信息学和计算生物学，其实几乎每项目标都要生物信息学，例如目标4 功能基因组学中的非编码区功能位点预测，基因表达分析（如DNA Chip）以及蛋白质全局分析（如蛋白质组学）。

§§§ 蛋白质组学（Proteomics）

1.蛋白质组学研究的目的和任务 20世纪中期以来，随着DNA双螺旋结构的提出和蛋白质空间结构的X射线解析，开始了分子生物学时代，对遗传信息载体DNA和生命功能的主要体现者蛋白质的研究，成为生命科学研究的主要内容。90年代初期，美国生物学家提出并实施了人类基因组计划，预计用15年的时间，30亿美元的资助，对人类基因组的全部DNA序列进行测定，希望在分子水平上破译人类所有的遗传信息，即测定大约30亿碱基对的DNA序列和识别其中所有的基因（基因组中转录表达的功能单位）。经过各国科学家8年多的努力，人类基因组计划已经取得了巨大的成绩，一些低等生物的DNA全序列已被阐明，人类3%左右DNA的序列也已测定，迄今已测定的表达序列标志（EST）已大体涵盖人类的所有基因。在这样的形势下，科学家们认为，生命科学已经入了后基因组时代。在后基因组时代，生物学家们的研究重心已经从解释生命的所有遗传信息转移到在整体水平上对生物功能的研究。这种转向的第一个标志就是产生了一门成为功能基因组学（Functional Genomics）的新学科。它采用一些新的技术，如SAGE、DNA芯片，对成千上万的基因表达进行分析和比较，力图从基因组整体水平上对基因的活动规律进行阐述。但是，由于生物功能的主要体现者是蛋白质，而蛋白质有其自身特有的活动规律，仅仅从基因的角度来研究是远远不够的。例如蛋白质的修饰加工、转运定位、结构变化、蛋白质与蛋白质的相互作用、蛋白质与其它生物分子的相互作用等活动，均无法在基因组水平上获知。正是因为基因组学（Genomics）有这样的局限性，于90年代中期，在人类基因组计划研究发展及功能基因组学的基础上，国际上萌发产生了一门在整体水平上研究细胞内蛋白质的组成及其活动规律的新兴学科——蛋白质组学（Proteomics），它以蛋白质组（Proteome）为研究对象。蛋白质组是指“由一个细胞或一个组织的基因组所表达的全部相应的蛋白质”。测定一个有机体的基因组所表达的全部蛋白质的设想，萌发在1975年双向凝胶电泳发明之时。1994年Williams正式提出了这个问题，而“蛋白质组”的名词则是由Wilkins创造的，发表在1995年7月的Electrophoresis杂志上。蛋白质组与基因组相对应，但二者又有根本不同之处：一个有机体只有一个确定的基因组，组成该有机体的所有不同细胞斗拱享用一个确定的基因组；而蛋白质组则是一个动态的概念，她不仅在同一个机体的不同组织和细胞中不同，在同一机体的不同发育阶段，在不同的生理状态下，乃至在不同的外界环境下都是不同的。正是这种复杂的基因表达模式，表现了各种复杂的生命活动，每一种生命运动形式，都是特定蛋白质群体在不同时间和空间出现，并发挥功能的不同组合的结果。基因DNA的序列并不能提供这些信息，再加上由于基因剪接，蛋白质翻译后修饰和蛋白质剪接，基因遗传信息的表现规律就更加复杂，不再是经典的一个基因一个蛋白的对应关系，一个基因可以表达的蛋白质数目可能远大于一。对细菌，可能为1.2～1.3;对酵母则为3;而对人,可高达10。后基因组和蛋白质组研究，是为阐明生命活动本质所不可缺少的基因组研究的远为复杂的后续部分，无疑将成为21世纪生命科学研究的主要任务。

相关阅读内容

<<<返回上一页 <<<返回网站首页
<<<您的位置:首页>考研经验>考研笔记>生命医学笔记>正文