單拷貝序列在單倍體基因組中只出現一次或數次,因而復性速度很慢。單拷貝序列在基因組中占50-80%,如人基因組中,大約有60-65%的序列屬于這一類。單拷貝序列中儲存了巨大的遺傳信息,編碼各種不同功能的蛋白質。目前尚不清楚單拷貝基因的確切數字,但是是有其在單拷貝序列中只有一小部份用來編碼各種蛋白質,其他部份的功能尚不清楚。
在基因組中,單拷貝序列的兩側往往為散在分布的重復序列。由于某些單拷貝序列編碼蛋白質,體現了生物的各種功能,因此對這些序列的研究對醫學實踐有特別重要的意義。但由于其拷貝數少,在DNA重組技術出現以前,要分離和分析其結構和序列幾乎是不可能的,現在人們通過基因重組技術可以獲得大量欲研究的基因,并對許多結構基因進行了較為細致的研究。現在已經知道,真核生物的結構基因不僅在兩側有非編碼區,而且在基因內部也有許多不編碼蛋白質的間隔序列(intervening sequences),稱為內含子(intron),而編碼區則稱為外顯子(exon)。內含子與外顯子相間排列,轉錄時一起被轉錄下來,然后RNA中的內含子被切掉,外顯子連接在一起成為成熟的mRNA作為指導蛋白質合成的模板)斷裂基因含有外顯子和內含子,轉錄成RNA后經過剪接切除內含子成熟為mRNA。