DNA

Từ VLOS
Bước tới: chuyển hướng, tìm kiếm

Tập tin:DNA Structure+Key+Labelled.pn NoBB.png
Cấu trúc của chuỗi xoắn kép DNA. Các nguyên tử với màu sắc khác nhau đại diện cho các nguyên tố và chi tiết cấu trúc bổ sung cặp base thể hiện bên phải.
Tập tin:DNA orbit animated.gif
Cấu trúc của một đoạn xoắn kép DNA.

DNA (viết tắt từ thuật ngữ tiếng Anh Deoxyribonucleic acid), trong tiếng Việt gọi là Axit đêôxiribônuclêic (phiên âm từ tiếng Pháp Acide désoxyribonucléique, viết tắt ADN), là phân tử mang thông tin di truyền mã hóa cho hoạt động sinh trưởng, phát triển, chuyên hóa chức năng và sinh sản của các sinh vật và nhiều loài virus. DNA và RNA là những axit nucleic; cùng với protein, lipid và những cacbohydrat cao phân tử (polysaccharide), chúng là một trong bốn loại đại phân tử chính có vai trò quan trọng thiết yếu đối với mọi dạng sống được biết đến. Phần lớn các phân tử DNA được cấu tạo từ hai mạch polyme sinh học xoắn đều quanh một trục tưởng tượng tạo thành chuỗi xoắn kép.

Hai mạch DNA này được gọi là các polynucleotide vì thành phần của chúng bao gồm các đơn phân nucleotide.[1][2] Mỗi nucleotide được cấu tạo từ một trong bốn loại nucleobase chứa nitơ—hoặc là cytosine (C), guanine (G), adenine (A), hay thymine (T)—liên kết với đường deoxyribose và một nhóm phosphat. Các nucleotide liên kết với nhau thành một mạch DNA bằng liên kết cộng hóa trị giữa phân tử đường của nucleotide với nhóm phosphat của nucleotide tiếp theo, tạo thành "khung xương sống" đường-phosphat luân phiên vững chắc.

Những base nitơ giữa hai mạch đơn polynucleotide liên kết với nhau theo nguyên tắc bổ sung (A liên kết với T, và C liên kết với G) thông qua các mối liên kết hydro để tạo nên chuỗi DNA mạch kép. Tổng số lượng cặp base liên quan tới DNA trên Trái Đất ước tính bằng 5,0 x 1037, và nặng khoảng 50 tỷ tấn.[3] Để so sánh, tổng khối lượng của sinh quyển xấp xỉ bằng 4 nghìn tỷ tấn cacbon.[4]

DNA lưu trữ thông tin sinh học, các mã di truyền đến các thế hệ tiếp theo và để chỉ dẫn cho quá trình sinh tổng hợp protein. Mạch đơn DNA có liên kết hóa học vững chắc chống lại sự phân cắt, và hai mạch đơn của chuỗi xoắn kép lưu trữ thông tin sinh học như nhau. Thông tin này được sao chép nhờ sự phân tách hai mạch đơn. Một tỷ lệ đáng kể DNA (hơn 98% ở người) là các đoạn DNA không mã hóa (non-coding), nghĩa là những vùng này không giữ vai trò mạch khuôn để xác định trình tự protein thông qua các quá trình phiên mã, dịch mã.

Hai mạch DNA chạy song song theo hai hướng ngược nhau. Gắn với mỗi phân tử đường là một trong bốn loại nucleobase (hay các base). Thông tin di truyền được mã hóa bởi trình tự của bốn nucleobase gắn trên mỗi mạch đơn. Những mạch RNA được tổng hợp từ những khuôn mẫu DNA trong quá trình phiên mã. Và dưới sự chỉ dẫn của mã di truyền, phân tử RNA tiếp tục được diễn dịch để xác định trình tự các axit amino ở cấu trúc protein trong quá trình dịch mã.

DNA ở tế bào nhân thực (động vật, thực vật, nấm nguyên sinh vật) được lưu trữ bên trong nhân tế bào và một số bào quan, như ty thể hoặc lục lạp.[5] Ngược lại, ở sinh vật nhân sơ (vi khuẩn vi khuẩn cổ), do không có nhân tế bào, DNA nằm trong tế bào chất. Bên trong tế bào, DNA tổ chức thành những cấu trúc dài gọi là nhiễm sắc thể (chromosome). Trong giai đoạn phân bào các nhiễm sắc thể hình thành được nhân đôi bằng cơ chế nhân đôi DNA, mang lại cho mỗi tế bào có một bộ nhiễm sắc thể hoàn chỉnh như nhau. Ở nhiễm sắc thể sinh vật nhân thực, những protein chất nhiễm sắc (chromatin) như histone giúp thắt chặt và tổ chức cấu trúc DNA. Chính cấu trúc thắt chặt này sẽ quản lý sự tương tác giữa DNA với các protein khác, quy định vùng nào của DNA sẽ được phiên mã.

Friedrich Miescher đã cô lập được DNA lần đầu tiên vào năm 1869. Francis Crick James Watson nhận ra cấu trúc phân tử chuỗi xoắn kép của nó vào năm 1953, dựa trên mô hình xây dựng từ dữ liệu thu thập qua ảnh chụp nhiễu xạ tia X do Rosalind Franklin thực hiện. DNA trở thành một công cụ phân tử giúp các nhà nghiên cứu khám phá các lý thuyết và định luật vật lý sinh học, như định lý ergodic và lý thuyết đàn hồi. Những tính chất vật liệu độc đáo của DNA biến nó trở thành phân tử hữu ích đối với các nhà khoa học vật liệu quan tâm trong lĩnh vực chế tạo vật liệu cỡ micro và nano, như trong công nghệ nano DNA. Các tiến bộ trong lĩnh vực này bao gồm phương pháp origami DNA và vật liệu lai dựa trên DNA.[6]

Cấu trúc[sửa]

DNA là một polyme dài cấu tạo bởi các đơn phân nucleotide lặp lại.[7][8] Cấu trúc DNA của mọi loài là không tĩnh (non-static),[9] chứa hai mạch polynucleotide xoắn đều quanh một trục tưởng tượng theo chiều từ trái sang phải (xoắn phải), mỗi một vòng xoắn (khoảng 10,4 cặp nucleotide) dài 34 ångström (3,4 nm) và có bán kính 10 ångström (1,0 nm).[10] Theo một nghiên cứu khác, khi đo đạc trong những dung dịch đặc biệt, chuỗi phân tử DNA rộng từ 22 đến 26 ångström (2,2 đến 2,6 nm), và một đơn vị nucleotide dài 3,3 Å (0,33 nm).[11] Dù cho mỗi đơn vị lặp lại có kích thước rất nhỏ, polyme DNA vẫn có thể là những phân tử rất lớn chứa hàng triệu nucleotide. Ví dụ, DNA trong nhiễm sắc thể lớn nhất ở người, nhiễm sắc thể số 1, chứa xấp xỉ 220 triệu cặp base[12] và dài đến 85 mm nếu được duỗi thẳng.

Tập tin:Nucleotide nucleoside general vi.svg
Phân biệt cấu trúc nucleoside và nucleotide.

Trong những sinh vật sống, DNA thường không tồn tại như một phân tử đơn lẻ, mà thay vào đó là một cặp phân tử liên kết chặt khít với nhau.[10][13] Hai mạch dài này quấn vào nhau như dây leo, tạo thành hình xoắn ốc kép. Một nucleobase liên kết với một phân tử đường tạo thành cấu trúc gọi là nucleoside, và một base liên kết với một phân tử đường và một hoặc nhiều nhóm phosphat gọi là nucleotide (nucleotide trong DNA và RNA là loại nucleotide chỉ mang một nhóm phosphat). Mạch polyme chứa nhiều nucleotide gắn kết với nhau (như trong DNA) được gọi là polynucleotide.[14] Mỗi nucleotide chứa cả hai thành phần đường và nhóm phosphat đóng vai trò khung xương cho phân tử (giữ cho các đơn phân của mạch liên kết với nhau), và chứa nucleobase để tương tác với mạch DNA còn lại trong chuỗi xoắn kép thông qua hệ thống liên kết hydro.

Khung xương chính của mạch DNA hình thành từ các nhóm phosphat phân tử đường luân phiên nhau.[15] Phân tử đường trong DNA là 2-deoxyribose, một loại đường pentose (5 cacbon). Các phân tử đường liên kết với nhau thông qua trung gian nhóm phosphat tạo thành liên kết phosphodieste giữa nguyên tử cacbon thứ 3 với nguyên tử cacbon thứ 5 trên hai mạch vòng của hai phân tử đường kế cận. Liên kết bất đối xứng này cho phép xác định hướng chạy của mạch đơn DNA. Xem xét gần hơn trên một chuỗi xoắn kép, người ta nhận thấy các nucleotide hướng theo một chiều trên một mạch và theo chiều ngược lại trên mạch kia, gọi là: hai mạch hướng ngược chiều nhau hay đối song song (antiparallel). Các đầu không đối xứng kết thúc của chuỗi DNA là đầu 5′ (năm phẩy) và đầu 3′ (ba phẩy), với đầu 5′ kết thúc bởi nhóm phosphat và đầu 3′ kết thúc bởi nhóm hydroxyl (OH). Sự khác nhau chủ yếu giữa DNA và RNA là ở phân tử đường, với đường 2-deoxyribose trong DNA được thay thế bởi đường ribose trong RNA.[13]

Tập tin:DNA Overview.png
Một phần của DNA. Các base nằm ngang giữa hai mạch xoắn.[16] (phiên bản ảnh động).

Hai mạch xoắn của chuỗi DNA được gắn ổn định bởi hai lực liên kết chính: liên kết hydro giữa các nucleotide của hai mạch và tương tác chồng chất (base-stacking) giữa các base thơm.[17] Trong môi trường dung dịch của tế bào, [[liên kết pi|liên kết ]] liên hợp của các base nucleotide sắp xếp vuông góc với trục của phân tử DNA, giảm thiểu tương tác của chúng với lớp vỏ solvat hóa (solvation shell), và do vậy làm giảm năng lượng tự do Gibbs. Bốn base trong DNA là adenine (viết tắt A), cytosine (C), guanine (G) và thymine (T). Bốn base này gắn với nhóm đường/phosphat để tạo thành nucleotide hoàn chỉnh, như adenosine monophosphate. Adenine ghép cặp với thymine và guanine ghép cặp với cytosine, ký hiệu bằng các cặp base A-T và G-C.[18][19]

Phân loại nucleobase[sửa]

Các nucleobase được phân thành hai loại: purine, gồm adenine (A) và guanine (G), là hợp chất dị vòng có hai vòng 5 và 6 nguyên tử cacbon gắn với nhau; và pyrimidine, gồm cytosine (C) và thymine (T), là hợp chất dị vòng có 6 nguyên tử cacbon.[13] Một nucleobase pyrimidine thứ năm là uracil (U), thay thế cho thymine (T) trong RNA và khác với thymine do thiếu đi một nhóm metyl (–CH3) trên vòng của nó. Ngoài RNA và DNA, một số lượng lớn axit nucleic nhân tạo tương tự được tạo ra để nghiên cứu các tính chất của axit nucleic, hoặc sử dụng trong công nghệ sinh học.[20]

Uracil thường không có ở DNA, nó chỉ xuất hiện như một sản phẩm phân tách của cytosine. Tuy nhiên, ở một số thực khuẩn thể – thực khuẩn Bacillus subtilis PBS1 và PBS2 và thực khuẩn Yersinia piR1-37 – thymine được thay bằng uracil.[21] Một thực khuẩn thể khác - thể Staphylococcal S6 - được phát hiện với bộ gen mà thymine thay bằng uracil.[22]

Base J (beta-d-glucopyranosyloxymethyluracil), một dạng tinh chỉnh của uracil, cũng xuất hiện ở một số sinh vật: trùng roi Diplonema Euglena, và mọi nhóm Kinetoplastida.[23] Sinh tổng hợp base J diễn ra theo hai bước: bước thứ nhất một thymidine xác định trong DNA được biến đổi thành hydroxymethyldeoxyuridine (HOMedU); bước thứ hai HOMedU được glycosyl hóa thành base J.[24] Các nhà khoa học cũng khám phá ra những protein được tổng hợp từ base này.[25][26][27] Những protein này dường như có họ hàng xa với gen gây ung thư (oncogene) Tet1 mà tham gia vào quá trình phát sinh bệnh bạch cầu myeloid cấp tính.[28] Base J cũng đóng vai trò làm tín hiệu kết thúc cho enzyme RNA polymerase II.[29][30]

Tập tin:DNA-ligand-by-Abalone.png
Rãnh lớn và rãnh nhỏ trên phân tử DNA. Rãnh nhỏ là một vị trí liên kết với chất nhuộm màu Hoechst 33258.

Rãnh DNA[sửa]

Hai mạch đơn xoắn đôi vào nhau tạo thành bộ khung cho DNA. Ở chuỗi xoắn kép này có thể xuất hiện những khoảng trống nằm cách nhau giữa hai mạch gọi là các rãnh (groove). Những rãnh này nằm liền kề với các cặp base và có thể hình thành một điểm bám (binding site). Vì hai mạch đơn không đối xứng nhau nên dẫn đến các rãnh có kích thước không đều, trong đó rãnh lớn (major groove) rộng 22 Å và rãnh nhỏ (minor groove) rộng 12 Å.[31] Độ rộng của rãnh giúp cho các cạnh của base trở nên dễ tiếp cận hơn trong rãnh lớn so với rãnh nhỏ. Kết quả là, các protein của các nhân tố phiên mã mà liên kết với những đoạn trình tự cụ thể trong chuỗi xoắn kép DNA thường thực hiện bằng việc tiếp xúc với các cạnh của các base ở rãnh lớn.[32] Tình huống này thay đổi đa dạng tùy theo hình dáng bất thường của DNA bên trong tế bào (xem ở dưới), nhưng các rãnh lớn và rãnh nhỏ luôn luôn được đặt tên để phản ánh sự khác nhau về kích thước đo được nếu DNA vặn xoắn trở về dạng B thường gặp.

Cặp base[sửa]

Xem chi tiết: Cặp base

Trong chuỗi xoắn kép DNA, mỗi loại nucleobase trên một mạch chỉ liên kết với một loại nucleobase trên mạch kia. Đây được gọi là nguyên tắc bổ sung cặp base. Ở đây, purine hình thành liên kết hydro với pyrimidine, trong đó adenine chỉ ghép với thymine bằng hai liên kết hydro, và cytosine chỉ ghép với guanine bằng ba liên kết hydro. Sự bố trí giữa hai nucleotide liên kết với nhau qua chuỗi xoắn kép gọi là một cặp base. Vì liên kết hydro không phải là liên kết cộng hóa trị, nên có thể bị đứt ra và nối lại tương đối dễ dàng. Hai mạch của DNA trong chuỗi xoắn kép do vậy có thể tách rời nhau ra giống như khóa kéo, hoặc bằng lực cơ học hoặc bằng nhiệt độ cao.[33] Hệ quả của nguyên tắc bổ sung này là mọi thông tin trong trình tự chuỗi xoắn kép DNA được lặp lại ở mỗi mạch, và có vai trò quan trọng trong giai đoạn sao chép DNA. Nói chung, trình tự lặp lại ngược chiều giữa hai mạch và những tương tác liên kết bổ sung trong các cặp base là tối quan trọng đối với mọi chức năng của DNA trong cơ thể sống.[8]

282px
282px
Hình trên, cặp base G-C liên kết bằng ba liên kết hydro. Hình dưới, cặp base A-T liên kết bằng hai liên kết hydro. Liên kết hydro không phải là liên kết cộng hóa trị và được thể hiện bằng các nét chấm nhỏ.

Hai loại cặp base khác nhau bởi số liên kết hydro giữa các base, cặp A-T có 2 liên kết hydro và cặp G-C có 3 liên kết hydro. Những phân tử DNA chứa nhiều cặp G-C sẽ ổn định hơn so với những phân tử chứa ít cặp G-C.

Như miêu tả ở trên, hầu hết phân tử DNA bao gồm hai mạch polyme liên kết thành dạng xoắn kép bởi liên kết không phải là liên kết cộng hóa trị; cấu trúc mạch kép này (dsDNA - double stranded DNA) cũng được duy trì chủ yếu bởi những tương tác chồng chất pi giữa các base trên hai mạch, mà mạnh nhất là ở cấu trúc chồng chất G,C (tương tác chồng chất pi là những tương tác không cộng hóa trị giữa các vòng thơm mang liên kết pi liên hợp). Hai mạch có thể tách nhau ra – một quá trình gọi là nóng chảy – để tạo thành hai phân tử DNA mạch đơn (ssDNA - single-stranded DNA). Sự phân tách xảy ra ở nhiệt độ cao, độ mặn thấp và độ pH cao (độ pH thấp cũng làm tách DNA, nhưng vì DNA trở nên không ổn định do axit bị khử purine hóa (bản chất DNA là một loại axit), do đó độ pH thấp ít khi được sử dụng).

Sự ổn định của dạng mạch kép dsDNA không chỉ phụ thuộc vào thành phần G-C (tỷ lệ % cặp base G-C) mà còn phụ thuộc vào trình tự các base (do tương tác chồng chất pi giữa các base là một thuộc tính đặc hiệu của trình tự) và độ dài (phân tử càng dài thì càng ổn định). Độ ổn định được đo bằng nhiều cách khác nhau; cách phổ biến là đưa phân tử đạt tới "nhiệt độ nóng chảy", đó là nhiệt độ mà tại đấy khoảng 50% số phân tử ds biến đổi thành phân tử ss; nhiệt độ nóng chảy phụ thuộc vào cường độ ion và sự đông đặc của DNA. Do vậy, cả tỷ lệ phần trăm số cặp base G-C và chiều dài tổng thể của chuỗi xoắn kép DNA xác định nên cường độ liên kết giữa hai mạch DNA. Những chuỗi xoắn kép DNA dài với thành phần nhiều G-C có tương tác giữa hai mạch mạnh hơn so với những chuỗi xoắn kép ngắn với thành phần nhiều A-T.[34] Trong hoạt động sinh học, có những phần của chuỗi xoắn kép DNA dễ dàng tách ra khi cần thiết, ví dụ như hộp Pribnow TATAAT ở một số vùng khởi động (promoter), có xu hướng chứa nhiều thành phần A-T, khiến cho các mạch có thể phân tách dễ dàng.[35]

Trong phòng thí nghiệm, cường độ của tương tác này có thể đo bằng cách tìm ra nhiệt độ cần thiết để phân cắt liên kết hydro giữa hai mạch, hay chính là nhiệt độ nóng chảy của chúng (được kí hiệu là Tm, nghĩa là melting temperature (nhiệt độ nóng chảy)). Khi tất cả các cặp base tách rời nhau, hai mạch của chuỗi DNA sẽ tách rời và tồn tại trong dung dịch như các phân tử độc lập. Những phân tử mạch đơn DNA (ssDNA) không có hình dạng chung, nhưng một số có thể thu về những dạng ổn định tùy theo độ dài và thành phần cặp base.[36]

Có nghĩa và đối nghĩa[sửa]

Xem chi tiết: Nghĩa (sinh học phân tử)

Một trình tự DNA gọi là "có nghĩa" (sense) nếu trình tự của nó giống với trình tự của bản sao RNA thông tin dùng để dịch mã thành protein.[37] Khi đó, trình tự trên mạch bổ sung còn lại được gọi là trình tự "đối nghĩa" (antisense). Cả trình tự có nghĩa và đối nghĩa có thể tồn tại trên các đoạn khác nhau của cùng một mạch đơn DNA (tức là cả hai mạch có thể chứa cả trình tự có nghĩa lẫn đối nghĩa). Ở tế bào nhân thực và nhân sơ, các trình tự RNA đối nghĩa đều được tạo ra, nhưng chức năng của những RNA này vẫn chưa được hiểu rõ hoàn toàn.[38] Có đề xuất cho rằng các RNA đối nghĩa có khả năng tham gia vào hoạt động điều hòa biểu hiện gen thông qua sự bổ sung base RNA-RNA.[39]

Một vài trình tự DNA ở sinh vật nhân thực và nhân sơ, và hay gặp hơn ở plasmid virus, xóa nhòa sự khác biệt giữa những mạch có nghĩa và đối nghĩa do có sự hiện diện của các gen chồng lợp (overlapping gene).[40] Trong trường hợp này, một số trình tự DNA đảm nhận đến hai trách nhiệm, mã hóa cho một protein khi đọc dọc theo một mạch, và mã hóa protein thứ hai khi đọc theo hướng ngược lại dọc theo mạch kia. Trong vi khuẩn, sự chồng lợp này có thể tác động đến quá trình điều hòa phiên mã gen,[41] trong khi ở virus, các gen chồng lợp lại làm tăng lượng thông tin được mã hóa bên trong bộ gen nhỏ bé của virus.[42]

DNA siêu xoắn[sửa]

Xem chi tiết: DNA siêu xoắn

DNA có thể xoắn lại tựa như một sợi dây thừng theo một tiến trình gọi là DNA siêu xoắn (DNA supercoiling). Với DNA ở trạng thái "bình thường", một mạch thường xoắn đều quanh trục tưởng tượng của chuỗi xoắn kép theo từng đoạn ngắn mang khoảng 10,4 cặp base, nhưng nếu DNA bị vặn xoắn thì các mạch có thể trở nên siết chặt hơn hoặc lỏng lẻo hơn.[43] Nếu DNA bị xoắn theo hướng của chuỗi xoắn kép, hay siêu xoắn thuận (positive supercoiling), thì các base giữ chặt với nhau hơn. Còn nếu DNA bị xoắn ngược hướng với chuỗi xoắn kép, hay siêu xoắn nghịch (negative supercoiling), thì các base phân tách dễ dàng hơn. Trong tự nhiên, hầu hết DNA trong tế bào đều ở trạng thái gần siêu xoắn nghịch do chịu sự tác động của nhóm enzyme có tên gọi topoisomerase.[44] Những enzyme này cũng cần thiết để tháo xoắn các mạch DNA trong những quá trình như phiên mã nhân đôi DNA.[45]

Tập tin:Dnaconformations.png
Từ trái qua phải, các cấu trúc của DNA dạng A, B và Z.

Những mô hình cấu trúc DNA[sửa]

DNA có thể tồn tại ở nhiều cấu hình, trong đó bao gồm A-DNA, B-DNA, và Z-DNA, mặc dù chỉ có cấu hình B-DNA và Z-DNA trực tiếp quan sát thấy trong những sinh vật chuyên hóa chức năng.[15] Cấu hình mà DNA tuân theo phụ thuộc vào mức độ hydrat hóa, trình tự DNA, số cặp base và chiều hướng siêu xoắn, cộng với những tu sửa hóa học trên các base, thành phần và hàm lượng ion kim loại, cũng như sự hiện diện của các polyamin trong dung dịch.[46]

Báo cáo đầu tiên về ảnh chụp tán xạ tia X của dạng A-DNA và B-DNA sử dụng phương pháp phân tích dựa trên hàm Patterson chỉ cung cấp thông tin giới hạn về cấu trúc của các sợi định hướng trong DNA.[47][48] Một hướng phân tích khác, do Wilkins cùng cộng sự (et al.) đề xuất vào năm 1953, cho các phần chụp nhiễu xạ-tán xạ tia X đối với B-DNA in vivo (trong cơ thể sống thí nghiệm) của các sợi DNA hydrat hóa cao độ tuân theo những hạng tử bình phương trong hàm Bessel.[49] Trong cùng tạp chí, James Watson Francis Crick trình bày mô hình phân tử DNA của họ sau khi phân tích các hình ảnh nhiễu xạ tia X và gợi ra rằng cấu trúc của nó có dạng chuỗi xoắn kép.[10]

Dạng B-DNA là cấu hình phổ biến nhất tìm thấy dưới những điều kiện của tế bào sống,[50] tồn tại ở trạng thái gần giống tinh thể (paracrystalline state), đó là cấu hình động mặc dù tính tương đối cứng của chuỗi xoắn kép DNA được giữ ổn định bởi liên kết hydro giữa các base. Để đơn giản, hầu hết những mô hình phân tử DNA đều bỏ qua liên kết động lực của nước và các ion đối với phân tử dạng B-DNA, và do đó ít hữu ích khi dùng các mô hình này để hiểu cách hoạt động của B-DNA trong tế bào sống ở trạng thái bình thường (in vivo).[51] Phân tích vật lý và toán học của ảnh chụp tia X[52][53] cũng như dữ liệu quang phổ thu được cho dạng B-DNA tiền tinh thể (paracrystalline), do vậy phức tạp hơn so với dữ liệu nhiễu xạ tia X của ảnh chụp dạng A-DNA.

So với B-DNA, dạng A-DNA xoắn ốc theo chiều tay phải rộng hơn về đường kính, với một rãnh nhỏ nông hơn và rộng hơn, trong khi rãnh lớn sâu hơn và hẹp hơn. Dạng A thường xuất hiện dưới các điều kiện phi sinh lý, đặc biệt trong các mẫu DNA mất nước một phần, trong khi ở tế bào nó có thể ở dạng lai ghép mạch đơn DNA với mạch đơn RNA, cũng như xuất hiện cả ở phức hệ enzyme-DNA.[54][55] Ở đoạn DNA nơi các base đã bị tinh sửa về mặt hóa học bằng phương pháp metyl hóa có thể trải qua sự thay đổi lớn về hình dạng cấu hình và trở thành dạng Z-DNA. Ở cấu hình đây, hai mạch xoắn quanh trục theo chiều tay trái, ngược chiều với hướng của dạng B phổ biến.[56] Những cấu trúc bất thường này có thể nhận ra bằng một loại protein đặc hiệu liên kết với Z-DNA và các protein này có thể tham gia vào hoạt động điều hòa quá trình phiên mã.[57]

Đặc điểm cấu trúc của ba cấu hình chính DNA[58][59][60]
Ghi chú: bp là cặp base (base pair)
Đặc tính hình học A-DNA B-DNA Z-DNA
Chiều xoắn phải phải trái
Đường kính ≈ 2,3 nm ≈ 2,0 nm ≈ 1,8 nm
Đơn vị lặp lại 1 bp 1 bp 2 bp
Góc quay/bp 32,7° 34,3° 60°/2
Số bp trung bình/vòng xoắn 11 10,4 12
Độ nghiêng của bp so với trục +19° -1,2° -9°
Độ dài dốc/bp dọc theo trục 0,23 nm 0,332 nm 0,38 nm
Bước/vòng xoắn 2,82 nm 3,32 nm 4,56 nm
Góc xoắn trung bình giữa hai bp +18° +16°
Góc glycosyl anti anti Pyrimidine: anti
Purine: syn
Chế độ gấp phân tử đường
(sugar puckering)
C3'-endo C2'-endo Pyrimidine: C2'-endo
Purine: C3'-endo
Rãnh lớn hẹp và sâu rộng và sâu, độ sâu: 0,85 nm phẳng
Rãnh nhỏ rộng và phẳng hẹp và sâu, độ sâu: 0,75 nm hẹp và sâu

DNA có thành phần hóa học thay thế[sửa]

Trong một vài năm, các nhà sinh học vũ trụ đã đề xuất về một sinh quyển bóng tối (shadow biosphere), một sinh quyển vi sinh vật giả thuyết tồn tại trên Trái Đất mà sử dụng các quá trình phân tử và hóa học khác căn bản so với những gì đã biết về sự sống hiện tại. Một trong các đề xuất đó là sự tồn tại của dạng sinh vật sống mà nguyên tử asen thay cho phospho trong DNA. Một báo cáo năm 2010 cho thấy khả năng này có mặt trong vi khuẩn GFAJ-1,[61][61][62] mặc dù đã có những tranh cãi,[62][63] và cuối cùng năm 2012 một báo cáo khác nêu ra bằng chứng cho thấy các vi khuẩn này chủ động ngăn không cho asen kết hợp vào bộ khung DNA của nó và những phân tử sinh học khác.[64]

Cấu trúc bộ bốn[sửa]

Tại đầu mút của mỗi nhiễm sắc thể là những vùng đặc hiệu của DNA gọi là telomere. Chức năng chính của nhóm vùng này đó là cho phép tế bào thực hiện sao chép những đầu mút nhiễm sắc thể sử dụng enzyme telomerase, bởi vì bình thường các enzyme sao chép DNA không thể nhân đôi đến đầu 3′ tận cùng của nhiễm sắc thể.[65] Những đầu mút đặc hiệu này của nhiễm sắc thể cũng giúp bảo vệ DNA bị rút ngắn sau mỗi lần nhân đôi, và cho dừng hệ thống sửa chữa DNA trong tế bào khi hệ thống này coi DNA bị hỏng và cần được sửa chữa.[66] Trong tế bào người, các telomere thường là những mạch đơn DNA dài chứa vài nghìn trình tự TTAGGG lặp đi lặp lại.[67]

Tập tin:Parallel telomere quadruple.png
Cấu trúc bộ bốn DNA hình thành bằng những đoạn telomere lặp lại. Hình dạng vòng của bộ khung DNA nhìn rất khác so với dạng xoắn ốc của DNA điển hình. Những hình cầu xanh lục ở giữa đại diện cho các ion kali.[68]

Các trình tự giàu guanine có khả năng giữ ổn định những đầu mút của nhiễm sắc thể bằng cách hình thành nên cấu trúc gồm những đơn vị chứa bốn base xếp chồng lên nhau, hơn là dạng bổ sung cặp base thường thấy ở các phân tử DNA khác. Ở đây, bốn base guanine tạo thành một tấm phẳng và những đơn vị phẳng chứa bốn base này xếp xen chồng lẫn nhau hình thành nên cấu trúc G-quadruplex (bộ bốn) ổn định.[69] Sự ổn định của cấu trúc này có được là do liên kết hydro giữa các cạnh của base và hiện tượng chelat hóa của một ion kim loại nằm ở trung tâm của khối phẳng bộ bốn base.[70] Những cấu trúc khác cũng có thể tồn tại, với trung tâm của bộ bốn base hoặc là một mạch đơn gấp xoắn xung quanh các base, hoặc là một vài mạch song song với nhau, trong đó mỗi mạch đều đóng góp một base vào cấu trúc trung tâm.

Bên cạnh dạng cấu trúc xếp chồng, telomere cũng có cấu trúc dạng vòng lớn gọi là vòng telomere (telomere loop), hay T-loop. Trong cấu trúc này, một mạch đơn DNA quấn quanh thành một vòng tròn dài ổn định bởi các protein liên kết với telomere.[71] Tại đầu mút tận cùng của T-loop, telomere mạch đơn DNA được giữ ở một vùng bao bởi DNA mạch kép bằng mạch telomere phân tách mạch kép DNA và thực hiện việc bổ sung cặp base với một trong hai mạch. Cấu trúc ba mạch này (triple-stranded DNA) được gọi là vòng chuyển chỗ (displacement loop) hay D-loop.[69]

95px 95px
Nhánh đơn mạch Nhánh đa mạch
DNA phân nhánh có thể tạo thành mạng lưới chứa nhiều nhánh.

DNA phân nhánh[sửa]

Ở chuỗi xoắn kép DNA, hiện tượng sờn tước đầu mút xuất hiện khi những đoạn không được bổ sung hiện diện tại đầu mút của DNA mạch kép. Qua đó, DNA phân nhánh có thể hình thành nếu có một mạch DNA thứ ba xuất hiện và mang những đoạn mới liên hợp với đoạn không được bổ sung của chuỗi xoắn kép đã bị sờn tước trước đó. Dạng đơn giản nhất của DNA phân nhánh chỉ bao gồm ba mạch DNA, tất nhiên là có thể tồn tại thêm nhiều nhánh phức tạp khác.[72] DNA phân nhánh được ứng dụng trong công nghệ nano để lắp ráp những cấu hình phân tử mong muốn.

Những thay đổi hóa học và trình tự của DNA[sửa]

75px 95px 97px
cytosine 5-methylcytosine thymine
Cấu trúc của cytosine khi có và không có nhóm 5-metyl. Sự khử amin biến đổi 5-methylcytosine thành thymine.

Chỉnh sửa base và phương cách đóng gói DNA[sửa]

Biểu hiện của gen chịu ảnh hưởng bởi phương cách đóng gói DNA trong nhiễm sắc thể, thành một cấu trúc gọi là chất nhiễm sắc (chromatin). Những tác động chỉnh sửa base có thể xảy ra trong quá trình đóng gói, với các vùng không có hoặc có mức biểu hiện gen thấp thông thường chứa các base cytosine ở mức metyl hóa cao. Sự đóng gói DNA và ảnh hưởng của nó lên biểu hiện gen cũng xảy ra bởi hiệu ứng thay đổi liên kết cộng hóa trị tại lõi protein histone bọc quanh DNA trong cấu trúc chất nhiễm sắc hoặc bởi phức hệ chất nhiễm sắc tái mô hình hóa (xem Tái mô hình hóa chất nhiễm sắc (chromatin remodeling)). Do vậy, tác động xen lẫn giữa metyl hóa DNA và thay đổi liên kết ở histone có ảnh hưởng phối hợp đến chất nhiễm sắc và biểu hiện gen.[73]

Ví dụ, sự metyl hóa cytosine, tạo ra 5-methylcytosine, có vai trò quan trọng đối với sự bất hoạt X của nhiễm sắc thể (X-inactivation).[74] Mức độ metyl hóa trung bình thay đổi theo mỗi sinh vật – giun tròn Caenorhabditis elegans không có phản ứng metyl hóa cytosine, trong khi ở động vật có xương sống có mức độ cao hơn, lên tới 1% lượng DNA chứa 5-methylcytosine.[75] Tuy 5-methylcytosine có vai trò quan trọng, nhưng nó vẫn có thể bị khử amin hóa để chuyển thành base thymine, do đó cytosine metyl hóa có khuynh hướng gây đột biến.[76] Những thay đổi base khác bao gồm sự metyl hóa adenine ở vi khuẩn, sự hiện diện của 5-hydroxymethylcytosine trong não,[77] và sự glycosyl hóa của uracil tạo thành "Base J" trong các loài Kinetoplastida.[78][79]

Phá hủy (hư hại)[sửa]

Tập tin:Benzopyrene DNA adduct 1JDG.png
Một sản phẩm cộng của liên kết cộng hóa trị (covalent adduct) giữa dạng kích hoạt chuyển hóa của benzo[a]pyrene, tác nhân đột biến chính trong khói thuốc lá, với DNA.[80] (ở giữa)

DNA có thể bị hư hại bởi nhiều tác nhân đột biến, làm thay đổi trình tự DNA. Những tác nhân đột biến bao gồm các chất oxy hóa, các chất ankyl hóa cũng như bức xạ điện từ năng lượng cao như tia cực tím tia X. Loại DNA hư hại hình thành phụ thuộc vào loại tác nhân đột biến. Ví dụ, tia UV có thể phá hủy DNA khi tạo ra thymine nhị trùng (thymine dimer), nghĩa là cấu thành liên kết chéo giữa các base pyrimidine với nhau.[81] Mặt khác, những tác nhân oxy hóa như gốc tự do hay hydro peroxit tạo ra nhiều dạng hư hại, bao gồm tinh sửa base, đặc biệt là guanosine, và làm đứt gãy chuỗi xoắn kép.[82] Một tế bào điển hình ở người chứa khoảng 150.000 base chịu sự phá hủy dưới tác nhân oxy hóa.[83] Trong những tổn hại oxy hóa này, mức độ nguy hiểm nhất đó là làm chuỗi xoắn kép bị đứt gãy, vì rất khó để hàn gắn chúng lại và có thể dẫn tới đột biến điểm (point mutation), đột biến thêm đoạn mất đoạn trên trình tự DNA, cũng như quá trình chuyển đoạn nhiễm sắc thể (chromosomal translocation).[84] Những đột biến này có thể gây ra ung thư. Bởi vì những giới hạn vốn có trong cơ chế sửa chữa DNA, nếu con người sống đủ lâu, những hư hại này cuối cùng sẽ dẫn tới sự phát triển của ung thư.[85][86] Những phá hủy DNA mà xuất hiện một cách tự nhiên là do các quá trình bình thường trong tế bào tạo ra các sản phẩm phản ứng với oxy, chẳng hạn các phản ứng thủy phân của nước trong tế bào, v.v, cũng xảy ra một cách thường xuyên. Mặc dù hầu hết những phá hủy này đều được sửa chữa, nhưng trong bất kỳ tế bào nào vẫn có một vài DNA hư hại có thể còn tồn tại mặc cho các hoạt động sửa chữa. Những DNA bị phá hủy còn sót lại sẽ tích tụ dần theo độ tuổi bên trong các mô sau nguyên phân ở động vật. Sự tích tụ này dường như là một nguyên nhân quan trọng dẫn tới sự già yếu.[87][88][89]

Nhiều tác nhân đột biến nằm gọn trong không gian giữa hai cặp base liền kề, hay gọi là các phân tử xen kẹp (intercalation). Hầu hết các phân tử xen kẹp là những hợp chất vòng thơm cấu trúc phẳng; ví dụ: ethidium bromide, acridine, daunomycin doxorubicin. Để cho một phân tử xen kẹp có thể vừa vặn không gian giữa hai cặp base, các base phải bị tách ra, bóp méo chuỗi DNA bằng cách tháo xoắn mạch kép. Điều này ngăn cản quá trình phiên mã và nhân đôi DNA, phát xuất độc tính và những đột biến.[90] Kết quả là, các phân tử xen kẹp vào DNA có thể là tác nhân gây ung thư, và trong trường hợp của thalidomide tác nhân gây quái thai (teratogen).[91] Những phân tử khác như benzo[a]pyrene diol epoxide aflatoxin tạo thành sản phẩm cộng vào DNA dẫn tới các lỗi trong quá trình nhân đôi.[92] Tuy thế, do khả năng ngăn cản sự phiên mã và nhân đôi DNA, những độc tố tương tự khác cũng được sử dụng trong phương pháp hóa trị liệu để ngăn chặn sự lớn lên nhanh chóng của các tế bào ung thư.[93]

Chức năng sinh học[sửa]

Tập tin:Cell to DNA vi.svg
Vị trí của DNA nhân chứa trong chất nhiễm sắc bên trong nhân tế bào của tế bào nhân thực.

DNA thông thường hiện diện trong nhiễm sắc thể dạng thẳng ở sinh vật nhân thực, và nhiễm sắc thể dạng vòng ở sinh vật nhân sơ. Nhiễm sắc thể (chromosome) thực chất là chất nhiễm sắc (chromatin) bị co xoắn từ kỳ đầu của quá trình phân bào. Còn chất nhiễm sắc chính là phức hợp giữa chuỗi xoắn kép DNA với các protein histone và phi histone gói gọn thành một cấu trúc cô đặc. Điều này cho phép các phân tử DNA rất dài nằm gọn trong nhân tế bào. Cấu trúc vật lý của nhiễm sắc thể và chất nhiễm sắc thay đổi luân phiên tùy thuộc vào từng giai đoạn của chu kỳ tế bào. Tập hợp các nhiễm sắc thể trong một tế bào tạo thành bộ gen của nó; bộ gen người có xấp xỉ 3 tỷ cặp base DNA xếp thành 46 nhiễm sắc thể.[94] Thông tin chứa trong DNA tổ chức dưới dạng trình tự của các đoạn DNA gọi là gen. Sự kế thừa thông tin di truyền trong gen được thực hiện thông qua các cặp base bổ sung. Ví dụ, trong quá trình phiên mã, khi một tế bào sử dụng thông tin ở một gen, trình tự DNA sẽ được sao mã vào trình tự bổ sung RNA thông qua lực hút giữa DNA và các nucleotide chính xác của RNA. Thông thường, bản sao RNA này được dùng làm khuôn mẫu để xác định trình tự các axit amino trong quá trình dịch mã, thông qua sự tương tác giữa các nucleotide RNA. Trong quá trình khác, một tế bào có thể tự sao chép thông tin di truyền của nó bằng quá trình nhân đôi DNA. Chi tiết của những chức năng này được nêu trong những bài viết liên quan; bài này tập trung vào tương tác giữa DNA và các phân tử khác mà đảm trách các chức năng của bộ gen.

Tập tin:Chromatin Structures.png
Hình minh họa những mức độ co xoắn từ DNA đến nhiễm sắc thể kép tại kỳ giữa của quá trình phân bào: Chuỗi xoắn kép DNA 2 nm, cấu trúc nucleosome, chuỗi nucleosome (sợi cơ bản) 10 nm, sợi chất nhiễm sắc 30 nm, sợi siêu xoắn 300 nm, chromatid 700 nm và nhiễm sắc thể kép 1400 nm ở mức xoắn cực đại. Xem video trực quan.

Gen và bộ gen[sửa]

Tập tin:Chromosome DNA Gene.svg
Gen là một đoạn của DNA mã hóa các thông tin chức năng sinh học. Nhiễm sắc thể chứa một chuỗi DNA dài trên đó bao gồm rất nhiều gen. Một nhiễm sắc thể ở người có thể chứa tới 500 triệu cặp base với hàng nghìn gen.

DNA chứa các đoạn gen được gói gọn và xếp chặt có thứ tự bởi quá trình cô đặc DNA (DNA condensation), để có thể vừa vặn trong một thể tích nhỏ của tế bào. Ở sinh vật nhân thực, DNA nằm trong nhân tế bào, cùng với một lượng nhỏ nằm trong ty thể lục lạp. Ở sinh vật nhân sơ, DNA nằm trong một thể có hình dạng không đều giữa tế bào chất, gọi là thể nhân (hoặc vùng nhân, nucleoid).[95] Thông tin di duyền trong một bộ gen được lưu trữ bởi các gen, và tập hợp toàn bộ các gen trong tế bào của cơ thể thuộc một loài sinh vật được gọi là kiểu gen. Mỗi gen là một đơn vị của tính di truyền và là một đoạn của DNA có ảnh hưởng tới một đặc tính cụ thể trong cơ thể sinh vật. Các gen chứa một khung đọc mở (open reading frame) có thể được phiên mã, cùng với các vùng trình tự điều hòa (regulatory sequence) như vùng khởi động (promoter) và vùng tăng cường (enhancer) có khả năng điều hòa quá trình phiên mã của khung đọc mở.

Ở nhiều loài, chỉ một phần nhỏ trong tổng số trình tự của bộ gen là mã hóa cho protein. Ví dụ, chỉ khoảng 1,5% bộ gen người chứa các đoạn exon mã hóa cho protein, trong khi trên 50% DNA ở người chứa các trình tự lặp lại không mã hóa (non-coding repeated sequence).[96] Những lý do cho sự có mặt của rất nhiều DNA không mã hóa ở bộ gen của sinh vật nhân thực và sự cách biệt rất lớn trong kích cỡ bộ gen, hay giá trị C, giữa các loài đã đưa đến một vấn đề nan giải lâu năm gọi là "nghịch lý giá trị C".[97] Tuy nhiên, một số trình tự DNA không mã hóa protein vẫn có thể có chức năng mã hóa các phân tử RNA không mã hóa tham gia vào quá trình điều hòa biểu hiện gen.[98]

Tập tin:T7 RNA polymerase at work.png
T7 RNA polymerase (xanh lam) đang tổng hợp mRNA (xanh lục ở giữa) từ mạch mẫu DNA (vàng).[99]

Một số trình tự DNA không mã hóa đóng vai trò cấu trúc bộ khung trong nhiễm sắc thể. Telomere tâm động (centromere) điển hình chỉ chứa vài gen, nhưng lại có vai trò quan trọng đối với chức năng và sự ổn định của nhiễm sắc thể.[66][100] Một dạng DNA không mã hóa xuất hiện ở người gọi là gen giả (pseudogene), là những bản sao của gen nhưng đã bị bất hoạt do tác động của đột biến.[101] Những trình tự này thường chỉ là các hóa thạch phân tử, mặc dù chúng có thể phục vụ như là vật liệu di truyền dạng thô cho sự sản sinh gen mới thông qua quá trình nhân đôi (gene duplication) và phân ly gen.[102]

Phiên mã và dịch mã[sửa]

Tập tin:Genetic code vi.svg
Mã di truyền: DNA, qua trung gian RNA thông tin, mã hóa cho protein với các bộ ba mã hóa.

Mỗi gen là một đoạn trình tự DNA chứa thông tin di truyền và có thể ảnh hưởng đến kiểu hình của sinh vật. Bên trong một gen, trình tự các base dọc theo một mạch DNA xác định nên trình tự của RNA thông tin, rồi từ đó xác lập nên trình tự của một hay nhiều protein. Mối liên hệ giữa trình tự nucleotide của các gen và trình tự các axit amino của protein được xác định bởi những quy tắc trong quá trình dịch mã, được biết đến với cái tên bộ mã di truyền. Mỗi mã di truyền chứa bộ ba 'chữ cái' gọi là triplet (bộ ba mã gốc) trên DNA hay codon (bộ ba mã sao) trên mRNA hay anticodon (bộ ba đối mã) trên tRNA tạo thành một trình tự gồm ba nucleotide (v.d. ACT, CAG, TTT trên mạch gốc DNA).

Trong quá trình phiên mã, các triplet của một gen được sao chép sang RNA thông tin thành các codon tương ứng bằng enzyme RNA polymerase. Bản sao RNA này sau đó được giải mã bởi ribosome thông qua hoạt động đọc trình tự RNA bằng cách bổ sung cặp base trong RNA thông tin với RNA vận chuyển, loại phân tử mang theo axit amino. Vì có 4 loại base khác nhau được tổ hợp thành các mã bộ ba, do vậy có tất cả 64 codon (tổ hợp 43). Tất cả chúng được phân bổ để mã hóa cho 20 loại axit amino cơ bản của sự sống, do đó một axit amino có thể có nhiều hơn một codon mã hóa cho nó. Bên cạnh đó cũng có ba codon 'kết thúc' hoặc 'vô nghĩa' (nonsense) đánh dấu điểm kết thúc của một vùng mã hóa; chúng là các codon UAA, UAG và UGA (tương ứng với các triplet TAA, TAG và TGA).

Tập tin:DNA replication en.svg
Nhân đôi DNA. Chuỗi xoắn kép được tháo xoắn theo chiều 3' → 5' bởi enzyme topoisomerase và cắt tách hai mạch đơn bởi enzyme helicase. Tiếp theo, một DNA polymerase lần lượt liên kết liên tục các nucleotide tự do từ môi trường nội bào với các nucleotide trên mạch khuôn có chiều 3' → 5' tổng hợp nên mạch dẫn đầu (leading strand) theo nguyên tắc bổ sung. Những DNA polymerase khác liên kết với mạch khuôn có chiều 5' → 3' ngược với chiều tháo xoắn tổng hợp nên mạch theo sau (lagging strand) thành những đoạn ngắt quãng gọi là đoạn Okazaki. Sau đó, các đoạn Okazaki này sẽ được nối lại với nhau bởi enzyme DNA ligase.

Nhân đôi DNA (sao chép, tái bản)[sửa]

Phân bào là quá trình cơ bản của sinh vật để có thể sinh trưởng, nhưng khi một tế bào phân chia, nó phải nhân đôi DNA trong bộ gen của nó sao cho hai tế bào con có cùng thông tin di truyền như của tế bào mẹ. Cấu trúc mạch kép DNA giúp hình thành một cơ chế đơn giản cho quá trình nhân đôi DNA. Ở đây, hai mạch đơn tháo xoắn tách rời nhau và mỗi mạch mới bổ sung với mỗi mạch gốc được tổng hợp bằng một loại enzyme gọi là DNA polymerase. Enzyme này tạo ra những mạch mới bằng cách tìm những nucleotide tự do từ môi trường nội bào và gắn kết chính xác với nucleotide trên mạch gốc ban đầu theo nguyên tắc bổ sung. Vì DNA polymerase chỉ tổng hợp mạch mới theo chiều 5′ → 3′, do vậy trên mạch khuôn có chiều 3' → 5' thì mạch bổ sung được tổng hợp liên tục do cùng chiều với chiều tháo xoắn.[103] Còn trên mạch khuôn có chiều 5' → 3' thì mạch bổ sung được tổng hợp ngắt quãng tạo nên các đoạn ngắn gọi là đoạn Okazaki do ngược chiều với chiều tháo xoắn, sau đó các đoạn này được nối lại với nhau nhờ enzyme nối DNA ligase.[104]

Axit nucleic ngoại bào[sửa]

DNA ngoại bào trần (extracellular DNA - eDNA), hầu hết được giải phóng khi tế bào chết đi, xuất hiện khắp nơi trong môi trường. Mức độ tập trung của nó trong đất có thể lên tới 2 μg/lít, và trong môi trường nước tự nhiên lên tới 88 μg/lít.[105] Đã có một số chức năng khả thi của eDNA được đề xuất: nó có thể tham gia vào vận chuyển ngang gen;[106] cung cấp dinh dưỡng;[107] và có khả năng hoạt động như một chất đệm để khôi phục hoặc chuẩn độ ion hoặc tính kháng sinh.[108] DNA ngoại bào hoạt động như một thành phần chức năng của chất nền ngoại bào trong lớp màng vi sinh vật (phim sinh học - biofilm) của một số loài vi khuẩn. Nó có thể hoạt động như một nhân tố nhận diện để điều phối sự bám dính và phân tán của một số loại tế bào đặc hiệu trong phim sinh học;[109] hoặc đóng góp vào sự hình thành phim sinh học;[110] cũng như đóng góp vào đặc tính vật lý chắc chắn của phim sinh học và sức đề kháng trước những căng thẳng sinh học (biological stress).[111]

Tương tác với protein[sửa]

Mọi chức năng của DNA phụ thuộc vào tương tác với protein. Những tương tác protein này có thể không đặc hiệu hoặc đặc hiệu khi protein liên kết với một trình tự DNA cụ thể. Các enzyme cũng liên kết với DNA và trong số này, những enzyme polymerase sao chép trình tự base của DNA trong quá trình phiên mã và nhân đôi DNA có vai trò đặc biệt quan trọng.

Protein liên kết DNA[sửa]

260px
Tương tác của DNA (màu cam) với protein histone (màu lam). Những axit amino cơ bản của protein liên kết với các nhóm phosphat tính axit trên DNA.

Các protein cấu trúc liên kết với DNA là những ví dụ đã được nghiên cứu khá kĩ về tương tác không đặc hiệu DNA-protein. Bên trong nhiễm sắc thể, DNA được giữ trong phức hợp với protein cấu trúc. Những protein này tổ chức DNA thành một cấu trúc thắt đặc gọi là chất nhiễm sắc (chromatin). Trong sinh vật nhân thực, cấu trúc này bao gồm DNA liên kết với phức hợp các đơn vị protein cơ sở nhỏ gọi là histone, trong khi ở sinh vật nhân sơ lại có nhiều loại protein tham gia hơn.[112][113] Các histone tạo thành một phức hợp dạng đĩa gọi là nucleosome, với chuỗi xoắn kép DNA bao quanh bề mặt cấu trúc bằng hai vòng xoắn. Những tương tác không đặc hiệu được hình thành thông qua các phần dư cơ bản trong histone, tạo ra liên kết ion với bộ khung đường-phosphat có tính axit của DNA, và do vậy phần lớn tương tác là độc lập với trình tự các base.[114] Những phản ứng hóa học làm thay đổi các axit amino cơ bản này bao gồm phản ứng metyl hóa, phosphoryl hóa acetyl hóa.[115] Những thay đổi hóa học này làm ảnh hưởng tới cường độ tương tác giữa DNA và histone, khiến cho các nhân tố phiên mã trở nên dễ dàng hoặc khó tiếp cận được với DNA và do vậy thay đổi tốc độ quá trình phiên mã.[116] Những protein liên kết DNA không đặc hiệu khác trong chất nhiễm sắc bao gồm các nhóm protein có tính linh động cao mà khi liên kết có thể uốn hoặc làm vặn DNA.[117] Các protein này có vai trò quan trọng trong việc sắp uốn nucleosome và xếp đặt chúng thành những cấu trúc lớn hơn tạo thành nhiễm sắc thể.[118]

Có một nhóm protein liên kết DNA đặc biệt là các protein chỉ liên kết đặc hiệu với một mạch đơn DNA. Ở người, protein A phục vụ quá trình nhân đôi DNA là protein được hiểu biết rõ ràng nhất trong nhóm này và tham gia vào những quá trình khi hai mạch xoắn kép đã tách rời nhau, bao gồm sao chép DNA, tái tổ hợp và sửa chữa DNA.[119] Những protein liên kết này giúp ổn định hóa mạch đơn DNA và bảo vệ nó khỏi hiện tượng hình thành cấu trúc vòng gấp kẹp tóc (stem-loop/hairpin loop) hoặc bị phân cắt bởi enzyme nuclease.

Tập tin:Lambda repressor 1LMB.png
Protein nhân tố ức chế phiên mã lambda motif cấu trúc xoắn-ngoặt-xoắn (helix-turn-helix - HTH) gắn vào DNA đích.[120]

Ngược lại, có những protein khác phải biến đổi cấu hình để liên kết với những trình tự DNA riêng biệt. Lĩnh vực nghiên cứu sâu rộng nhất về những protein này đó là nghiên cứu nhiều loại nhân tố phiên mã (transcription factor) khác nhau, đây chính là các protein điều hòa quá trình phiên mã. Mỗi nhân tố phiên mã liên kết với một tập hợp cụ thể các trình tự DNA và kích hoạt hoặc ức chế hoạt động phiên mã của gen tại những trình tự gần với vùng khởi động của chúng. Nhân tố phiên mã thực hiện vai trò này theo hai cách. Đầu tiên, chúng có thể gắn với RNA polymerase chịu trách nhiệm cho quá trình phiên mã, hoặc trực tiếp hoặc gián tiếp thông qua các protein trung gian; giúp định vị polymerase tại vùng gen khởi động và cho phép bắt đầu phiên mã.[121] Hoặc cách khác, nhân tố phiên mã có thể gắn với enzyme làm biến đổi các histone ở vùng khởi động. Điều này làm thay đổi khả năng tiếp cận của polymerase với mạch khuôn DNA.[122]

Do những DNA đích này xuất hiện trong toàn thể bộ gen sinh vật, vì vậy những thay đổi trong hoạt động của một loại nhân tố phiên mã có thể ảnh hưởng tới hàng nghìn gen.[123] Hệ quả là, những protein này thường là mục tiêu của các quá trình truyền tín hiệu tải nạp (signal transduction) mà điều khiển sự đáp ứng đối với những thay đổi của môi trường hoặc biệt hóa tế bào và điều khiển sự phát triển. Nét đặc trưng của những tương tác của các nhân tố phiên mã với DNA đến từ các protein tạo nhiều tiếp xúc với các cạnh của các base DNA, cho phép chúng "đọc" được trình tự DNA. Phần lớn những tương tác với base diễn ra ở rãnh lớn, nơi có thể tiếp xúc nhiều nhất với các base.[32]

Tập tin:EcoRV 1RVA.png
Enzyme giới hạn EcoRV (xanh lục) trong phức hệ với cơ chất DNA[124]

Enzyme chỉnh sửa DNA[sửa]

Nuclease và ligase[sửa]

Nuclease là các enzyme có khả năng cắt mạch DNA bằng cách xúc tác cho phản ứng thủy phân các liên kết phosphodieste. Loại nuclease thủy phân nucleotide từ những đầu mút của mạch DNA được gọi là exonuclease, trong khi endonuclease lại phân cắt từ những điểm trong mạch. Những nuclease được sử dụng thường xuyên nhất trong sinh học phân tử là các endonuclease giới hạn, do chúng cắt DNA tại những đoạn trình tự đặc hiệu. Ví dụ, enzyme EcoRV ở hình ảnh bên trái nhận ra trình tự gồm 6 base 5′-GATATC-3′ và thực hiện việc cắt theo một đường nằm ngang. Trong tự nhiên, những enzyme này bảo vệ vi khuẩn chống lại sự tấn công của thể thực khuẩn bằng cách tiêu hóa DNA thể thực khuẩn khi chúng xâm nhập vào tế bào vi khuẩn, lúc này các enzyme hoạt động như một phần trong hệ thống hạn chế cải biến (restriction modification system).[125] Trong công nghệ sinh học, những nuclease hoạt động với các trình tự đặc hiệu được sử dụng trong tách dòng phân tử (molecular cloning) và kỹ thuật nhận diện DNA (DNA profiling).

Tập tin:Replication fork.svg
Minh họa cấu trúc chạc tái bản (replication fork):
a: mạch khuôn, b: mạch dẫn đầu (leading strand), c: mạch theo sau (lagging strand), d: chạc tái bản, e: đoạn mồi RNA, f: các đoạn Okazaki

Những enzyme có chức năng nối lại những đoạn DNA bị cắt hoặc bị đứt gãy được gọi là DNA ligase.[126] Ligase đặc biệt quan trọng trong việc nối lại các mạch theo sau ngắt quãng của DNA, tức là các đoạn Okazaki tại chạc tái bản thành một bản sao hoàn chỉnh từ mạch khuôn DNA. Chúng cũng tham gia vào việc sửa chữa DNA tái tổ hợp di truyền.[126]

Topoisomerase và helicase[sửa]

Topoisomerase là những enzyme mang hoạt tính của nuclease lẫn ligase. Những protein này có khả năng thay đổi số lượng các nút siêu xoắn trong cấu trúc DNA. Một số enzyme trong nhóm này thực hiện hoạt động cắt chuỗi xoắn ốc DNA và cho phép một phần phân tử quay được, do vậy làm giảm mức siêu xoắn của nó; sau cuối enzyme sẽ gắn khít hoàn chỉnh lại đoạn DNA bị gãy.[44] Những loại enzyme khác có thể cắt một chuỗi xoắn kép DNA và rồi kéo một mạch DNA thứ hai vào vị trí cắt này, trước khi thực hiện việc nối lại chuỗi xoắn kép.[127] Topoisomerase cần thiết cho nhiều quá trình liên quan đến DNA, như nhân đôi và phiên mã.[45]

Helicase là những protein thuộc một trong những loại động cơ phân tử. Chúng sử dụng năng lượng hóa học trong nucleoside triphosphat, nổi bật là adenosine triphosphat (ATP), để phá vỡ liên kết hydro giữa các base và tháo xoắn chuỗi kép DNA thành hai mạch đơn.[128] Những enzyme này có vai trò quan trọng thiết yếu đối với hầu hết quá trình nơi các enzyme cần thiết phải tương tác với các base DNA.

Polymerase[sửa]

Tập tin:RibosomaleTranskriptionsEinheit.jpg
Ảnh chụp qua kính hiển vi điện tử của DNA: các đơn vị rRNA của Chrironumus pallidivitatus (chụp năm 2005).

Polymerase là những enzyme thực hiện tổng hợp mạch polynucleotide từ nucleoside triphosphat. Tính tuần tự của các sản phẩm của chúng được sinh ra dựa trên những mạch polynucleotide đã có—gọi là mạch khuôn. Những enzyme này hoạt động bằng lần lượt thêm vào một nucleotide tại nhóm 3′ hydroxyl ở điểm cuối của mạch polynucleotide đang phát triển. Kết quả là, mọi polymerase hoạt động luôn theo chiều từ đầu 5′ đến đầu 3′.[129] Tại trung tâm hoạt động của các enzyme này, phân tử nucleoside triphosphat đi đến ghép cặp với base của mạch khuôn: điều này cho phép polymerase tổng hợp một cách chính xác mạch bổ sung đối với mạch khuôn của nó. Các polymerase được phân loại theo các nhóm mạch khuôn mà chúng sử dụng.

Trong quá trình sao chép DNA, DNA polymerase phụ thuộc DNA tạo nên những bản sao của những mạch polynucleotide DNA. Để bảo toàn thông tin sinh học, điều cơ bản là trình tự của các base trong mỗi bản sao là trình tự bổ sung chính xác cho trình tự base trong mạch khuôn mẫu. Nhiều DNA polymerase có hoạt tính đọc và sửa sai (proofreading). Ở đây, polymerase nhận ra các lỗi thường xuất hiện trong phản ứng tổng hợp do sự thiếu đi những base ghép cặp giữa các nucleotide không khớp với nhau. Nếu polymerase phát hiện một sự không ăn khớp, hoạt tính exonuclease 3'-5′ được kích hoạt và base không khớp nào được phát hiện sẽ bị cắt bỏ.[130] Trong hầu hết các sinh vật, DNA polymerase hoạt động trong một phức hệ lớn gọi là replisome có chứa nhiều tiểu đơn vị phụ, như protein kẹp DNA (DNA clamp) hay helicase.[131]

DNA polymerase phụ thuộc RNA là những loại polymerase chuyên biệt thực hiện sao chép trình tự của mạch RNA sang DNA. Chúng bao gồm enzyme phiên mã ngược (reverse transcriptase, RT), ví dụ như một enzyme của virut retrovirus tham gia vào quá trình xâm nhập tế bào, và telomerase, cần cho quá trình sao chép telomere.[65][132] Telomerase là một polymerase khác thường bởi vì nó chứa chính mạch khuôn RNA của nó như là một phần trong cấu trúc của enzyme này.[66]

Sự phiên mã được thực hiện bởi RNA polymerase phụ thuộc DNA thông qua quá trình sao chép trình tự của mạch DNA sang RNA. Để bắt đầu giải mã một gen, RNA polymerase gắn với một trình tự của DNA gọi là vùng khởi động (promoter) và tách hai mạch DNA khỏi nhau. Sau đó nó sao chép trình tự gen vào một RNA thông tin cho đến khi nó đi đến vùng kết thúc (terminator) của DNA, nơi RNA polymerase dừng lại và tách khỏi DNA. Với DNA polymerase phụ thuộc DNA ở người, RNA polymerase II, enzyme thực hiện phiên mã hầu hết các gen trong bộ gen người, hoạt động như là một phần của một phức hệ protein lớn với nhiều tiểu đơn vị phụ và vùng điều hòa khác nhau.[133]

Tái tổ hợp di truyền[sửa]

250px
250px
Cấu trúc của thể trung gian điểm giao Holliday trong tái tổ hợp di truyền. Bốn đoạn mạch DNA tách rời có màu đỏ, lam, lục và vàng.[134]

Tập tin:Chromosomal Recombination.svg
Tái tổ hợp bao gồm tách rời và kết nối lại hai nhiễm sắc thể (M và F) để tạo thành hai nhiễm sắc thể được sắp xếp lại (C1 và C2).

Chuỗi xoắn kép DNA thường không tương tác với những đoạn khác của DNA, và trong tế bào người các nhiễm sắc thể khác nhau thậm chí còn nằm ở những vùng tách biệt trong nhân tế bào gọi là "vùng nhiễm sắc thể" (chromosome territory).[135] Sự tách biệt về không gian giữa các nhiễm sắc thể khác nhau là quan trọng đối với khả năng hoạt động của DNA như là nơi lưu giữ ổn định thông tin di truyền, khi một vài lần nhiễm sắc thể tương tác trong sự trao đổi chéo nhiễm sắc thể xảy ra trong quá trình sinh sản hữu tính, khi ấy tái tổ hợp di truyền mới diễn ra. Trao đổi chéo nhiễm sắc thể là khi hai chuỗi DNA tháo xoắn và tách rời từng mạch đơn ra, trao đổi các đoạn DNA cho nhau rồi tái gắn kết hai mạch đơn lại.

Tái tổ hợp cho phép nhiễm sắc thể trao đổi thông tin di truyền và tạo ra những tổ hợp gen mới, làm tăng hiệu quả của tính chọn lọc tự nhiên và có thể quan trọng đối với sự tiến hóa nhanh chóng cho những protein mới.[136] Tái tổ hợp di truyền cũng bao gồm trong quá trình sửa chữa DNA, đặc biệt trong sự đáp ứng của tế bào đối với sự kiện chuỗi xoắn kép bị đứt gãy.[137]

Dạng phổ biến nhất của trao đổi chéo nhiễm sắc thể là tái tổ hợp tương đồng, khi hai nhiễm sắc thể tham gia quá trình trên có trình tự DNA tương đồng. Tái tổ hợp không tương đồng có thể phá hủy tế bào, gây ra chuyển đoạn nhiễm sắc thể và biến dị di truyền. Phản ứng tái tổ hợp được xúc tác bởi các enzyme recombinase, như RAD51.[138] Bước đầu tiên trong quá trình tái tổ hợp là một chuỗi DNA bị đứt gãy do tác động bởi enzyme endonuclease hay những phá hủy đối với DNA.[139] Một loạt các bước tiếp theo có sự xúc tác một phần của recombinase, sau đó hai chuỗi xoắn kép nối lại tại ít nhất một điểm giao Holliday (Holliday junction), trong đó một đoạn của mạch đơn của chuỗi xoắn kép này được ghép nối với đoạn mạch đối ứng của chuỗi xoắn kép kia. Điểm giao Holliday là một cấu trúc tiếp xúc bốn nhánh mà có thể di chuyển dọc theo cặp nhiễm sắc thể, tráo đổi một mạch sang cho mạch khác. Phản ứng tái tổ hợp dừng lại khi điểm giao Holliday bị đứt và xảy ra quá trình hàn gắn lại chuỗi DNA được giải phóng.[140]

Tiến hóa[sửa]

DNA chứa thông tin di truyền cho phép tất cả dạng sống hiện đại hoạt động chức năng, sinh trưởng và sinh sản. Tuy nhiên, không rõ bao lâu trong hành trình lịch sử 4 tỷ năm của sự sống DNA đã bắt đầu đảm nhận chức năng này, vì có những đề xuất cho rằng các dạng sống xuất hiện sớm nhất có khả năng đã sử dụng phân tử RNA thay vì DNA làm vật liệu di truyền.[141][142] RNA có thể đã trở thành thành phần trung tâm của quá trình trao đổi chất trong những tế bào sơ khai vì phân tử này có thể vừa truyền đạt thông tin di truyền cũng như mang hoạt tính xúc tác phản ứng dưới dạng ribozyme.[143] Thế giới RNA cổ xưa này, một nơi axit nucleic được sử dụng cho cả quá trình xúc tác và di truyền, có thể ảnh hưởng đến sự tiến hóa của hệ thống mã di truyền hiện tại trên cơ sở bốn loại nucleobase. Điều này thực sự đã xảy ra, vì số lượng của những base khác nhau trong một cơ thể sống như là một sự thỏa hiệp giữa một số lượng nhỏ base tăng cường qua hoạt động nhân đôi chính xác và một số lượng lớn những base tăng cường qua hoạt động xúc tác hiệu quả của ribozyme.[144] Không may thay, thực tế lại không có bằng chứng trực tiếp nào của hệ thống di truyền cổ xưa, như việc phục hồi DNA từ phần lớn các hóa thạch là điều không thể vì phân tử DNA chỉ tồn tại trong môi trường ít hơn một triệu năm và dần dần phân hủy thành những mảnh ngắn tan vào dung dịch.[145] Những yêu cầu khảo sát đối với dạng DNA cổ xưa đã được thực hiện, trong đó báo cáo đáng chú ý nhất là về sự cô lập của một loại vi khuẩn tồn tại phát triển độc lập từ một tinh thể muối có niên đại cách đây 250 triệu năm,[146] tuy nhiên những tuyên bố này vẫn còn trong vòng tranh cãi.[147][148]

Những thành phần "vữa gạch" của DNA (adenine, guanine và cả những phân tử hữu cơ liên quan) có thể đã hình thành từ vũ trụ trong những khoảng không liên thiên thể.[149][150][151] Những hợp chất hữu cơ cấu tạo nền tảng khác của DNA và RNA trong sự sống, bao gồm uracil, cytosine thymine, cũng đã được tổng hợp trong phòng thí nghiệm dưới các điều kiện mô phỏng tương ứng tìm thấy trong không gian ngoài thiên thể, bằng cách sử dụng những chất hóa học khởi đầu, ví dụ pyrimidine, tìm thấy trong các mảnh vẫn thạch. Pyrimidine, như những hydrocacbon đa vòng thơm (polycyclic aromatic hydrocarbons - PAHs), là hợp chất hóa học giàu cacbon nhất tìm thấy trong vũ trụ, có thể được hình thành trong những ngôi sao khổng lồ đỏ hay trong những đám mây khí và bụi giữa các vì sao.[152]

Sử dụng trong công nghệ[sửa]

Kỹ thuật di truyền[sửa]

Nhiều phương pháp đã được phát triển để sàng lọc DNA từ sinh vật sống, như chiết lỏng-lỏng phenol-clorofom, và vận dụng trong phòng thí nghiệm, như phương pháp phân hủy giới hạn (restriction digest) và phản ứng chuỗi polymerase. Sinh học hiện đại và ngành hóa sinh sử dụng thường xuyên những kỹ thuật này trong công nghệ tái tổ hợp DNA. Tái tổ hợp DNA là một trình tự DNA nhân tạo được lắp ghép từ các trình tự DNA khác. Chúng có thể được biến nạp vào tế bào sinh vật dưới dạng plasmid hoặc trong những dạng thích hợp khác, bằng cách sử dụng vector virut.[153] Những sinh vật biến đổi di truyền có thể được ứng dụng để sinh ra các sản phẩm như protein tái tổ hợp, sử dụng trong nghiên cứu y học,[154] hoặc được nuôi trồng trong nông nghiệp.[155][156]

Kỹ thuật nhận diện DNA[sửa]

Các nhà khoa học pháp y sử dụng DNA trong máu, tinh dịch, da, nước bọt hay tóc tìm thấy tại hiện trường để nhận ra DNA khớp với của một cá nhân, như của thủ phạm chẳng hạn. Quá trình này được gọi là kỹ thuật nhận diện DNA (DNA profiling), hay còn gọi là kỹ thuật in dấu DNA (DNA fingerprinting). Trong kỹ thuật nhận diện DNA, độ dài của nhiều đoạn DNA lặp lại, như các đoạn trình tự vi vệ tinh (microsatellite) và vệ tinh nhỏ (minisatellite), được so sánh giữa các cá nhân có liên quan. Phương pháp này thường là một kỹ thuật cực kỳ tin cậy cho phép xác định những trình tự DNA ăn khớp với nhau.[157] Tuy vậy, việc nhận dạng có thể trở nên phức tạp nếu tại hiện trường gây án có nhiều DNA của nhiều người.[158] Kỹ thuật nhận diện DNA phát triển vào năm 1984 bởi nhà di truyền học người Anh Sir Alec Jeffreys,[159] và lần đầu tiên được sử dụng trong ngành pháp y để cáo buộc Colin Pitchfork trong vụ án Enderby năm 1988.[160]

Sự phát triển của khoa học pháp y, và khả năng hiện nay có thể nhận ra thông tin di truyền từ các mẫu máu, da, nước bọt hay tóc đã dẫn đến nhiều vụ án phải lật lại hồ sơ mặc dù tòa đã tuyên án. Chứng cứ mà hiện nay có thể được tiết lộ ra trong khi ở thời điểm thẩm vấn là bất khả thi về mặt khoa học. Kết hợp với đạo luật loại bỏ trường hợp bất trùng khả tố (double jeopardy-một người không bị xử hai lần về một tội) ở một số nơi, đã cho phép khởi tố lại một số vụ án khi bản án trước đó đã không nêu được chứng cứ thuyết phục để kết án. Những người mang tội danh nặng được phép yêu cầu lấy mẫu DNA nhằm mục đích so sánh. Trường hợp biện hộ rõ ràng nhất đó là mẫu DNA nhận được từ pháp y bị cho là đã bị ảnh hưởng từ những người ở xung quanh vụ án. Điều này làm cho các thủ tục điều tra trở nên chặt chẽ hơn trong những trường hợp phạm tội mới. Nhận diện DNA cũng được áp dụng thành công cho nhận dạng các nạn nhân trong những vụ tai nạn có thương vong lớn,[161] từ những phần cơ thể, và nhận biết từng nạn nhân trong những mồ chôn tập thể trong chiến tranh, thông qua so sánh với DNA của người nhà nạn nhân.

Kỹ thuật nhận diện DNA cũng được sử dụng để xác thực mối liên hệ sinh học với cha mẹ hoặc ông bà của một đứa trẻ với xác suất chính xác lên tới 99,99%. Những phương pháp kiểm trình tự DNA bình thường được thực hiện sau sinh, nhưng những phương pháp mới có thể kiểm tra quan hệ huyết thống ngay cả khi người mẹ đang mang thai.[162]

DNA enzyme hay xúc tác DNA[sửa]

Deoxyribozyme, cũng gọi là DNAzyme hay xúc tác DNA phát hiện lần đầu tiên vào năm 1994.[163] Phần lớn chúng là những trình tự mạch đơn DNA được cô lập khỏi một vũng lớn gồm nhiều trình tự DNA ngẫu nhiên thông qua một hướng tiếp cận tổ hợp gọi là kỹ thuật lựa chọn in vitro hay phương pháp SELEX. Những DNAzyme tham gia xúc tác các phản ứng hóa học bao gồm phân cắt RNA-DNA, kết nối RNA-DNA, sự phosphoryl hóa - phản phosphoryl hóa các axit amino, hình thành liên kết cacbon-cacbon, v.v... DNAzyme có thể tăng cường tốc độ phản ứng hóa học gấp 100.000.000.000 lần so với phản ứng không có sự tham gia xúc tác của nó.[164] Các DNAzyme được nghiên cứu nhiều nhất là những loại phân cắt RNA dùng để phát hiện các ion kim loại khác nhau và thiết kế các tác nhân trị liệu. Một vài DNAzyme đặc hiệu ion kim loại bao gồm GR-5 DNAzyme (đặc hiệu với chì),[163] CA1-3 DNAzymes (với đồng),[165] 39E DNAzyme (với ion uranyl) và NaA43 DNAzyme (với natri).[166] NaA43 DNAzyme, nhạy với natri gấp 10.000 lần so với các ion kim loại khác, được dùng để theo dõi natri theo thời gian thực trong tế bào sống.

Tin sinh học[sửa]

Tập tin:Genome viewer screenshot small.png
Bản đồ nhiễm sắc thể X ở người (từ trang web của NCBI).

Tin sinh học bao gồm các kỹ thuật lưu trữ, khai phá dữ liệu, tìm kiếm và thao tác với dữ liệu sinh học, bao gồm dữ liệu về trình tự axit nucleic DNA. Các kỹ thuật này mang đến những ứng dụng rộng rãi trong khoa học máy tính, đặc biệt là thuật toán tìm kiếm chuỗi, học máy lý thuyết cơ sở dữ liệu.[167] Thuật toán tìm kiếm chuỗi hay so khớp, trong đó tìm kiếm sự xuất hiện của một trình tự các chữ cái trong một trình tự các chữ cái lớn hơn, được phát triển để tìm ra những trình tự nucleotide cụ thể.[168] Trình tự DNA có thể sắp gióng với những trình tự DNA khác để nhận ra các trình tự tương đồng và xác định vị trí đột biến khiến chúng khác biệt. Những kỹ thuật này, đặc biệt là kỹ thuật "sắp gióng đa trình tự" (multiple sequence alignment), được sử dụng để nghiên cứu các mối quan hệ phát sinh chủng loài học và chức năng của protein.[169] Tập hợp dữ liệu của toàn bộ trình tự DNA, như được lập ra bởi Dự án bản đồ gen người, là khó để sử dụng mà không có các chú giải cho phép nhận ra vị trí của các gen hay các yếu tố điều hòa ở mỗi nhiễm sắc thể. Vùng trình tự DNA với những phần đặc trưng gắn với gen mã hóa cho protein hoặc RNA có thể tìm ra bằng thuật toán tìm kiếm gen (gene finding algorithm), cho phép các nhà nghiên cứu dự đoán sự có mặt của những sinh phẩm đặc biệt mã hóa bởi gene và chức năng của chúng trong sinh vật trước khi chúng được phát hiện bằng thực nghiệm.[170] Toàn bộ hệ gen cũng có thể được đối sánh, để làm sáng tỏ lịch sử tiến hóa của từng sinh vật cụ thể và cho phép kiểm tra các sự kiện tiến hóa phức tạp.

Công nghệ nano DNA[sửa]

Tập tin:DNA nanostructures.png
Cấu trúc DNA bên trái (lược đồ minh họa) với cấu trúc tự lắp ráp chụp bằng kính hiển vi lực nguyên tử bên phải. Công nghệ nano DNA là lĩnh vực nghiên cứu thiết kế và tạo ra những cấu trúc cỡ nano sử dụng các tính chất phân tử của DNA. Ảnh từ .

Công nghệ nano DNA sử dụng những tính chất tương tác của phân tử DNA và những axit nucleic khác để tạo ra những phức hợp DNA phân nhánh tự lắp ráp có tính năng hữu ích.[171] Do vậy DNA được sử dụng như là vật liệu cấu trúc hơn là vật liệu mang thông tin sinh học. Các nhà khoa học đã tạo ra những dàn lưới hai chiều tuần hoàn (bằng phương pháp lát gạch và origami DNA) và cấu trúc ba chiều đa diện đều.[172] Thiết bị cơ nano thuật toán tự lắp ráp cũng được chứng minh là khả dĩ,[173] và những cấu trúc DNA này dùng làm khuôn mẫu để sắp xếp các phân tử khác như keo vàng (colloidal gold) và protein streptavidin trong vi khuẩn Streptomyces avidinii.[174]

Lịch sử và nhân chủng học[sửa]

Bởi vì theo thời gian DNA tích lũy các đột biến, do vậy chúng được di truyền lại, nên DNA chứa thông tin lịch sử, và bằng cách so sánh các trình tự DNA, những nhà di truyền học có thể suy luận ra lịch sử tiến hóa của mỗi loài sinh vật, hay phát sinh chủng loài của chúng.[175] Lĩnh vực phát sinh chủng loài học là một công cụ mạnh của sinh học tiến hóa. Nếu so sánh những trình tự DNA của một loài với nhau, các nhà di truyền quần thể có thể biết được lịch sử phát triển của một quần thể đang nghiên cứu. Kết quả nghiên cứu của ngành này được áp dụng sang cho di truyền sinh thái nhân chủng học. Ví dụ, các nhà khoa học đã sử dụng bằng chứng DNA để nghiên cứu sự kiện Mười bộ tộc biến mất (Ten Lost Tribes) của Israel.[176][177]

Lưu trữ thông tin[sửa]

Trong một bài báo trên tạp chí Nature tháng 1 năm 2013, các nhà khoa học từ Học viện Tin sinh học Châu Âu và công ty Agilent Technologies đã đề xuất một cơ chế sử dụng khả năng mã hóa thông tin của DNA để phục vụ cho việc lưu trữ kỹ thuật số. Nhóm nghiên cứu mã hóa 739 kilobyte dữ liệu vào mã DNA, rồi tổng hợp nên DNA thực thụ, tiếp đó thực hiện giải trình tự DNA và giải mã thông tin ngược trở lại dạng ban đầu, mà họ thông báo là kết quả thu được với độ chính xác 100%. Thông tin được mã hóa chứa các tập tin định dạng văn bản và âm thanh. Một thí nghiệm khác thực hiện trước đó bởi nhóm nghiên cứu ở Đại học Harvard tháng 8 năm 2012, khi nhóm này mã hóa một quyển sách chứa 54.000 từ vào DNA.[178][179]

Trong tế bào sinh vật sống, thông tin lưu trữ ở DNA có thể được kích hoạt bởi các enzyme. Ví dụ như các kênh ion có protein cảm thụ ánh sáng phối hợp với enzyme xử lý DNA là phù hợp cho nhiệm vụ trên trong ống nghiệm (in vitro).[180][181] Những phân tử exonuclease huỳnh quang có thể truyền tín hiệu ra bên ngoài tuân theo các trình tự nucleotide mà chúng đọc được.[182]

Lịch sử nghiên cứu DNA[sửa]

Tập tin:Maclyn McCarty with Francis Crick and James D Watson - 10.1371 journal.pbio.0030341.g001-O.jpg
James Watson Francis Crick (phải), đồng đề xuất mô hình chuỗi xoắn kép, với Maclyn McCarty (trái).
Tập tin:Pencil sketch of the DNA double helix by Francis Crick Wellcome L0051225.jpg
Phác thảo bằng bút chì về chuỗi xoắn kép DNA do Francis Crick vẽ năm 1953.

DNA lần đầu tiên được cô lập bởi thầy thuốc người Thụy Sĩ Friedrich Miescher, người mà vào năm 1869, đã khám phá ra một chất vi mô trong mủ của băng gạc được tháo bỏ sau phẫu thuật. Vì nó nằm trong nhân của tế bào, ông đã gọi nó là "nuclein".[183][184] Năm 1878, Albrecht Kossel đã cô lập được thành phần không phải là protein của "nuclein", axit nucleic, và sau đó ông cô lập được năm nucleobase cơ bản của nó.[185][186] Năm 1919, Phoebus Levene nhận biết được các đơn vị của nucleotide là base, đường và phosphat.[187] Levene đề xuất rằng DNA chứa một chuỗi các đơn vị nucleotide được liên kết với nhau bằng các nhóm phosphat. Levene đã nghĩ rằng mạch này là ngắn và các base lặp lại theo một thứ tự cố định. Năm 1937, William Astbury chụp được ảnh thành phần nhiễu xạ tia X đầu tiên cho thấy DNA có một cấu trúc đều đặn.[188]

Năm 1927, Nikolai Koltsov đề xuất rằng các tính trạng di truyền có thể được thừa hưởng thông qua một "phân tử di truyền khổng lồ" cấu thành từ "hai mạch đối xứng mà có thể sao chép theo cách bán bảo tồn sử dụng từng mạch như là một khuôn mẫu".[189][190] Năm 1928, Frederick Griffith trong thí nghiệm của ông đã khám phá ra các tính trạng dạng "trơn" của phế cầu khuẩn (Pneumococcus) có thể truyền sang dạng "thô" của cùng một loài vi khuẩn bằng cách trộn các vi khuẩn dạng "trơn" đã bị giết với các vi khuẩn dạng "thô" còn sống.[191][192] Hệ thống thí nghiệm này cung cấp gợi ý rõ ràng đầu tiên về DNA mang thông tin di truyền—theo thí nghiệm Avery–MacLeod–McCarty—khi Oswald Avery, cùng với các đồng nghiệp Colin MacLeod Maclyn McCarty, nhận ra DNA tuân theo nguyên lý biến đổi trong thí nghiệm Griffith vào năm 1943.[193] Vai trò của DNA trong di truyền được xác nhận vào năm 1952, khi Alfred Hershey Martha Chase trong thí nghiệm Hershey–Chase chỉ ra rằng DNA là vật liệu di truyền của thực khuẩn thể T2.[194]

Năm 1953, James Watson Francis Crick lần đầu tiên đề xuất mô hình mà được chấp nhận ngày nay với cấu trúc DNA chuỗi xoắn kép đăng trên tạp chí Nature.[10] Mô hình phân tử chuỗi xoắn kép DNA của họ khi ấy dựa trên ảnh chụp nhiễu xạ tia X (còn gọi là "Ảnh chụp 51")[195] do Rosalind Franklin Raymond Gosling thực hiện vào tháng 5 năm 1952, và dựa trên thông tin rằng các base DNA ghép cặp với nhau.

Chứng cứ thực nghiệm ủng hộ mô hình Watson và Crick được công bố trong một loạt 5 bài báo đăng trên cùng một số của tờ Nature.[196] Trong các bài báo này, bài viết của Franklin và Gosling là công trình đầu tiên của chính họ công bố dữ liệu về nhiễu xạ tia X và phương pháp phân tích gốc giúp ủng hộ một phần mô hình của Watson và Crick;[48][197] trong số báo này cũng bao gồm bài viết về cấu trúc DNA của Maurice Wilkins với hai đồng nghiệp của ông, khi họ thực hiện phân tích ảnh chụp tia X của dạng B-DNA trong cơ thể sống (in vivo) mà cũng ủng hộ cho sự có mặt trong cơ thể sống của cấu trúc chuỗi xoắn kép DNA như đề xuất của Crick và Watson về mô hình phân tử DNA của họ trong bài báo dài 2 trang đăng ở số trước của tạp chí Nature.[49] Năm 1962, khi ấy Franklin đã qua đời, Watson, Crick, và Wilkins cùng nhận Giải Nobel Sinh lý và Y học.[198] Do điều lệ của Quỹ Nobel chỉ trao giải cho những nhà khoa học còn sống. Vẫn có những tranh luận về sau liên quan đến những ai xứng đáng được công nhận liên quan đến khám phá này.[199]

Trong một buổi nói chuyện có tầm ảnh hưởng vào năm 1957, Crick đưa ra luận thuyết trung tâm của sinh học phân tử, báo hiệu trước về mối quan hệ giữa các phân tử DNA, RNA, và protein, và khớp nối với "giả thuyết về dòng thông tin".[200] Chứng cứ thực nghiệm cuối cùng xác nhận cơ chế sao chép mà hàm ý cấu trúc chuỗi xoắn kép được công bố vào năm 1958 thông qua thí nghiệm Meselson–Stahl.[201] Những công trình về sau của Crick và các đồng nghiệp cũng như của nhiều nhà khoa học khác chứng tỏ mã di truyền có cơ sở là tổ hợp của bộ ba base không chồng lợp nhau, hay còn gọi là các codon, cho phép Har Gobind Khorana, Robert W. Holley Marshall Warren Nirenberg làm sáng tỏ mã di truyền.[202] Những phát hiện này đã khai sinh ra ngành sinh học phân tử.

Xem thêm[sửa]

Chú thích[sửa]

  1. (2014) Molecular Biology of the Cell, 6th, Garland. ISBN 9780815344322.
  2. “DNA”.
  3. Nuwer, Rachel. “Counting All the DNA on Earth”, The New York Times, The New York Times Company, 18 July 2015. Truy cập 18 tháng 7 năm 2015.
  4. “The Biosphere: Diversity of Life”. Aspen Global Change Institute. Truy cập 19 tháng 7 năm 2015.
  5. Russell, Peter (2001). iGenetics, New York: Benjamin Cummings. ISBN 0-8053-4553-1.
  6. "A physicist's view of DNA". De Physicus 24e (3): 59–61. 2013. arXiv:1311.2545v1. Bibcode 2013arXiv1311.2545M. 
  7. Saenger, Wolfram (1984). Principles of Nucleic Acid Structure, New York: Springer-Verlag. ISBN 0-387-90762-9.
  8. 8,0 8,1 Alberts, Bruce (2002). Molecular Biology of the Cell; Fourth Edition, New York and London: Garland Science. ISBN 0-8153-3218-1.
  9. Irobalieva, Rossitza N.; Fogg, Jonathan M.; Catanese Jr, Daniel J.; Sutthibutpong, Thana; Chen, Muyuan; Barker, Anna K.; Ludtke, Steven J.; Harris, Sarah A. et al. (2015-10-12). "Structural diversity of supercoiled DNA". Nature Communications 6: 8440. doi:10.1038/ncomms9440. PMC 4608029. PMID 26455586. http://www.nature.com/articles/ncomms9440. 
  10. 10,0 10,1 10,2 10,3 "A Structure for Deoxyribose Nucleic Acid" (PDF). Nature 171 (4356): 737–738. 1953. Bibcode 1953Natur.171..737W. doi:10.1038/171737a0. PMID 13054692. http://www.nature.com/nature/dna50/watsoncrick.pdf. 
  11. "The dimensions of DNA in solution". J Mol Biol 152 (1): 153–61. 1981. doi:10.1016/0022-2836(81)90099-1. PMID 7338906. 
  12. "The DNA sequence and biological annotation of human chromosome 1". Nature 441 (7091): 315–21. 2006. Bibcode 2006Natur.441..315G. doi:10.1038/nature04727. PMID 16710414. 
  13. 13,0 13,1 13,2 Berg J., Tymoczko J. and Stryer L. (2002) Biochemistry. W. H. Freeman and Company ISBN 0-7167-4955-6
  14. Abbreviations and Symbols for Nucleic Acids, Polynucleotides and their Constituents IUPAC-IUB Commission on Biochemical Nomenclature (CBN). Truy cập 17 tháng 7 năm 2016.
  15. 15,0 15,1 "A glossary of DNA structures from A to Z". Acta Crystallogr D 59 (4): 620–6. 2003. doi:10.1107/S0907444903003251. PMID 12657780. 
  16. Lấy từ PDB 1D65 DOI
  17. "Base-stacking and base-pairing contributions into thermal stability of the DNA double helix". Nucleic Acids Res. 34 (2): 564–74. 2006. doi:10.1093/nar/gkj454. PMC 1360284. PMID 16449200. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=1360284. 
  18. Burton E. Tropp - "Molecular Biology"- Jones and Barlett Learning, ISBN 978-0-7637-8663-2
  19. “Watson-Crick Structure of DNA - 1953”. Steven Carr. Memorial University of Newfoundland. Truy cập 13 July 2016.
  20. "Modified oligonucleotides: synthesis and strategy for users". Annu. Rev. Biochem. 67: 99–134. 1998. doi:10.1146/annurev.biochem.67.1.99. PMID 9759484. 
  21. "Yersiniophage phiR1-37 is a tailed bacteriophage having a 270 kb DNA genome with thymidine replaced by deoxyuridine". Microbiology 151 (12): 4093–4102. 2005. doi:10.1099/mic.0.28265-0. PMID 16339954. 
  22. "Intragenus generalized transduction in Staphylococcus spp. by a novel giant phage". ISME J. 8: 1949–1952. Mar 2014. doi:10.1038/ismej.2014.29. 
  23. Simpson L (1998). "A base called J". Proc Natl Acad Sci USA 95 (5): 2037–2038. Bibcode 1998PNAS...95.2037S. doi:10.1073/pnas.95.5.2037. PMC 33841. PMID 9482833. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=33841. 
  24. "Base J: discovery, biosynthesis, and possible functions". Annual Review of Microbiology 62: 235–51. 2008. doi:10.1146/annurev.micro.62.081307.162750. PMID 18729733. 
  25. "The modified base J is the target for a novel DNA-binding protein in kinetoplastid protozoans". The EMBO Journal 18 (22): 6573–6581. 1999. doi:10.1093/emboj/18.22.6573. PMC 1171720. PMID 10562569. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=1171720. 
  26. "Regulation of trypanosome DNA glycosylation by a SWI2/SNF2-like protein". Mol Cell 17 (3): 441–451. 2005. doi:10.1016/j.molcel.2004.12.022. PMID 15694344. 
  27. "Evidence that J-binding protein 2 is a thymidine hydroxylase catalyzing the first step in the biosynthesis of DNA base J". Molecular and biochemical parasitology 164 (2): 157–61. 2009. doi:10.1016/j.molbiopara.2008.12.001. PMID 19114062. 
  28. "Prediction of novel families of enzymes involved in oxidative and other complex modifications of bases in nucleic acids". Cell Cycle 8 (11): 1698–1710. 2009. doi:10.4161/cc.8.11.8580. PMC 2995806. PMID 19411852. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=2995806. 
  29. "Leishmania". Cell 150 (5): 909–921. 2012. doi:10.1016/j.cell.2012.07.030. PMC 3684241. PMID 22939620. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=3684241. 
  30. "Transcription: base J blocks the way". Curr Biol 22 (22): R960–2. 2012. doi:10.1016/j.cub.2012.10.010. PMC 3648658. PMID 23174300. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=3648658. 
  31. "Crystal structure analysis of a complete turn of B-DNA". Nature 287 (5784): 755–8. 1980. Bibcode 1980Natur.287..755W. doi:10.1038/287755a0. PMID 7432492. 
  32. 32,0 32,1 "Protein-DNA recognition". Annu Rev Biochem 53: 293–321. 1984. doi:10.1146/annurev.bi.53.070184.001453. PMID 6236744. 
  33. "Mechanical stability of single DNA molecules". Biophys J 78 (4): 1997–2007. 2000. Bibcode 2000BpJ....78.1997C. doi:10.1016/S0006-3495(00)76747-6. PMC 1300792. PMID 10733978. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=1300792. 
  34. "A more unified picture for the thermodynamics of nucleic acid duplex melting: A characterization by calorimetric and volumetric techniques". Proc Natl Acad Sci USA 96 (14): 7853–8. 1999. Bibcode 1999PNAS...96.7853C. doi:10.1073/pnas.96.14.7853. PMC 22151. PMID 10393911. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=22151. 
  35. "Open complex formation by Escherichia coli RNA polymerase: the mechanism of polymerase-induced strand separation of double helical DNA". Mol Microbiol 16 (5): 817–24. 1995. doi:10.1111/j.1365-2958.1995.tb02309.x. PMID 7476180. 
  36. "Single-stranded adenine-rich DNA and RNA retain structural characteristics of their respective double-stranded conformations and show directional differences in stacking pattern". Biochemistry 43 (51): 15996–6010. 2004. doi:10.1021/bi048221v. PMID 15609994. 
  37. Designation of the two strands of DNA JCBN/NC-IUB Newsletter 1989. Retrieved 7 May 2008
  38. "Non-coding RNAs: hope or hype?". Trends Genet 21 (5): 289–97. 2005. doi:10.1016/j.tig.2005.03.007. PMID 15851066. 
  39. Munroe SH (2004). "Diversity of antisense regulation in eukaryotes: multiple mechanisms, emerging patterns". J Cell Biochem 93 (4): 664–71. doi:10.1002/jcb.20252. PMID 15389973. 
  40. "Overlapping genes in vertebrate genomes". Comput Biol Chem 29 (1): 1–12. 2005. doi:10.1016/j.compbiolchem.2004.12.006. PMID 15680581. 
  41. "Properties of overlapping genes are conserved across microbial genomes". Genome Res 14 (11): 2268–72. 2004. doi:10.1101/gr.2433104. PMC 525685. PMID 15520290. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=525685. 
  42. "Diversity of coding strategies in influenza viruses". Trends Genet 7 (8): 261–6. 1991. doi:10.1016/0168-9525(91)90326-L. PMID 1771674. 
  43. "DNA mechanics". Annu Rev Biomed Eng 7: 21–53. 2005. doi:10.1146/annurev.bioeng.6.062403.132016. PMID 16004565. 
  44. 44,0 44,1 Champoux JJ (2001). "DNA topoisomerases: structure, function, and mechanism". Annu Rev Biochem 70: 369–413. doi:10.1146/annurev.biochem.70.1.369. PMID 11395412. 
  45. 45,0 45,1 Wang JC (2002). "Cellular roles of DNA topoisomerases: a molecular perspective". Nature Reviews Molecular Cell Biology 3 (6): 430–40. doi:10.1038/nrm831. PMID 12042765. 
  46. "Recognition of Z-RNA and Z-DNA determinants by polyamines in solution: experimental and theoretical studies". J Biomol Struct Dyn 6 (2): 299–309. 1988. doi:10.1080/07391102.1988.10507714. PMID 2482766. 
  47. "The Structure of Sodium Thymonucleate Fibres I. The Influence of Water Content". Acta Crystallogr 6 (8–9): 673–7. 6 March 1953. doi:10.1107/S0365110X53001939. http://journals.iucr.org/q/issues/1953/08-09/00/a00979/a00979.pdf. 
    "The structure of sodium thymonucleate fibres. II. The cylindrically symmetrical Patterson function". Acta Crystallogr 6 (8–9): 678–85. 1953. doi:10.1107/S0365110X53001940. 
  48. 48,0 48,1 "Molecular Configuration in Sodium Thymonucleate. Franklin R. and Gosling R.G" (PDF). Nature 171 (4356): 740–1. 1953. Bibcode 1953Natur.171..740F. doi:10.1038/171740a0. PMID 13054694. http://www.nature.com/nature/dna50/franklingosling.pdf. 
  49. 49,0 49,1 "Molecular Structure of Deoxypentose Nucleic Acids" (PDF). Nature 171 (4356): 738–740. 1953. Bibcode 1953Natur.171..738W. doi:10.1038/171738a0. PMID 13054693. http://www.nature.com/nature/dna50/wilkins.pdf. 
  50. "Polymorphism of DNA double helices". J. Mol. Biol. 143 (1): 49–72. 1980. doi:10.1016/0022-2836(80)90124-2. PMID 7441761. 
  51. Baianu, I.C. (1980). "Structural Order and Partial Disorder in Biological systems". Bull. Math. Biol. 42 (4): 137–141. doi:10.1016/s0092-8240(80)80083-8.  http://cogprints.org/3822/
  52. Hosemann R., Bagchi R.N., Direct analysis of diffraction by matter, North-Holland Publs., Amsterdam – New York, 1962.
  53. Baianu, I.C. (1978). "X-ray scattering by partially disordered membrane systems". Acta Crystallogr. A 34 (5): 751–3. Bibcode 1978AcCrA..34..751B. doi:10.1107/S0567739478001540. 
  54. "Crystal structures of A-DNA duplexes". Biopolymers 44 (1): 45–63. 1997. doi:10.1002/(SICI)1097-0282(1997)44:1<45::AID-BIP4>3.0.CO;2-#. PMID 9097733. 
  55. "A-form conformational motifs in ligand-bound DNA structures". J. Mol. Biol. 300 (4): 819–40. 2000. doi:10.1006/jmbi.2000.3690. PMID 10891271. 
  56. "DNA methylation and Z-DNA formation as mediators of quantitative differences in the expression of alleles". Immunol Rev 184: 286–98. 2001. doi:10.1034/j.1600-065x.2001.1840125.x. PMID 12086319. 
  57. "Z-DNA-binding proteins can act as potent effectors of gene expression in vivo". Proc. Natl. Acad. Sci. U.S.A. 99 (26): 16666–71. 2002. Bibcode 2002PNAS...9916666O. doi:10.1073/pnas.262672699. PMC 139201. PMID 12486233. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=139201. 
  58. "The chemistry and biology of left-handed Z-DNA". Annual Review of Biochemistry 53: 791–846. 1984. doi:10.1146/annurev.bi.53.070184.004043. PMID 6383204. 
  59. Sinden, Richard R (1994-01-15). DNA structure and function, 1st, 398, Academic Press. ISBN 0-12-645750-6.
  60. Ho PS (1994-09-27). "The non-B-DNA structure of d(CA/TG)n does not differ from that of Z-DNA". Proc Natl Acad Sci USA 91 (20): 9549–9553. Bibcode 1994PNAS...91.9549H. doi:10.1073/pnas.91.20.9549. PMC 44850. PMID 7937803. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=44850. 
  61. 61,0 61,1 Palmer, Jason. “Arsenic-loving bacteria may help in hunt for alien life”, BBC News, 2 December 2010. Truy cập 2 December 2010.
  62. 62,0 62,1 Bortman, Henry. “Arsenic-Eating Bacteria Opens New Possibilities for Alien Life”, 2 December 2010. Truy cập 2 December 2010.
  63. Katsnelson, Alla (2 December 2010). "Arsenic-eating microbe may redefine chemistry of life". Nature News. doi:10.1038/news.2010.645. http://www.nature.com/news/2010/101202/full/news.2010.645.html. 
  64. Cressey, Daniel (3 October 2012). "'Arsenic-life' Bacterium Prefers Phosphorus after all". Nature News. doi:10.1038/nature.2012.11520. 
  65. 65,0 65,1 "Identification of a specific telomere terminal transferase activity in Tetrahymena extracts". Cell 43 (2 Pt 1): 405–13. 1985. doi:10.1016/0092-8674(85)90170-9. PMID 3907856. 
  66. 66,0 66,1 66,2 "The telomerase reverse transcriptase: components and regulation". Genes Dev 12 (8): 1073–85. 1998. doi:10.1101/gad.12.8.1073. PMID 9553037. 
  67. "Normal human chromosomes have long G-rich telomeric overhangs at one end". Genes Dev 11 (21): 2801–9. 1997. doi:10.1101/gad.11.21.2801. PMC 316649. PMID 9353250. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=316649. 
  68. Created from NDB UD0017
  69. 69,0 69,1 "Quadruplex DNA: sequence, topology and structure". Nucleic Acids Res 34 (19): 5402–15. 2006. doi:10.1093/nar/gkl655. PMC 1636468. PMID 17012276. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=1636468. 
  70. "Crystal structure of parallel quadruplexes from human telomeric DNA". Nature 417 (6891): 876–80. 2002. Bibcode 2002Natur.417..876P. doi:10.1038/nature755. PMID 12050675. 
  71. "Mammalian telomeres end in a large duplex loop". Cell 97 (4): 503–14. 1999. doi:10.1016/S0092-8674(00)80760-6. PMID 10338214. 
  72. Seeman NC (2005). "DNA enables nanoscale control of the structure of matter". Q. Rev. Biophys. 38 (4): 363–71. doi:10.1017/S0033583505004087. PMC 3478329. PMID 16515737. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=3478329. 
  73. "Epigenetic regulation of human embryonic stem cells". Frontiers in Genetics 3: 238. 2012. doi:10.3389/fgene.2012.00238. PMC 3488762. PMID 23133442. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=3488762. 
  74. "Genomic DNA methylation: the mark and its mediators". Trends Biochem Sci 31 (2): 89–97. 2006. doi:10.1016/j.tibs.2005.12.008. PMID 16403636. 
  75. Bird A (2002). "DNA methylation patterns and epigenetic memory". Genes Dev 16 (1): 6–21. doi:10.1101/gad.947102. PMID 11782440. 
  76. "Cytosine methylation and DNA repair". Curr Top Microbiol Immunol. Current Topics in Microbiology and Immunology 301: 283–315. 2006. doi:10.1007/3-540-31390-7_11. ISBN 3-540-29114-8. PMID 16570853. 
  77. "The nuclear DNA base 5-hydroxymethylcytosine is present in Purkinje neurons and the brain". Science 324 (5929): 929–30. 2009. Bibcode 2009Sci...324..929K. doi:10.1126/science.1169786. PMC 3263819. PMID 19372393. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=3263819. 
  78. "N6-methyladenine: the other methylated base of DNA". BioEssays 28 (3): 309–15. 2006. doi:10.1002/bies.20342. PMC 2754416. PMID 16479578. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=2754416. 
  79. "beta-D-glucosyl-hydroxymethyluracil: a novel modified base present in the DNA of the parasitic protozoan T. brucei". Cell 75 (6): 1129–36. 1993. doi:10.1016/0092-8674(93)90322-H. PMID 8261512. 
  80. Tạo ra từ PDB 1JDG DOI
  81. "Bipyrimidine photoproducts rather than oxidative lesions are the main type of DNA damage involved in the genotoxic effect of solar UVA radiation". Biochemistry 42 (30): 9221–6. 2003. doi:10.1021/bi034593c. PMID 12885257. 
  82. "Hydroxyl radicals and DNA base damage". Mutat Res 424 (1–2): 9–21. 1999. doi:10.1016/S0027-5107(99)00004-4. PMID 10064846. 
  83. "Oxidative decay of DNA". J. Biol. Chem. 272 (32): 19633–6. 1997. doi:10.1074/jbc.272.32.19633. PMID 9289489. 
  84. "Regulation and mechanisms of mammalian double-strand break repair". Oncogene 22 (37): 5792–812. 2003. doi:10.1038/sj.onc.1206679. PMID 12947387. 
  85. Johnson, George, “Unearthing Prehistoric Tumors, and Debate”, 28 December 2010. “"If we lived long enough, sooner or later we all would get cancer."”
  86. (2002) “The Preventable Causes of Cancer”, Molecular biology of the cell, 4th, New York: Garland Science. ISBN 0-8153-4072-9. “A certain irreducible background incidence of cancer is to be expected regardless of circumstances: mutations can never be absolutely avoided, because they are an inescapable consequence of fundamental limitations on the accuracy of DNA replication, as discussed in Chapter 5. If a human could live long enough, it is inevitable that at least one of his or her cells would eventually accumulate a set of mutations sufficient for cancer to develop.”
  87. Bernstein H, Payne CM, Bernstein C, Garewal H, Dvorak K (2008). Cancer and aging as consequences of un-repaired DNA damage. In: New Research on DNA Damages (Editors: Honoka Kimura and Aoi Suzuki) Nova Science Publishers, Inc., New York, Chapter 1, pp. 1–47. open access, but read only Cancer and Aging as Consequences of Un-Repaired DNA Damage (pp. 1-47) ISBN 978-1604565812. Cancer and Aging as Consequences of Un-Repaired DNA Damage (pp. 1-47)
  88. Hoeijmakers JH (October 2009). "DNA damage, aging, and cancer". N. Engl. J. Med. 361 (15): 1475–85. doi:10.1056/NEJMra0804615. PMID 19812404. 
  89. "A review and appraisal of the DNA damage theory of ageing". Mutat. Res. 728 (1–2): 12–22. 2011. doi:10.1016/j.mrrev.2011.05.001. PMID 21600302. 
  90. "The genetic toxicology of acridines". Mutat Res 258 (2): 123–60. 1991. doi:10.1016/0165-1110(91)90006-H. PMID 1881402. 
  91. "Mechanism of action in thalidomide teratogenesis". Biochem Pharmacol 59 (12): 1489–99. 2000. doi:10.1016/S0006-2952(99)00388-3. PMID 10799645. 
  92. Jeffrey AM (1985). "DNA modification by chemical carcinogens". Pharmacol Ther 28 (2): 237–72. doi:10.1016/0163-7258(85)90013-0. PMID 3936066. 
  93. "Intercalators as anticancer drugs". Curr Pharm Des 7 (17): 1745–80. 2001. doi:10.2174/1381612013397113. PMID 11562309. 
  94. "The sequence of the human genome". Science 291 (5507): 1304–51. 2001. Bibcode 2001Sci...291.1304V. doi:10.1126/science.1058040. PMID 11181995. 
  95. "The bacterial nucleoid: a highly organized and dynamic structure". J Cell Biochem 96 (3): 506–21. 2005. doi:10.1002/jcb.20519. PMID 15988757. 
  96. "Guide to the draft human genome". Nature 409 (6822): 824–6. 2001. Bibcode 2001Natur.409..824W. doi:10.1038/35057000. PMID 11236998. 
  97. Gregory TR (2005). "The C-value enigma in plants and animals: a review of parallels and an appeal for partnership". Annals of Botany 95 (1): 133–46. doi:10.1093/aob/mci009. PMID 15596463. 
  98. "Identification and analysis of functional elements in 1% of the human genome by the ENCODE pilot project". Nature 447 (7146): 799–816. 2007. Bibcode 2007Natur.447..799B. doi:10.1038/nature05874. PMC 2212820. PMID 17571346. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=2212820. 
  99. Hình tạo từ PDB 1MSW
  100. "The role of heterochromatin in centromere function". Philosophical Transactions of the Royal Society B 360 (1455): 569–79. 2005. doi:10.1098/rstb.2004.1611. PMC 1569473. PMID 15905142. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=1569473. 
  101. "Molecular Fossils in the Human Genome: Identification and Analysis of the Pseudogenes in Chromosomes 21 and 22". Genome Res 12 (2): 272–80. 2002. doi:10.1101/gr.207102. PMC 155275. PMID 11827946. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=155275. 
  102. "Studying genomes through the aeons: protein families, pseudogenes and proteome evolution". J Mol Biol 318 (5): 1155–74. 2002. doi:10.1016/S0022-2836(02)00109-2. PMID 12083509. 
  103. Albà M (2001). "Replicative DNA polymerases". Genome Biol 2 (1): reviews3002.1–reviews3002.4. doi:10.1186/gb-2001-2-1-reviews3002. PMC 150442. PMID 11178285. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=150442. 
  104. “Replication fork”. Andrew Staroscik. scienceprimer.com. Truy cập Lỗi khi kêu gọi {{Chú thích web}}: hai tham số url title phải được chỉ định..
  105. (2010) “Roles of Extracellular DNA in Bacterial Ecosystems”, Extracellular Nucleic Acids, 25–38, Springer. ISBN 978-3-642-12616-1.
  106. Vlassov, V. V.; Laktionov, P. P.; Rykova, E. Y. (2007). "Extracellular nucleic acids". BioEssays 29: 654–667. doi:10.1002/bies.20604. 
  107. Finkel, S. E.; Kolter, R. (2001). "DNA as a nutrient: novel role for bacterial competence gene homologs". J. Bacteriol. 183: 6288–6293. doi:10.1128/JB.183.21.6288-6293.2001. http://jb.asm.org/content/183/21/6288.full. 
  108. Mulcahy, H.; Charron-Mazenod, L.; Lewenza, S. (2008). "Extracellular DNA chelates cations and induces antibiotic resistance in Pseudomonas aeruginosa biofilms". PLoS Pathog. 4: e1000213. doi:10.1371/journal.ppat.1000213. http://journals.plos.org/plospathogens/article?id=10.1371/journal.ppat.1000213. 
  109. Berne, C.; Kysela, D. T.; Brun, Y. V. (2010). "A bacterial extracellular DNA inhibits settling of motile progeny cells within a biofilm". Mol. Microbiol. 77: 815–829. doi:10.1111/j.1365-2958.2010.07267.x. http://onlinelibrary.wiley.com/doi/10.1111/j.1365-2958.2010.07267.x/full. 
  110. Whitchurch, C. B.; Tolker-Nielsen, T.; Ragas, P. C.; Mattick, J. S. (2002). "Extracellular DNA required for bacterial biofilm formation". Science 295: 1487. doi:10.1126/science.295.5559.1487. https://www.researchgate.net/publication/11503087_Extracellular_DNA_Required_for_Bacterial_Biofilm_Formation. 
  111. Hu, W.; Li, L.; Sharma, S.; Wang, J.; McHardy, I.; Lux, R.; Yang, Z.; He, X. et al. (2012). "DNA Builds and Strengthens the Extracellular Matrix in Myxococcus xanthus Biofilms by Interacting with Exopolysaccharides". PLoS ONE 7 (12): e51905. Bibcode 2012PLoSO...751905H. doi:10.1371/journal.pone.0051905. 
  112. "Diversity of prokaryotic chromosomal proteins and the origin of the nucleosome". Cell Mol Life Sci 54 (12): 1350–64. 1998. doi:10.1007/s000180050259. PMID 9893710. 
  113. Dame RT (2005). "The role of nucleoid-associated proteins in the organization and compaction of bacterial chromatin". Mol. Microbiol. 56 (4): 858–70. doi:10.1111/j.1365-2958.2005.04598.x. PMID 15853876. 
  114. "Crystal structure of the nucleosome core particle at 2.8 A resolution". Nature 389 (6648): 251–60. 1997. Bibcode 1997Natur.389..251L. doi:10.1038/38444. PMID 9305837. 
  115. "Translating the histone code". Science 293 (5532): 1074–80. 2001. doi:10.1126/science.1063127. PMID 11498575. 
  116. Ito T (2003). "Nucleosome assembly and remodelling". Curr Top Microbiol Immunol. Current Topics in Microbiology and Immunology 274: 1–22. doi:10.1007/978-3-642-55747-7_1. ISBN 978-3-540-44208-0. PMID 12596902. 
  117. Thomas JO (2001). "HMG1 and 2: architectural DNA-binding proteins". Biochem Soc Trans 29 (Pt 4): 395–401. doi:10.1042/BST0290395. PMID 11497996. 
  118. "HMG domain proteins: architectural elements in the assembly of nucleoprotein structures". Trends Genet 10 (3): 94–100. 1994. doi:10.1016/0168-9525(94)90232-1. PMID 8178371. 
  119. "Replication protein A (RPA): the eukaryotic SSB". Crit Rev Biochem Mol Biol 34 (3): 141–80. 1999. doi:10.1080/10409239991209255. PMID 10473346. 
  120. Created from PDB 1LMB
  121. "Mediator of transcriptional regulation". Annu Rev Biochem 69: 729–49. 2000. doi:10.1146/annurev.biochem.69.1.729. PMID 10966474. 
  122. "Biological control through regulated transcriptional coactivators". Cell 119 (2): 157–67. 2004. doi:10.1016/j.cell.2004.09.037. PMID 15479634. 
  123. "A global transcriptional regulatory role for c-Myc in Burkitt's lymphoma cells". Proc Natl Acad Sci USA 100 (14): 8164–9. 2003. Bibcode 2003PNAS..100.8164L. doi:10.1073/pnas.1332764100. PMC 166200. PMID 12808131. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=166200. 
  124. Created from PDB 1RVA
  125. "Biology of DNA restriction". Microbiol Rev 57 (2): 434–50. 1993. PMC 372918. PMID 8336674. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=372918. 
  126. 126,0 126,1 "Structural and mechanistic conservation in DNA ligases". Nucleic Acids Res 28 (21): 4051–8. 2000. doi:10.1093/nar/28.21.4051. PMC 113121. PMID 11058099. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=113121. 
  127. "Recent advances in understanding structure-function relationships in the type II topoisomerase mechanism". Biochem Soc Trans 33 (Pt 6): 1465–70. 2005. doi:10.1042/BST20051465. PMID 16246147. 
  128. "Unraveling DNA helicases. Motif, structure, mechanism and function". Eur J Biochem 271 (10): 1849–63. 2004. doi:10.1111/j.1432-1033.2004.04094.x. PMID 15128295. 
  129. "Polymerase structures and function: variations on a theme?". J Bacteriol 177 (22): 6321–9. 1995. PMC 177480. PMID 7592405. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=177480. 
  130. "Eukaryotic DNA polymerases". Annu Rev Biochem 71: 133–63. 2002. doi:10.1146/annurev.biochem.71.090501.150041. PMID 12045093. 
  131. "Cellular DNA replicases: components and dynamics at the replication fork". Annu Rev Biochem 74: 283–315. 2005. doi:10.1146/annurev.biochem.73.011303.073859. PMID 15952889. 
  132. "The reverse transcriptase of HIV-1: from enzymology to therapeutic intervention". FASEB J 8 (8): 497–503. 1 May 1994. PMID 7514143. 
  133. Martinez E (2002). "Multi-protein complexes in eukaryotic gene transcription". Plant Mol Biol 50 (6): 925–47. doi:10.1023/A:1021258713850. PMID 12516863. 
  134. Created from PDB 1M6G
  135. "Chromosome territories, nuclear architecture and gene regulation in mammalian cells". Nature Reviews Genetics 2 (4): 292–301. 2001. doi:10.1038/35066075. PMID 11283701. 
  136. "An integrated view of protein evolution". Nature Reviews Genetics 7 (5): 337–48. 2006. doi:10.1038/nrg1838. PMID 16619049. 
  137. "The role of double-strand break repair – insights from human genetics". Nature Reviews Genetics 7 (1): 45–54. 2006. doi:10.1038/nrg1746. PMID 16369571. 
  138. "Mammalian Rad51 protein: a RecA homologue with pleiotropic functions". Biochimie 79 (9–10): 587–92. 1997. doi:10.1016/S0300-9084(97)82007-X. PMID 9466696. 
  139. "Clarifying the mechanics of DNA strand exchange in meiotic recombination". Nature 442 (7099): 153–8. 2006. Bibcode 2006Natur.442..153N. doi:10.1038/nature04885. PMID 16838012. 
  140. "The RuvABC resolvasome". Eur J Biochem 269 (22): 5492–501. 2002. doi:10.1046/j.1432-1033.2002.03250.x. PMID 12423347. 
  141. Joyce GF (2002). "The antiquity of RNA-based evolution". Nature 418 (6894): 214–21. Bibcode 2002Natur.418..214J. doi:10.1038/418214a. PMID 12110897. 
  142. Orgel LE (2004). "Prebiotic chemistry and the origin of the RNA world". Crit Rev Biochem Mol Biol 39 (2): 99–123. doi:10.1080/10409230490460765. PMID 15217990. 
  143. Davenport RJ (2001). "Ribozymes. Making copies in the RNA world". Science 292 (5520): 1278. doi:10.1126/science.292.5520.1278a. PMID 11360970. 
  144. Szathmáry E (1992). "What is the optimum size for the genetic alphabet?". Proc Natl Acad Sci USA 89 (7): 2614–8. Bibcode 1992PNAS...89.2614S. doi:10.1073/pnas.89.7.2614. PMC 48712. PMID 1372984. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=48712. 
  145. Lindahl T (1993). "Instability and decay of the primary structure of DNA". Nature 362 (6422): 709–15. Bibcode 1993Natur.362..709L. doi:10.1038/362709a0. PMID 8469282. 
  146. "Isolation of a 250 million-year-old halotolerant bacterium from a primary salt crystal". Nature 407 (6806): 897–900. 2000. doi:10.1038/35038060. PMID 11057666. 
  147. "Geologically ancient DNA: fact or artefact?". Trends Microbiol 13 (5): 212–20. 2005. doi:10.1016/j.tim.2005.03.010. PMID 15866038. 
  148. "Curiously modern DNA for a "250 million-year-old" bacterium". J Mol Evol 54 (1): 134–7. 2002. doi:10.1007/s00239-001-0025-x. PMID 11734907. 
  149. "Carbonaceous meteorites contain a wide range of extraterrestrial nucleobases". Proc. Natl. Acad. Sci. U.S.A. 108 (34): 13995–8. August 2011. Bibcode 2011PNAS..10813995C. doi:10.1073/pnas.1106493108. PMC 3161613. PMID 21836052. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=3161613. 
  150. Steigerwald, John (8 August 2011). “NASA Researchers: DNA Building Blocks Can Be Made in Space”. NASA. Truy cập 10 August 2011.
  151. ScienceDaily Staff (9 August 2011). “DNA Building Blocks Can Be Made in Space, NASA Evidence Suggests”. ScienceDaily. Truy cập 9 August 2011.
  152. Marlaire, Ruth (3 March 2015). “NASA Ames Reproduces the Building Blocks of Life in Laboratory”. NASA. Truy cập 5 March 2015.
  153. "Construction of hybrid viruses containing SV40 and lambda phage DNA segments and their propagation in cultured monkey cells". Cell 9 (4 PT 2): 695–705. 1976. doi:10.1016/0092-8674(76)90133-1. PMID 189942. 
  154. Houdebine LM (2007). "Transgenic animal models in biomedical research". Methods Mol Biol 360: 163–202. doi:10.1385/1-59745-165-7:163. ISBN 1-59745-165-7. PMID 17172731. 
  155. "Multigene engineering: dawn of an exciting new era in biotechnology". Current Opinion in Biotechnology 13 (2): 136–41. 2002. doi:10.1016/S0958-1669(02)00297-5. PMC 3481857. PMID 11950565. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=3481857. 
  156. Job D (2002). "Plant biotechnology in agriculture". Biochimie 84 (11): 1105–10. doi:10.1016/S0300-9084(02)00013-5. PMID 12595138. 
  157. "Likelihood ratios for DNA identification". Proc Natl Acad Sci USA 91 (13): 6007–11. 1994. Bibcode 1994PNAS...91.6007C. doi:10.1073/pnas.91.13.6007. PMC 44126. PMID 8016106. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=44126. 
  158. "Interpreting DNA mixtures". J Forensic Sci 42 (2): 213–22. 1997. PMID 9068179. 
  159. "Individual-specific 'fingerprints' of human DNA". Nature 316 (6023): 76–9. 1985. Bibcode 1985Natur.316...76J. doi:10.1038/316076a0. PMID 2989708. 
  160. Colin Pitchfork — first murder conviction on DNA evidence also clears the prime suspect Forensic Science Service Accessed 23 December 2006
  161. “DNA Identification in Mass Fatality Incidents”. U.S. Department of Justice, Office of Justice Programs (September 2006).
  162. "Paternity Blood Tests That Work Early in a Pregnancy" New York Times June 20, 2012
  163. 163,0 163,1 Breaker, Ronald R.; Joyce, Gerald F. (1994-01-12). "A DNA enzyme that cleaves RNA". Chemistry & Biology 1 (4): 223–229. doi:10.1016/1074-5521(94)90014-0. ISSN 1074-5521. PMID 9383394. http://ww2.chemistry.gatech.edu/~lw26/bCourse_Information/DNA_technology/papers/dnazyme_4.pdf. 
  164. Chandra, Madhavaiah; Sachdeva, Amit; Silverman, Scott K. "DNA-catalyzed sequence-specific hydrolysis of DNA". Nature Chemical Biology 5 (10): 718–720. doi:10.1038/nchembio.201. PMC 2746877. PMID 19684594. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2746877/. 
  165. Carmi, Nir; Shultz, Lisa A.; Breaker, Ronald R. (1996-01-12). "In vitro selection of self-cleaving DNAs". Chemistry & Biology 3 (12): 1039–1046. doi:10.1016/S1074-5521(96)90170-2. ISSN 1074-5521. PMID 9000012. http://www.sciencedirect.com/science/article/pii/S1074552196901702. 
  166. Torabi, Seyed-Fakhreddin; Wu, Peiwen; McGhee, Claire E.; Chen, Lu; Hwang, Kevin; Zheng, Nan; Cheng, Jianjun; Lu, Yi (2015-05-12). "In vitro selection of a sodium-specific DNAzyme and its application in intracellular sensing". Proceedings of the National Academy of Sciences 112 (19): 5903–5908. doi:10.1073/pnas.1420361112. ISSN 0027-8424. PMC 4434688. PMID 25918425. http://www.pnas.org/content/112/19/5903. 
  167. (2001) Bioinformatics: The Machine Learning Approach, MIT Press. ISBN 978-0-262-02506-5.
  168. Gusfield, Dan. Algorithms on Strings, Trees, and Sequences: Computer Science and Computational Biology. Cambridge University Press, 15 January 1997. ISBN 978-0-521-58519-4.
  169. Sjölander K (2004). "Phylogenomic inference of protein molecular function: advances and challenges". Bioinformatics 20 (2): 170–9. doi:10.1093/bioinformatics/bth021. PMID 14734307. 
  170. Mount DM (2004). Bioinformatics: Sequence and Genome Analysis, 2, Cold Spring Harbor, NY: Cold Spring Harbor Laboratory Press. ISBN 0-87969-712-1.
  171. Rothemund PW (2006). "Folding DNA to create nanoscale shapes and patterns". Nature 440 (7082): 297–302. Bibcode 2006Natur.440..297R. doi:10.1038/nature04586. PMID 16541064. 
  172. "Self-assembly of a nanoscale DNA box with a controllable lid". Nature 459 (7243): 73–6. 2009. Bibcode 2009Natur.459...73A. doi:10.1038/nature07971. PMID 19424153. 
  173. "DNA nanotechnology: a nanomachine goes live". Nat Nanotechnol 4 (5): 281–2. 2009. Bibcode 2009NatNa...4..281I. doi:10.1038/nnano.2009.101. PMID 19421208. 
  174. "Assembling materials with DNA as the guide". Science 321 (5897): 1795–9. 2008. Bibcode 2008Sci...321.1795A. doi:10.1126/science.1154533. PMID 18818351. 
  175. Wray GA (2002). "Dating branches on the Tree of Life using DNA". Genome Biol 3 (1): reviews0001.1–reviews0001.7. doi:10.1046/j.1525-142X.1999.99010.x. PMC 150454. PMID 11806830. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=150454. 
  176. Lost Tribes of Israel, Nova, PBS airdate: 22 February 2000. Transcript available from PBS.org. Retrieved 4 March 2006.
  177. Kleiman, Yaakov. "The Cohanim/DNA Connection: The fascinating story of how DNA studies confirm an ancient biblical tradition". aish.com (13 January 2000). Retrieved 4 March 2006.
  178. "Towards practical, high-capacity, low-maintenance information storage in synthesized DNA". Nature 494 (7435): 77–80. 23 January 2013. Bibcode 2013Natur.494...77G. doi:10.1038/nature11875. PMC 3672958. PMID 23354052. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=3672958. 
  179. Naik, Gautam. “Storing Digital Data in DNA”, 24 January 2013. Truy cập 24 January 2013.
  180. Comment by Dandekar, T., Lopez, D., Schaack, D. (2013) http://www.nature.com/nature/journal/v494/n7435/abs/nature11875.html#comment-57415
  181. Emerging Technology Final, Dandekar T., Lopez, D., Programmable bacterial membranes with active DNA storage; presentation for the University of Würzburg for the Royal Society for Chemistry, London, 2016-06-29
  182. Patent "Molecular highly integrated data storage via active control DNA", DE102013004584 A1, https://www.google.com/patents/DE102013004584A1"
  183. Miescher, Friedrich (1871) "Ueber die chemische Zusammensetzung der Eiterzellen" (On the chemical composition of pus cells), Medicinisch-chemische Untersuchungen, 4: 441–460. From p. 456: "Ich habe mich daher später mit meinen Versuchen an die ganzen Kerne gehalten, die Trennung der Körper, die ich einstweilen ohne weiteres Präjudiz als lösliches und unlösliches Nuclein bezeichnen will, einem günstigeren Material überlassend." (Therefore, in my experiments I subsequently limited myself to the whole nucleus, leaving to a more favorable material the separation of the substances, that for the present, without further prejudice, I will designate as soluble and insoluble nuclear material ("Nuclein").)
  184. Dahm R (2008). "Discovering DNA: Friedrich Miescher and the early years of nucleic acid research". Hum. Genet. 122 (6): 565–81. doi:10.1007/s00439-007-0433-0. PMID 17901982. 
  185. Xem:
    • Albrect Kossel (1879) "Ueber Nucleïn der Hefe" (On nuclein in yeast) Zeitschrift für physiologische Chemie, 3: 284-291.
    • Albrect Kossel (1880) "Ueber Nucleïn der Hefe II" (On nuclein in yeast, Part 2) Zeitschrift für physiologische Chemie, 4: 290-295.
    • Albrect Kossel (1881) "Ueber die Verbreitung des Hypoxanthins im Thier- und Pflanzenreich" (On the distribution of hypoxanthins in the animal and plant kingdoms) Zeitschrift für physiologische Chemie, 5: 267-271.
    • Albrect Kossel, Untersuchungen über die Nucleine und ihre Spaltungsprodukte [Investigations into nuclein and its cleavage products] (Strassburg, Germany: K.J. Trübne, 1881), 19 pages.
    • Albrect Kossel (1882) Hoppe-Seyler's Zeitschrift Für Physiologische Chemie "Ueber Xanthin und Hypoxanthin" (On xanthin and hypoxanthin), Zeitschrift für physiologische Chemie, 6: 422-431.
    • Albrect Kossel (1883) "Hoppe-Seyler's Zeitschrift Für Physiologische Chemie (On the chemistry of the cell nucleus), Zeitschrift für physiologische Chemie, 7: 7-22.
    • Albrect Kossel (1886) "Weitere Beiträge zur Chemie des Zellkerns" (Further contributions to the chemistry of the cell nucleus), Zeitschrift für Physiologische Chemie, 10: 248-264. Có thể xem trực tuyến tại: Viện Lịch sử Khoa học Max Planck, Berlin, Đức. Tại trang 264, Kossel remarked presciently: "Der Erforschung der quantitativen Verhältnisse der vier stickstoffreichen Basen, der Abhängigkeit ihrer Menge von den physiologischen Zuständen der Zelle, verspricht wichtige Aufschlüsse über die elementaren physiologisch-chemischen Vorgänge." (The study of the quantitative relations of the four nitrogenous bases — [and] of the dependence of their quantity on the physiological states of the cell — promises important insights into the fundamental physiological-chemical processes.)
  186. Jones ME (September 1953). "Albrecht Kossel, A Biographical Sketch". Yale Journal of Biology and Medicine (National Center for Biotechnology Information) 26 (1): 80–97. PMC 2599350. PMID 13103145. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=2599350. 
  187. Levene P (1 December 1919). "The structure of yeast nucleic acid". J Biol Chem 40 (2): 415–24. 
  188. Xem:
    • W. T. Astbury and Florence O. Bell (1938) "Some recent developments in the X-ray study of proteins and related structures," Cold Spring Harbor Symposia on Quantitative Biology, 6: 109-121. Có thể xem trực tuyến tại: Trang web của Đại học Leeds.
    • Astbury, W. T., (1947) "X-ray studies of nucleic acids," Symposia of the Society for Experimental Biology, 1: 66-76. Có thể xem trực tuyến tại: Trang web của Đại học Bang Oregon.
  189. Koltsov đề xuất rằng các thông tin di truyền của một tế bào được mã hoá trong một chuỗi dài các axit amino. Xem:
    • Н. К. Кольцов, "Физико-химические основы морфологии" (The physical-chemical basis of morphology) -- speech given at the 3rd All-Union Meeting of Zoologist, Anatomists, and Histologists at Leningrad, U.S.S.R., 12 tháng 12 năm 1927.
    • In lại trong: Успехи экспериментальной биологии (Advances in Experimental Biology), series B, 7 (1):  ?-? (1928).
    • In lại bằng tiếng Đức trong: Nikolaj K. Koltzoff (1928) "Physikalisch-chemische Grundlagen der Morphologie" (The physical-chemical basis of morphology), Biologisches Zentralblatt, 48 (6): 345-369.
    • In 1934, Koltsov contended that the proteins that contain a cell's genetic information replicate. Xem: N. K. Koltzoff (5 tháng 10 năm 1934) "The structure of the chromosomes in the salivary glands of Drosophila," Science, 80 (2075): 312-313. Từ trang 313: "I think that the size of the chromosomes in the salivary glands [of Drosophila] is determined through the multiplication of genonemes. By this term I designate the axial thread of the chromosome, in which the geneticists locate the linear combination of genes; … In the normal chromosome there is usually only one genoneme; before cell-division this genoneme has become divided into two strands."
  190. Soyfer VN (2001). "The consequences of political dictatorship for Russian science". Nature Reviews Genetics 2 (9): 723–729. doi:10.1038/35088598. PMID 11533721. 
  191. Griffith F (January 1928). "The significance of pneumococcal types". The Journal of Hygiene (London) 27 (2): 113–59. doi:10.1017/S0022172400031879. PMC 2167760. PMID 20474956. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=2167760. 
  192. "Bacterial gene transfer by natural genetic transformation in the environment". Microbiol. Rev. 58 (3): 563–602. 1994. PMC 372978. PMID 7968924. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=372978. 
  193. "Studies on the Chemical Nature of the Substance Inducing Transformation of Pneumococcal Types: Induction of Transformation by a Desoxyribonucleic Acid Fraction Isolated from Pneumococcus Type Iii". J Exp Med 79 (2): 137–158. 1944. doi:10.1084/jem.79.2.137. PMC 2135445. PMID 19871359. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=2135445. 
  194. "Independent Functions of Viral Protein and Nucleic Acid in Growth of Bacteriophage". J Gen Physiol 36 (1): 39–56. 1952. doi:10.1085/jgp.36.1.39. PMC 2147348. PMID 12981234. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=2147348. 
  195. The B-DNA X-ray pattern on the right of this linked image was obtained by Rosalind Franklin Raymond Gosling in May 1952 at high hydration levels of DNA and it has been labeled as "Photo 51"
  196. Nature Archives Double Helix of DNA: 50 Years
  197. “Rosalind Franklin's x-ray diffraction photo of structure B”. Osulibrary.oregonstate.edu. Truy cập 6 February 2011.
  198. The Nobel Prize in Physiology or Medicine 1962 Nobelprize.org Accessed 22 December 06
  199. Maddox B (23 January 2003). "The double helix and the 'wronged heroine'" (PDF). Nature 421 (6921): 407–408. Bibcode 2003Natur.421..407M. doi:10.1038/nature01399. PMID 12540909. http://www.biomath.nyu.edu/index/course/hw_articles/nature4.pdf. 
  200. Crick, F.H.C. On degenerate templates and the adaptor hypothesis (PDF). genome.wellcome.ac.uk (Lecture, 1955). Retrieved 22 December 2006.
  201. "The replication of DNA in Escherichia coli". Proc Natl Acad Sci USA 44 (7): 671–82. 1958. Bibcode 1958PNAS...44..671M. doi:10.1073/pnas.44.7.671. PMC 528642. PMID 16590258. http://www.pubmedcentral.nih.gov/articlerender.fcgi?tool=pmcentrez&artid=528642. 
  202. The Nobel Prize in Physiology or Medicine 1968 Nobelprize.org Accessed 22 December 06

Tham khảo[sửa]

Liên kết ngoài[sửa]


Liên kết đến đây