Dữ liệu DNA hiện có về Rùa

Từ VLOS
Bước tới: chuyển hướng, tìm kiếm

Liệt kê các trình tự đã thu được theo cây phân loại NCBI tại đây.

Megablast[sửa]

Sau khi tiến hành blastn (megablast) với 8 trình tự khởi điểm và đối chiếu với các trình tự đã thu được trước đây của các gen quan tâm trong họ Trionychidae, thấy có những trình tự mới với danh mục số thư viện được tải lên ở Tập tin:Accession-list-trinh-tu-moi-thu-duoc-tu-100-best-hit.zip. Thống kê số lượng các trình tự mới này theo khóa phân loại thể hiện trong phần ngoặc đơn như sau:

cytb

  • Trionychidae (68)

Apalone (64)

Pelodiscus (3)

Palea (1)

16SrRNA

  • turtles (73)

+Testudinidae (62)

Geochelone (61)

Psammobates (1)

+Cheloniidae (7)

Chelonia (6)

Natator (1)

+Geoemydidae (3)

Geoemyda (2)

Morenia (1)

+Trionychidae (1)

nd4

  • turtles (83)

+Emydidae (38)

Trachemys (26)

Pseudemys (6)

Glyptemys (4)

Terrapene (1)

Deirochelys (1)

+Trionychidae (21)

Trionyx (8)

Chitra (6)

Pelodiscus (4)

Palea (1)

Apalone (1)

Pelochelys (1)

+Testudinidae (19)

Psammobates (8)

Testudo (6)

Dipsochelys (5)

+Chelydridae (2)

+Cheloniidae (2)

Chelonia (1)

Lepidochelys (1)

+Pelomedusidae (1)

Hồ Hữu Thọ (thảo luận) 08:31, 10/4/2011 (ICT)

Thống kê số lượng trình tự[sửa]

A. Số lượng các trình tự của gen: cytb, 16SrRNA, nd4 đối với các loài thuộc họ Trionychidae:

  • Chi Amyda, 1, 1, 1

Amyda cartilaginea, 1, 1, 1

  • Chi Apalone, 28, 2, 5

Apalone ferox , 3, 2, 2

Apalone mutica , 1, 0, 1

Apalone spinifera aspera , 0, 0, 1

Apalone spinifera ater , 4, 0, 0

Apalone spinifera emoryi , 0, 0, 1

Apalone spinifera hartwegi , 4, 0, 0

Apalone spinifera pallida , 13, 0, 0

Apalone spinifera , 3, 0, 0

  • Chi Aspideretes, 13, 0, 0

Aspideretes leithii , 2, 0, 0

Aspideretes nigricans , 11, 0, 0

  • Chi Chitra, 3, 0, 5

Chitra vandijki , 3, 0, 5

  • Chi Cyclanorbis, 2, 0, 2

Cyclanorbis elegans , 1, 0, 1

Cyclanorbis senegalensis , 1, 0, 1

  • Chi Cycloderma, 2, 0, 2

Cycloderma aubryi , 1, 0, 1

Cycloderma frenatum , 1, 0, 1

  • Chi Dogania, 3, 2, 3

Dogania subplana , 3, 2, 3

  • Chi Lissemys, 7, 5, 6

Lissemys punctata andersoni , 0, 2, 1

Lissemys punctata punctata , 0, 1, 1

Lissemys scutata , 7, 2, 4

  • Chi Nilssonia, 21, 2, 4

Nilssonia formosa , 1, 0, 1

Nilssonia gangetica , 12, 1, 2

Nilssonia hurum , 8, 1, 1

  • Chi Palea, 3, 5, 2

Palea steindachneri , 3, 5, 2

  • Chi Pelochelys, 2, 0, 0

Pelochelys bibroni , 1, 0, 0

Pelochelys cantorii , 1, 0, 0

  • Chi Pelodiscus, 12, 7, 11

Pelodiscus maackii , 1, 0, 1

Pelodiscus parviformis , 0, 3, 0

Pelodiscus sinensis , 4, 4, 3

Pelodiscus sp. MTD D 42534 , 1, 0, 1

Pelodiscus sp. MTD D 43357 , 1, 0, 1

Pelodiscus sp. MTD D 44045 , 1, 0, 1

Pelodiscus sp. MTD D 44190 , 1, 0, 0

Pelodiscus sp. MTD TD 4236 , 0, 0, 1

Pelodiscus sp. MTD TD 5091 , 1, 0, 1

Pelodiscus sp. MTD TD 5093 , 1, 0, 1

Pelodiscus sp. MTD TD 5559 , 1, 0, 1

  • Chi Rafetus, 1, 0, 1

Rafetus euphraticus , 1, 0, 1

  • Chi Trionyx, 4, 8, 3

Trionyx axenaria , 1, 6, 0

Trionyx triunguis , 3, 2, 3

  • Viet Nam freshwater turtle BLT-2003 , 3, 2, 3

B. Có tất cả 65 loài thuộc bộ Testudines (mà không phải họ Trionychidae) có các trình tự của cả 3 gen: cytb, 16SrRNA, nd4: Tên thư viện của tất cả các trình tự được tải lên ở Tập tin:Accession-list-trinh-tu-dai-dien-cac-ho-khac-trong-bo-rua.zip. Danh mục 65 loài cùng với số lượng các trình tự quan tâm (cytb, 16SrRNA, nd4) được liệt kê trong dấu ngoặc đơn như sau:

  1. Acanthochelys pallidipectoris,1,1,1
  2. Acanthochelys radiolata,3,1,3
  3. Acanthochelys spixii,1,1,1
  4. Astrochelys radiata,51,1,7
  5. Batagur dhongoka,6,2,1
  6. Batagur kachuga,6,2,1
  7. Caretta caretta,1,3,1
  8. Carettochelys insculpta,2,2,2
  9. Chelonia mydas,4,7,1
  10. Chelonoidis chilensis,1,1,2
  11. Chelus fimbriata,1,1,1
  12. Chelydra serpentina,3,3,2
  13. Chinemys reevesi,1,1,1
  14. Chrysemys picta,7,2,2
  15. Cuora amboinensis,10,4,5
  16. Cuora aurocapitata,2,3,4
  17. Cuora flavomarginata,5,4,7
  18. Cuora galbinifrons,4,4,15
  19. Cuora pani,3,3,6
  20. Cuora trifasciata,1,1,35
  21. Cuora zhoui,1,1,18
  22. Cyclemys atripons,4,3,1
  23. Dipsochelys dussumieri,8,1,5
  24. Emys orbicularis,77,1,53
  25. Eretmochelys imbricata,2,4,2
  26. Erymnochelys madagascariensis,1,2,1
  27. Geochelone carbonaria,16,2,6
  28. Geochelone denticulata,11,1,7
  29. Geochelone elegans,10,3,4
  30. Geochelone nigra,173,175,152
  31. Geochelone sulcata,3,1,3
  32. Geoemyda spengleri,29,1,1
  33. Gopherus polyphemus,2,1,3
  34. Indotestudo elongata,18,1,9
  35. Kachuga tecta,10,3,1
  36. Kinosternon leucostomum,2,2,2
  37. Lepidochelys kempii,1,1,2
  38. Lepidochelys olivacea,2,6,1
  39. Macrochelys temminckii,2,3,1
  40. Manouria impressa,4,2,3
  41. Mauremys annamensis,2,1,14
  42. Mauremys caspica,15,2,2
  43. Mauremys japonica,240,1,1
  44. Mauremys leprosa,21,1,6
  45. Mauremys mutica,7,3,28
  46. Mauremys reevesii,7,1,4
  47. Mauremys rivulata,34,1,1
  48. Melanochelys trijuga,6,4,1
  49. Pelomedusa subrufa,47,23,29
  50. Peltocephalus dumeriliana,1,1,1
  51. Pelusios castaneus,12,3,9
  52. Pelusios sinuatus,2,1,3
  53. Phrynops gibbus,1,1,1
  54. Platemys platycephala,3,3,3
  55. Platysternon megacephalum,6,1,2
  56. Podocnemis expansa,1,1,1
  57. Psammobates pardalis,45,1,52
  58. Pyxidea mouhotii,1,3,6
  59. Pyxis arachnoides,44,1,10
  60. Pyxis planicauda,5,1,4
  61. Sacalia quadriocellata,33,3,1
  62. Testudo hermanni,14,2,5
  63. Testudo horsfieldii,33,1,5
  64. Testudo marginata,30,1,5
  65. Trachemys scripta,14,4,28
Hồ Hữu Thọ (thảo luận) 08:41, 10/4/2011 (ICT)

File dữ liệu[sửa]

  • Tập tin:All sequences Edited name.zip toàn bộ trình tự cần phân tích (đã chỉnh sửa tên trình tự) của cả 3 gen cytb, 16S rRNA, nd4, cùng với danh mục số accession number của các trình tự chưa phân loại chính xác và các trình tự từ Việt Nam.
    Hồ Hữu Thọ (thảo luận) 19:38, 13/4/2011 (ICT)
  • Tập tin:8 sequence Le TB.doc 8 trình tự từ công bố của LTB et al
  • Tập tin:Cytb gene Trionychidae original.zip Bản gốc các trình tự Cytb của họ Trionychidae lấy từ ngân hàng NCBI, chưa sửa tên của trình tự.
  • Tập tin:New.sequence.fasta.zip trình tự 16SrRNA của họ ba ba đã hiệu chỉnh tên trình tự
  • Tập tin:Nd4 gene Trionychidae original.zip trình tự nd4 của họ Trionychidae, chưa sửa tên trình tự
  • Tập tin:DNARHG.zip: Các file .doc từ Thọ, file .fasta (plain text bằng copy paste từ doc), source code to edit, file new.sq.fasta đã edit tên, đổi trình tự Rùa Hồ Gươm lên trên cùng. Ngoài cùng của ba thư mục có file log.html tóm tắt các tên file mới (theo thứ tự chưa đổi lại), cuối mỗi đoạn bảng (ngăn cách bởi ">") có tóm tắt tổng số trình tự (nSEQ), số trình tự rùa HG (nV), số trình tự không phải rùa HG (nnV). Edit chưa hoàn hảo ta có thể phải edit thêm bằng tay. Ghi chú: Trong tên nếu còn từ .and. có nghĩa là sequence ngoài gene quan tâm còn có thêm gene khác.
  • Dữ liệu hơn 200 trình tự của gene COI do nhóm ở University of Wisconsin - Madison gửi lên 03/2011.
  • Danh sách trình tự ngoài họ Ba ba (lưu)
  • Danh sách tên tất cả các loài trong Testudine. Đã cập nhật lại tên rút ra từ GenBank download nhờ gói APE (Có lẽ đây là cách tốt nhất về lý thuyết cho phép đảm bảo tên loài thống nhất.) Tập tin:Allspecies.txt.zip

Một số lưu ý[sửa]

  • Nếu gặp trình tự toàn bộ genome ty thể thì cũng download về. Sau này sẽ cắt phần quan tâm sau.
  • Chú trọng phần mô tả ở bên trong bản ghi trình tự (về các thông tin phân loại) hơn là tiêu đề của trình tự.
  • Có thể chạy phần mềm R để xử lý trình tự với script này (nâng cao)
  • Nên lưu file dưới định dạng text (.txt) hoặc (.fasta). Khi edit trình tự thì nên dùng các text editor nhỏ gọn như Notepad, Editpad, Tinn-R chứ không nên dùng MS Word, đặc biệt là khi làm việc với 1 lượng dữ liệu lớn.

Quy ước tên[sửa]

  • Vì clustalw cuối cùng cắt hết các tên của ta nên theo tôi qui ước này không còn cần thiết. Sau này ta có thể khắc phục bằng annotation và mở rộng. Nói chung tên ta chỉ cần giữ lại accession number là đủ, phần mở rộng sẽ được gắn vào sau khi có kết quả.

Liên kết đến đây

Xem thêm liên kết đến trang này.