Dữ liệu DNA hiện có về Rùa/code R xử lý tiêu đề trình tự

Từ Thư viện Khoa học VLOS
Bước tới: chuyển hướng, tìm kiếm

Ví dụ một code R

Để tránh làm việc với file sequence gốc có thể delete dữ liệu trình tự và khó thực hiện, ta có thể sao tất cả các tên của trình tự ra file "allName.txt", sau đó edit file allName.txt và sau đó ghi lại tên. Điều này có thể thực hiện đơn giản với R như sau:

  • Đưa file trình tự cần đổi tên vào với tên sequence (tất nhiên, là định dạng fasta) (replace file mẫu). Nếu bạn không đổi tên file của bạn thành sequence thì nó không chạy đâu ạ.
  • Nếu chạy lần đầu ta có thể phải cài biostring, bằng cách copy đoạn code sau vào CMD của R. (tức là coppy vào sau dấu chờ lệnh rồi enter)
source("http://www.bioconductor.org/biocLite.R")
biocLite("Biostrings")
  • Chạy file getName.R
source('getName.R')
  • Chạy xong ta sẽ thấy file allName.txt mới, trong đó chứa tất cả các tên trình tự. Ta edit trên file này: chú ý không delete bất kỳ dấu enter (các tên ngăn nhau bởi dấu enter), cũng như dấu nháy " " (mỗi dấu nháy chứa một tên trình tự) nào trong đó, giữ lại dấu | ngăn cách tên thư viện với phần thông tin bổ sung. Thứ tự có thể được sắp xếp lại, nhưng lưu ý quá trình copy paste phải đảm bảo chính xác yêu cầu trên.
  • Sau khi edit allName.txt, ta chạy file reassignName.R, file này đọc tên từ allName.txt, và gán nó vào trình tự ở sequence.fasta.
source('reassignName.R')
  • File đã edit tên xuất hiện với tên new.sequence.fasta.



Xem thêm

Liên kết đến đây