VLOS:Dự án chuyển ngữ bộ đề mục chủ đề MeSH của PubMed NCBI/Bản mô tả

Từ VLOS
Bước tới: chuyển hướng, tìm kiếm
Chia sẻ lên facebook Chia sẻ lên twitter In trang này

Đây chỉ là bản mô tả sơ bộ nên hoan nghênh tất cả các bạn nêy ý kiến sửa đổi và hoàn thiện.

Yêu cầu[sửa]

  • Giao diện thân thiện dễ sử dụng
  • Có khả năng tích hợp với phần mềm quản lý thư viện điện tử để hỗ trợ công tác biên mục cho cán bộ thư viện.
  • Có khả năng mở rộng, liên kết với các chuẩn biên mục khác như: bảng phân loại NLM.
  • Hoạt động trên nền web.

Cấu trúc[sửa]

Gồm các phân hệ sau

- Module nhập dữ liệu
- Module in và xuất dữ liệu
- Module quản trị
- Module tra cứu

1. Module Nhập dữ liệu:

Gồm các chức năng chính như sau:

- Thêm mới: Nhập thuật ngữ để xây dựng CSDL Đề mục chủ đề

+ Thêm một thuật ngữ Chủ đề bằng tiếng Việt
+ Mô tả thuật ngữ Chủ đề trên bằng tiếng Việt
+ Thêm một thuật ngữ Chủ đề bằng tiếng Anh
+ Mô tả thuật ngữ Chủ đề trên bằng tiếng Anh

Mục đích:

- Xây dựng song song 2 hệ thống ngôn ngữ để người cán bộ xử lý tài liệu có thêm sự lựa chọn khi biên mục tài liệu.
- Có đối chiếu độ chính xác của thuật ngữ tiếng Việt khi được dịch ra từ thuật ngữ tiếng Anh.

- Sửa chữa: Cho phép cán bộ xử lý có thể sửa chữa các hạng mục công việc sau:

+ Sửa chữa cấu trúc cây thư mục, từ điển thuật ngữ.
+ Sửa chữa lỗi chính tả của thuật ngữ khi nhập sai
+ Sửa chữa thông tin mô tả thuật ngữ.
+ Sửa chữa chỉ số Chủ đề, chỉ số phân loại DDC, NLM có liên quan.
+ Sửa chữa các thông tin cập nhật từ file excel.
+ Sửa chữa giá trị của thuật ngữ (Bổ sung, điều chỉnh chức năng của thuật ngữ thành Chủ đề hay thành thuật ngữ tìm tin)

- Xóa dữ liệu: Cho phép cán bộ xử lý xóa các hạng mục công việc sau:

+ Xóa cấu trúc cây thư mục, từ điển thuật ngữ.
+ Xóa thuật ngữ khi nhập sai
+ Xóa thông tin mô tả thuật ngữ.
+ Xóa chỉ số Chủ đề, chỉ số phân loại DDC, NLM có liên quan.
+ Xóa các thông tin cập nhật từ file excel (xóa theo lô các Chủ đề nhập sai).
+ Xóa giá trị của thuật ngữ.

- Nhập dữ liệu từ file excel: Cho phép người cán bộ xử lý nhập dữ liệu theo lô từ một file excel. Cấu trúc của file excel phải đảm bảo các trường nhập tin như sau:

+ Mã đề mục chủ đề của thuật ngữ.
+ Tên thuật ngữ đề mục chủ đề (tiếng Anh, Việt).
+ Thông tin mô tả thuật ngữ đề mục chủ đề.
+ Mã ký hiệu phân loại DDC, NLM.
+ Cấp thư mục của thuật ngữ.
+ Giá trị của thuật ngữ là đề mục chủ đề hay thuật ngữ thông thường.

Mục đích: Giúp cho người cán bộ xử lý tập trung có thể nhanh chóng nhập liệu từ những người khác với số lượng thuật ngữ lớn.

- Thêm số ký hiệu của thuật ngữ đề mục chủ đề: Tức là gán cho mỗi chủ đề một ID để dễ dàng tìm kiếm và quản lý. Đồng thời đây cũng là một yếu tố để phát hiện trùng khi nhập dữ liệu trong hệ thống.
- Liên kết thuật ngữ trong NLM, DDC: xác định thuật ngữ chủ đề hoặc thuật ngữ thông thường có mối quan hệ chức năng trong bộ từ điển của NLM, DDC.
- Liên kết thuật ngữ trong bộ Đề mục chủ đề: Xác định mối quan hệ giữa các chủ đề (cấp bậc, thứ tự); Xác định thuộc tính của thuật ngữ được lựa chọn làm Chủ đề (là chủ đề hay chỉ là thuật ngữ thông thường)

2. Module Xuất dữ liệu, báo cáo, thống kê.

Gồm các chức năng chính như sau:

- Tìm kiếm thông tin về chủ đề trong bộ Đề mục chủ đề: Mục đích để phục vụ việc xuất dữ liệu, báo cáo, thống kê.
- Lựa chọn: Tùy biến theo nhu cầu sử dụng của người dùng. Có các tiêu chí lựa chọn như: Mã Chủ đề, tên thuật ngữ, mô tả nội dung của thuật ngữ,…
- Báo cáo, thống kê:
+ Thống kê lượng từ vựng có trong Bộ Đề mục chủ đề
+ Thuật ngữ bổ sung hàng năm
+ Chính sửa cấu trúc cây thư mục của Bộ Đề mục chủ đề.
+ Những thuật ngữ bị loại khỏi cấu trúc Bộ Đề mục chủ đề, những thuật ngữ được nâng cấp từ thuật ngữ thành chủ đề và ngược lại.
- Xuất dữ liệu:
+ Dữ liệu đầu ra hiển thị theo các định dạng: Word, PDF, Excel để phục vụ in thành ấn phẩm giấy.
+ Thông tin được đưa ra dạng web để phục vụ tra cứu (phục vụ cho module tra cứu).
+ Tùy biến xuất dữ liệu theo nhu cầu của người sử dụng.

3. Module Tra cứu.

Gồm các chức năng chính như sau:

- Tìm kiếm thuật ngữ chủ đề
- Tìm mối quan hệ của chủ đề cần tìm với các chủ đề khác có liên quan.
- Tìm chỉ số phân loại NLM, DDC có chung thuật ngữ với Bộ Đề mục chủ đề.

Kết quả tìm kiếm: Người cán bộ biên mục tài liệu sẽ có được các thông số:

- Thuật ngữ chuẩn để mô tả chủ đề của tài liệu.
- Nội dung mô tả của chủ đề đó.
- Các quan hệ của chủ đề đó với khung phân loại DDC, NLM. (chủ yếu là sử dụng các chỉ số của 2 khung phân loại này)

4. Module Quản trị hệ thống.

Gồm các chức năng sau:

- Tạo mới người sử dụng
- Phân quyền người sử dụng
- Theo dõi hệ thống.
- Backup dữ liệu.

Khối lượng công việc[sửa]

  • Xử lý và nhập liệu

- Thu thập từ vựng:

+ Thuật ngữ từ MeSH ( xấp xỉ 260.000 từ)
+ Bổ sung từ phản ánh vốn tài liệu đặc trưng của y học việt nam (chủ yếu thuộc về lĩnh vực y học cổ truyền – khoảng 9.000 từ)

- Xử lý từ vựng

+ Dịch thuật ngữ từ MeSH (xấp xỉ 260.000 từ)
+ Xử lý thuật ngữ y học cổ truyền (9.000 từ)
+ Lập quan hệ tương đương quy ước cho thuật ngữ
+ Lập quan hệ liên đới quy ước cho thuật ngữ
+ Lập hoán vị

- Nhập dữ liệu (269.000 từ)

- Biên soạn phần giới thiệu, nội dung và cấu trúc Bộ đề mục chủ đề y học.

- Biên soạn tài liệu hướng dẫn phương pháp sử dụng Bộ đề mục chủ đề y học để xử lý thông tin trong Thư viện điện tử

Vấn đề 1[sửa]

Một bản ghi (trang) của MeSH gồm những nội dung và thuộc tính như thế nào? Bố trí trên VietMeSH ra sao?

Chia sẻ lên facebook Chia sẻ lên twitter In trang này