Tính trị số p

Từ VLOS
(đổi hướng từ Tính Trị số p)
Bước tới: chuyển hướng, tìm kiếm

Trị số P là đại lượng thống kê giúp các nhà khoa học quyết định giả thuyết của họ đúng hay sai. Trị số P được sử dụng để xác định liệu kết quả thí nghiệm có nằm trong dãy giá trị thông thường của các trường hợp được quan sát. Nếu trị số P của một chuỗi số liệu thấp hơn giá trị cụ thể dự định trước (ví dụ như 0,05), các nhà khoa học sẽ bác bỏ "giả thuyết vô hiệu" (null hypothesis) của thí nghiệm - nói cách khác, họ sẽ từ bỏ giả thuyết rằng các biến số của thí nghiệm không có tác động thực sự lên kết quả. Ngày nay, trị số p thường được tìm theo bảng tham chiếu bằng cách tính các trị số chi bình phương (chi square).

Các bước[sửa]

  1. Xác định kết quả kỳ vọng của thí nghiệm. Thông thường, khi nhà khoa học tiến hành thí nghiệm và quan sát kết quả, họ đã dự đoán trước kết quả "bình thường" hay "điển hình" sẽ như thế nào. Việc này có thể dựa trên kết quả thí nghiệm đã làm, các chuỗi số liệu theo dõi được đáng tin cậy, tài liệu khoa học, và/hoặc các nguồn khác. Đối với thí nghiệm của bạn, hãy xác định kết quả kỳ vọng và thể hiện bằng con số.
    • Ví dụ: Theo các nghiên cứu trước đây, xe ô tô màu đỏ hay bị nhận vé phạt quá tốc độ hơn xe ô tô màu xanh trên phạm vi toàn quốc. Giả sử kết quả trung bình là 2:1 nghiêng về xe đỏ. Ta muốn biết liệu có chuyện cảnh sát thành phố cũng thể hiện khuynh hướng này bằng cách phân tích số lượng vé phạt quá tốc độ do họ đưa ra. Nếu lấy mẫu ngẫu nhiên 150 vé phạt quá tốc độ đối với cả xe đỏ và xe xanh trong thành phố, ta dự tính 100 đối với xe đỏ và 50 cho xe xanh nếu cảnh sát thành phố buộc phải phạt theo khuynh hướng trên phạm vi quốc gia.
  2. Xác định kết quả thí nghiệm được quan sát. Giờ bạn đã có giá trị kỳ vọng, bạn hãy tiến hành thí nghiệm và tìm giá trị thực tế (hay "quan sát được"). Hãy thể hiện các kết quả đó bằng con số. Nếu ta tác động vào điều kiện thí nghiệm và kết quả thực tế khác so với kết quả kỳ vọng, hai khả năng có thể xảy ra: hoặc là do ngẫu nhiên, hoặc việc tác động vào các biến số trong thí nghiệm dẫn đến sự khác biệt đó. Mục đích tìm trị số p về cơ bản là xác định liệu kết quả quan sát được có khác so với kết quả kỳ vọng tới mức đủ để bác bỏ "giả thuyết vô hiệu" - giả thuyết rằng không có mối quan hệ giữa các biến số trong thí nghiệm và kết quả quan sát được.
    • Ví dụ: Giả sử, trong thành phố, ta chọn ngẫu nhiên 150 vé phạt đối với xe đỏ và xe xanh. Ta phát hiện ra 90 vé phạt xe đỏ và 60 vé phạt xe xanh. Các con số này khác so với kết quả kỳ vọng tương ứng là 100 50. Có phải sự tác động của ta trong thí nghiệm (trong trường hợp này là thay đổi nguồn số liệu từ phạm vi quốc gia xuống phạm vi địa phương) dẫn đến thay đổi về kết quả không, hay cảnh sát thành phố cũng có khuynh hướng như kết quả trung bình trên phạm vi toàn quốc cho thấy, và chúng ta đang quan sát thấy sự thay đổi ngẫu nhiên? Trị số p sẽ giúp ta đưa ra quyết định trong trường hợp này.
  3. Xác định các bậc tự do trong thí nghiệm. Bậc tự do là thước đo mức độ dao động trong nghiên cứu, được quyết định bởi số lượng các nhóm mà bạn kiểm tra. Biểu thức bậc tự do được viết như sau: Bậc tự do = n-1, trong đó: "n" là số nhóm hoặc biến số được phân tích trong thí nghiệm.
    • Ví dụ: Thí nghiệm có hai nhóm kết quả: một đối với xe đỏ và một đối với xe xanh. Vì vậy, trong thí nghiệm này, ta có 2-1 = 1 bậc tự do. Nếu ta so sánh xe đỏ, xe xanh nước biển và xe xanh lá cây, ta sẽ có 2 bậc tự do, v.v...
  4. Dùng trị số chi bình phương để so sánh kết quả kỳ vọng và kết quả thực tế. Trị số chi bình phương (viết là "x2") là giá trị bằng số để đo sự khác nhau giữa giá trị kỳ vọng và kết quả quan sát được. Phương trình tính chi bình phương như sau: x2 = Σ((o-e)2/e), trong đó: "o" là giá trị quan sát được và "e" là giá trị kỳ vọng.[1] Cộng các đáp số của phương trình trong mọi kết quả có thể xảy ra (xem bên dưới).
    • Chú ý là phương trình này gồm toán tử Σ (sigma). Nói cách khác, bạn sẽ phải tính ((|o-e|-0,05)2/e) cho mỗi khả năng có thể xảy ra - hoặc là xe đỏ hoặc là xe xanh nhận vé phạt. Vì vậy, ta sẽ tính ((o-e)2/e) hai lần - một cho xe đỏ và một cho xe xanh.
    • Ví dụ: Hãy lắp giá trị kỳ vọng và giá trị quan sát được vào phương trình x2 = Σ((o-e)2/e). Nhớ là vì có toán tử sigma, ta cần tính ((o-e)2/e) hai lần - một cho xe đỏ và một cho xe xanh. Phép tính thực hiện như sau:
      • x2 = ((90-100)2/100) + (60-50)2/50)
      • x2 = ((-10)2/100) + (10)2/50)
      • x2 = (100/100) + (100/50) = 1 + 2 = 3 .
  5. Chọn mức ý nghĩa thống kê. Giờ ta có bậc tự do và trị số chi bình phương cho thí nghiệm, việc cuối cùng phải làm trước khi tìm trị số p là xác định mức ý nghĩa thống kê. Về cơ bản, mức ý nghĩa thống kê là thước đo mức độ chắc chắn về kết quả - ý nghĩa thống kê thấp tương ứng với xác suất kết quả thí nghiệm có được ngẫu nhiên là thấp, và ngược lại. Mức ý nghĩa thống kê được viết dưới dạng thập phân (như 0,01), tương ứng với tỷ lệ kết quả thí nghiệm có được một cách ngẫu nhiên (trong trường hợp này là 1%).
    • Theo thông lệ, các nhà khoa học lấy mức ý nghĩa thống kê cho thí nghiệm là 0,05, hay 5 phần trăm.[2] Điều này có nghĩa là kết quả thí nghiệm đáp ứng mức ý nghĩa thống kê có nhiều nhất 5% cơ hội là kết quả hoàn toàn ngẫu nhiên. Hay nói cách khác, có 95% cơ hội kết quả có được do tác động của nhà khoa học đối với các biến số trong thí nghiệm hơn là ngẫu nhiên. Đối với hầu hết thí nghiệm, 95% chắc chắn về mối liên hệ giữa hai biến số được xem là "thành công".
    • Ví dụ: Trong thí nghiệm xe đỏ và xe xanh, ta hãy theo thông lệ khoa học và lấy mức ý nghĩa thống kê là 0,05.
  6. Sử dụng bảng phân bố chi bình phương để tính trị số p. Các nhà khoa học và toán học dùng bảng có nhiều giá trị chi bình phương để tính trị số p cho thí nghiệm của họ. Những bảng số liệu này thường được tạo với trục tung ở bên trái tương ứng với bậc tự do và trục hoành ở trên tương ứng với trị số p. Sử dụng các bảng này bằng cách tìm bậc tự do trước, sau đó đọc các dòng từ trái qua phải đến khi bạn tìm thấy giá trị đầu tiên lớn hơn giá trị chi bình phương. Hãy nhìn vào trị số p tương ứng trên đầu cột - trị số p nằm trong khoảng giá trị đó và giá trị lớn nhất tiếp theo (giá trị nằm ở bên trái liền kề).
    • Có nhiều nguồn tham khảo bảng phân bố giá trị chi bình phương - bạn có thể dễ dàng tìm thấy bảng này trên mạng hoặc trong các sách giáo khoa về khoa học và thống kê. Nếu không có sẵn, hãy sử dụng bảng trong ảnh ở trên hoặc miễn phí trực tuyến, giống như bảng trên trang web: medcalc.org ở đây.
    • Ví dụ: Giá trị chi bình phương là 3. Vì vậy, hãy sử dụng bảng phân bố chi bình phương trong ảnh ở trên để tìm trị số p gần đúng. Ta đã biết thí nghiệm có bậc tự do là 1, hãy bắt đầu từ hàng đầu tiên. Đi từ trái sang phải của hàng đó ta tìm được giá trị cao hơn 3 - giá trị của chi bình phương. Giá trị đầu tiên ta gặp là 3,84. Nhìn vào đầu cột, ta thấy giá trị p tương ứng là 0,05. Điều đó có nghĩa là trị số p sẽ nằm trong khoảng từ 0,05 đến 0,1 (giá trị p lớn nhất tiếp theo trong bảng).
  7. Quyết định liệu có giữ lại hay bác bỏ giả thuyết vô hiệu. Bạn đã tìm được giá trị p gần đúng cho thí nghiệm, giờ bạn có thể quyết định bác bỏ hay chấp nhận giả thuyết vô hiệu của thí nghiệm (bạn cần nhớ rằng, đây là giả thuyết về việc các biến số trong thí nghiệm mà bạn tác động đến không ảnh hưởng tới kết quả quan sát được). Nếu trị số p thấp hơn mức ý nghĩa thống kê, xin chúc mừng - bạn đã chứng minh được khả năng cao có mối quan hệ giữa các biến số mà bạn tác động và kết quả do quan sát được. Nếu giá trị p cao hơn mức ý nghĩa thống kê, bạn không thể chắc chắn được liệu kết quả thực tế có được do ngẫu nhiên hoàn toàn hay do bạn tác động trong khi làm thí nghiệm.
    • Ví dụ: Giá trị p nằm trong khoảng 0,05 và 0,1. Điều này có nghĩa giá trị đó hoàn toàn không nhỏ hơn 0,05, vì vậy, tiếc là ta không thể bác bỏ giả thuyết vô hiệu được. Điều đó có nghĩa là ta không đạt được ngưỡng chắc chắn tối thiểu 95% để có thể khẳng định rằng cảnh sát thành phố đưa ra vé phạt xe đỏ và xe xanh ở tỷ lệ khác đáng kể so với mức trung bình trên toàn quốc.
    • Nói cách khác, có 5-10% khả năng kết quả quan sát được không bắt nguồn từ sự thay đổi địa điểm (phân tích số liệu thành phố thay vì số liệu toàn quốc), mà chỉ là do ngẫu nhiên. Vì ta tìm khả năng ít hơn 5%, nên không thể khẳng định được là ta biết chắc cảnh sát thành phố ít chú ý đến xe đỏ hơn - mặc dù ít nhưng vẫn có khả năng đáng kể về mặt thống kê cho thấy họ không làm như vậy.

Lời khuyên[sửa]

  • Máy tính bỏ túi có thể tính toán nhanh hơn rất nhiều. Bạn có thể sử dụng máy tính trực tuyến.
  • Bạn có thể tính trị số p bằng các chương trình máy tính, như phần mềm bảng tính thông thường hay phần mềm thống kê chuyên dụng hơn.

Nguồn và Trích dẫn[sửa]

Liên kết đến đây