Đánh giá ý nghĩa thống kê

Từ VLOS
Bước tới: chuyển hướng, tìm kiếm

Kiểm định giả thuyết thống kê được dẫn lối bởi phân tích thống kê. Độ tin cậy mang ý nghĩa thống kê được tính toán bằng cách sử dụng giá trị p - cho biết khả năng của kết quả quan sát khi một mệnh đề nhất định (giả thuyết không) là đúng.[1] Nếu giá trị p nhỏ hơn mức ý nghĩa (thường là 0,05), thực nghiệm viên có thể kết luận rằng đủ chứng cứ để bác bỏ giả thuyết không và thừa nhận giả thuyết nghịch. Sử dụng kiểm định t đơn giản, bạn có thể tính giá trị p và xác định ý nghĩa giữa hai nhóm dữ liệu khác nhau.

Các bước[sửa]

Thiết lập thực nghiệm của bạn[sửa]

  1. Xác định giả thuyết của bạn. Bước đầu tiên trong đánh giá ý nghĩa thống kê là xác định câu hỏi cần trả lời và tuyên bố giả thuyết. Giả thuyết là một tuyên bố về số liệu thực nghiệm và sự khác biệt có thể xuất hiện trong tổng thể. Mọi thực nghiệm đều có một giả thuyết không và một giả thuyết nghịch.[2] Nói một cách tổng quát, bạn sẽ so sánh hai nhóm để thấy được liệu chúng giống hay khác nhau.
    • Nhìn chung, giả thuyết không (H0) khẳng định rằng không có sự khác biệt giữa hai nhóm số liệu. Ví dụ: Sinh viên đọc tài liệu trước khi đến lớp không đạt điểm cuối khóa tốt hơn.
    • Giả thuyết nghịch (Ha) trái ngược với giả thuyết không và là tuyên bố mà bạn đang cố hậu thuẫn bằng số liệu thực nghiệm. Ví dụ: Sinh viên đọc tài liệu trước khi đến lớp thực sự đạt điểm cuối khóa tốt hơn.
  2. Chọn mức ý nghĩa nhằm xác định độ khác biệt để có thể được xem là có ý nghĩa của dữ liệu. Mức ý nghĩa (còn được gọi là alpha) là ngưỡng mà bạn chọn để quyết định ý nghĩa. Nếu giá trị p nhỏ hơn hay bằng mức ý nghĩa cho trước, số liệu được coi là có ý nghĩa thống kê.[3]
    • Theo quy tắc chung, mức ý nghĩa (hay alpha) thường được chọn ở mức 0,05 - nghĩa là khả năng kết quả quan sát sự khác biệt được nhìn thấy trên số liệu là ngẫu nhiên chỉ là 5%.
    • Mức tin cậy càng cao (và do đó, giá trị p càng thấp), kết quả càng có ý nghĩa.
    • Nếu đòi hỏi số liệu một độ tin cậy cao hơn, hãy hạ giá trị p xuống 0,01. Giá trị p thấp thường được dùng trong sản xuất để phát hiện lỗi của sản phẩm. Độ tin cậy cao là rất quan trọng để có thể chấp nhận rằng mọi phần sẽ hoạt động đúng như chức năng thiết kế của chúng.
    • Với hầu hết thực nghiệm dựa trên giả thuyết, mức ý nghĩa 0,05 là chấp nhận được.
  3. Quyết định dùng kiểm định một đầu hay kiểm định hai đầu. Một trong những giả định của kiểm định t là dữ liệu của bạn đang có phân phối chuẩn. Phân phối chuẩn sẽ hình thành đường cong hình chuông với đa số quan sát nằm ở giữa.[4] Kiểm định t là một kiểm định toán học được tiến hành để kiểm tra liệu số liệu của bạn có nằm ở phần ngoài của phân phối chuẩn, trên hoặc dưới, trong phần “đầu” của đường cong.
    • Nếu không chắc liệu số liệu có nằm trên hay dưới nhóm kiểm soát, hãy dùng kiểm định hai đầu. Nó cho phép bạn kiểm tra mức ý nghĩa ở cả hai hướng.
    • Nếu biết đâu là hướng kỳ vọng của số liệu, hãy dùng kiểm định một đầu. Trong ví dụ kể trên, bạn kỳ vọng rằng điểm của sinh viên sẽ được cải thiện. Do đó, bạn dùng kiểm định một đầu.
  4. Quyết định kích thước mẫu với phân tích lực lượng. Lực lượng của một phép kiểm định là khả năng quan sát kết quả được kỳ vọng với một kích thước mẫu cho trước.[5] Ngưỡng phổ biến cho lực lượng (hay β) là 80%. Phân tích lực lượng có thể tương đối phức tạp nếu không có một vài dữ liệu sơ bộ bởi bạn cần một số thông tin về giá trị trung bình kỳ vọng giữa các nhóm và độ lệch chuẩn của chúng. Hãy sử dụng công cụ phân tích lực lượng trực tuyến để xác định kích cỡ mẫu tối ưu dành cho số liệu của bạn.[6]
    • Các nhà nghiên cứu thường thực hiện một nghiên cứu tiền đề nhỏ để có thông tin cho phân tích lực lượng và quyết định kích cỡ mẫu cần thiết cho nghiên cứu lớn và toàn diện.
    • Nếu không có phương tiện để thực hiện nghiên cứu tiền đề phức tạp, hãy ước tính giá trị trung bình khả thi dựa trên việc đọc các bài viết và nghiên cứu mà các cá nhân khác có thể đã thực hiện. Nó có thể cho bạn một khởi đầu tốt để xác định kích thước mẫu.

Tính độ lệch chuẩn[sửa]

  1. Xác định công thức độ lệch chuẩn. Độ lệch chuẩn đo lường mức phân tán của dữ liệu. Nó cho bạn thông tin về tính đồng nhất của mỗi điểm dữ liệu trong mẫu. Khi mới làm quen, phương trình có thể trông khá phức tạp. Thế nhưng, những bước dưới đây sẽ giúp bạn dễ dàng nắm rõ quy trình tính toán. Công thức là s = √∑((xi – µ)2/(N – 1)).
    • s là độ lệch chuẩn.
    • ∑ biểu thị bạn sẽ phải cộng tất cả các quan sát được thu thập.
    • xi đại diện mỗi giá trị dữ liệu của bạn.
    • µ là giá trị trung bình của dữ liệu từng nhóm.
    • N là tổng số quan sát.
  2. Tính trung bình số liệu quan sát ở mỗi nhóm. Để tính độ lệch chuẩn, trước hết bạn cần tính giá trị trung bình các quan sát ở từng nhóm đơn lẻ. Giá trị này được ký hiệu bằng chữ cái Hy Lạp mu hay µ. Để làm điều đó, bạn chỉ việc đơn giản cộng các quan sát với nhau và chia cho tổng số quan sát.[7]
    • Ví dụ, để tìm điểm trung bình của nhóm đọc tài liệu trước khi đến lớp, chúng ta hãy cùng xem xét một vài dữ liệu. Để đơn giản hóa, chúng ta sẽ dùng bộ dữ liệu gồm 5 điểm: 90, 91, 85, 83 và 94 (trên thang điểm 100).
    • Cộng tất cả các quan sát: 90 + 91 + 85 + 83 + 94 = 443.
    • Chia tổng trên cho số quan sát N (N= 5): 443/5 = 88,6.
    • Điểm trung bình cho nhóm này là 88,6.
  3. Lấy từng giá trị quan sát trừ đi trung bình. Bước tiếp theo liên quan đến phần (xi – µ) của phương trình. Bạn sẽ lấy từng giá trị quan sát trừ đi giá trị trung bình vừa tính được. Với ví dụ trên, chúng ta có năm phép trừ.
    • (90 – 88,6), (91- 88,6), (85 – 88,6), (83 – 88,6) và (94 – 88,6).
    • Giá trị tính được là 1,4; 2,4; -3,6; -5,6 và 5,4.
  4. Bình phương những hiệu trên và cộng lại. Mỗi giá trị mới vừa được tính giờ đây sẽ được lấy bình phương. Ở đây, dấu âm cũng sẽ được loại bỏ. Nếu xuất hiện dấu âm sau bước này hoặc khi kết thúc tính toán, có lẽ bạn đã quên thực hiện bước trên.
    • Trong ví dụ đang xét, giờ đây, chúng ta sẽ làm việc với 1,96; 5,76; 12,96; 31,36 và 29,16.
    • Cộng những kết quả bình phương này với nhau: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
  5. Chia cho tổng số quan sát đã trừ đi 1. Chia cho N – 1 giúp bù trừ việc tính toán không thực hiện trên toàn bộ tổng thể mà chỉ ước tính dựa trên một mẫu trong tổng thể mọi sinh viên.[7]
    • Trừ: N – 1 = 5 – 1 = 4
    • Chia: 81,2/4 = 20,3
  6. Lấy căn bậc hai. Một khi đã chia cho số quan sát trừ 1, lấy căn bậc hai giá trị thu được. Đây là bước cuối cùng trong tính độ lệch chuẩn. Một số chương trình thống kê sẽ giúp bạn thực hiện tính toán này sau khi được nhập dữ liệu gốc.
    • Với ví dụ trên, độ lệch chuẩn của điểm cuối kỳ của sinh viên đọc tài liệu trước khi đến lớp là: s =√20,3 = 4,51.

Xác định ý nghĩa thống kê[sửa]

  1. Tính phương sai giữa hai nhóm quan sát của bạn. Đến thời điểm này, ví dụ chỉ mới xử lý một nhóm quan sát. Để so sánh hai nhóm, rõ ràng bạn cần dữ liệu từ cả hai. Tính độ lệch chuẩn của nhóm quan sát thứ hai và dùng nó để tính phương sai giữa hai nhóm thực nghiệm. Công thức tính phương sai là: sd = √((s1/N1) + (s2/N2)).[8]
    • sd là phương sai giữa các nhóm.
    • s1 là độ lệch chuẩn của nhóm 1 và N1 là kích cỡ nhóm 1.
    • s2 là độ lệch chuẩn của nhóm 2 và N2 là kích cỡ nhóm 2.
    • Trong ví dụ của chúng ta, giả sử dữ liệu từ nhóm 2 (sinh viên không đọc bài trước khi đến lớp) có kích cỡ là 5 và độ lệch chuẩn là 5,81. Phương sai là:
      • sd = √((s1)2/N1) + ((s2)2/N2))
      • sd = √(((4.51)2/5) + ((5.81)2/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
  2. Tính giá trị thống kê t của dữ liệu. Giá trị thống kê t cho phép bạn chuyển dữ liệu thành một dạng có thể so sánh với dữ liệu khác. Giá trị t cũng cho phép bạn thực hiện kiểm định t, kiểm định cho phép bạn tính khả năng hai nhóm khác nhau một cách có ý nghĩa thống kê. Công thức tính giá trị thống kê t là: t = (µ1 – µ2)/sd.[8]
    • µ1 là trung bình của nhóm thứ nhất.
    • µ2 là trung bình của nhóm thứ hai.
    • sd là phương sai giữa các quan sát.
    • Dùng giá trị trung bình lớn hơn làm µ1 để không nhận được giá trị thống kê t âm.
    • Với ví dụ của chúng ta, giả sử trung bình quan sát của nhóm 2 (những người không đọc bài trước) là 80. Giá trị thống kê t là: t = (µ1 – µ2)/sd = (88,6 – 80)/3,29 = 2,61.
  3. Xác định bậc tự do của mẫu. Khi dùng giá trị thống kê t, bậc tự do được xác định dựa trên kích cỡ mẫu. Cộng số quan sát của mỗi nhóm và sau đó trừ đi hai. Với ví dụ trên, bậc tự do (d.f.) là 8 bởi có 5 quan sát ở nhóm thứ nhất và 5 quan sát ở nhóm thứ hai ((5 + 5) – 2 = 8).[9]
  4. Dùng bảng t để đánh giá mức ý nghĩa. Bảng giá trị thống kê t[10] và bậc tự do có thể được tìm thấy ở sách thống kê chuẩn hoặc qua mạng. Tìm dòng chứa bậc tự do của dữ liệu và giá trị p tương ứng với giá trị thống kê t mà bạn có.
    • Với bậc tự do 8 và t = 2,61, giá trị p cho kiểm định một đầu nằm giữa 0,01 và 0,025. Bởi mức ý nghĩa được chọn nhỏ hơn hoặc bằng 0,05, dữ liệu của chúng ta có ý nghĩa thống kê. Với dữ liệu này, chúng ta bác bỏ giả thuyết không và chấp nhận giả thuyết nghịch:[2] sinh viên đọc tài liệu trước khi đến lớp có điểm cuối kỳ cao hơn.
  5. Cân nhắc tiến hành nghiên cứu tiếp theo. Nhiều nhà nghiên cứu thực hiện nghiên cứu tiền đề với một vài giá trị đo lường để hiểu cách thiết kế một nghiên cứu lớn hơn. Thực hiện nghiên cứu khác với nhiều giá trị đo lường hơn sẽ nâng cao độ tự tin với kết luận của bạn.

Lời khuyên[sửa]

  • Thống kê là một lĩnh vực lớn và phức tạp. Hãy tham gia một khóa kiểm định giả thuyết thống kê tương đương trình độ cấp ba hay đại học (hoặc cao hơn) để hiểu về ý nghĩa thống kê.

Cảnh báo[sửa]

  • Phân tích này tập trung vào kiểm định t để kiểm tra sự khác biệt giữa hai tổng thể phân phối chuẩn. Tùy vào độ phức tạp của dữ liệu, có thể bạn sẽ cần một kiểm định thống kê khác.

Nguồn và Trích dẫn[sửa]