Chủ đề nóng: Phương pháp kỷ luật tích cực - Cổ học tinh hoa - Những thói hư tật xấu của người Việt - Công lý: Việc đúng nên làm - Giáo án Điện tử - Sách giáo khoa - Học tiếng Anh - Bài giảng trực tuyến - Món ăn bài thuốc - Chăm sóc bà bầu - Môi trường - Tiết kiệm điện - Nhi khoa - Ung thư - Tác hại của thuốc lá - Các kỹ thuật dạy học tích cực
- Dạy học phát triển năng lực - Chương trình giáo dục phổ thông
Đánh giá ý nghĩa thống kê
Từ VLOS
Kiểm định giả thuyết thống kê được dẫn lối bởi phân tích thống kê. Độ tin cậy mang ý nghĩa thống kê được tính toán bằng cách sử dụng giá trị p - cho biết khả năng của kết quả quan sát khi một mệnh đề nhất định (giả thuyết không) là đúng.[1] Nếu giá trị p nhỏ hơn mức ý nghĩa (thường là 0,05), thực nghiệm viên có thể kết luận rằng đủ chứng cứ để bác bỏ giả thuyết không và thừa nhận giả thuyết nghịch. Sử dụng kiểm định t đơn giản, bạn có thể tính giá trị p và xác định ý nghĩa giữa hai nhóm dữ liệu khác nhau.
Mục lục
Các bước[sửa]
Thiết lập thực nghiệm của bạn[sửa]
-
Xác
định
giả
thuyết
của
bạn.
Bước
đầu
tiên
trong
đánh
giá
ý
nghĩa
thống
kê
là
xác
định
câu
hỏi
cần
trả
lời
và
tuyên
bố
giả
thuyết.
Giả
thuyết
là
một
tuyên
bố
về
số
liệu
thực
nghiệm
và
sự
khác
biệt
có
thể
xuất
hiện
trong
tổng
thể.
Mọi
thực
nghiệm
đều
có
một
giả
thuyết
không
và
một
giả
thuyết
nghịch.[2]
Nói
một
cách
tổng
quát,
bạn
sẽ
so
sánh
hai
nhóm
để
thấy
được
liệu
chúng
giống
hay
khác
nhau.
- Nhìn chung, giả thuyết không (H0) khẳng định rằng không có sự khác biệt giữa hai nhóm số liệu. Ví dụ: Sinh viên đọc tài liệu trước khi đến lớp không đạt điểm cuối khóa tốt hơn.
- Giả thuyết nghịch (Ha) trái ngược với giả thuyết không và là tuyên bố mà bạn đang cố hậu thuẫn bằng số liệu thực nghiệm. Ví dụ: Sinh viên đọc tài liệu trước khi đến lớp thực sự đạt điểm cuối khóa tốt hơn.
-
Chọn
mức
ý
nghĩa
nhằm
xác
định
độ
khác
biệt
để
có
thể
được
xem
là
có
ý
nghĩa
của
dữ
liệu.
Mức
ý
nghĩa
(còn
được
gọi
là
alpha)
là
ngưỡng
mà
bạn
chọn
để
quyết
định
ý
nghĩa.
Nếu
giá
trị
p
nhỏ
hơn
hay
bằng
mức
ý
nghĩa
cho
trước,
số
liệu
được
coi
là
có
ý
nghĩa
thống
kê.[3]
- Theo quy tắc chung, mức ý nghĩa (hay alpha) thường được chọn ở mức 0,05 - nghĩa là khả năng kết quả quan sát sự khác biệt được nhìn thấy trên số liệu là ngẫu nhiên chỉ là 5%.
- Mức tin cậy càng cao (và do đó, giá trị p càng thấp), kết quả càng có ý nghĩa.
- Nếu đòi hỏi số liệu một độ tin cậy cao hơn, hãy hạ giá trị p xuống 0,01. Giá trị p thấp thường được dùng trong sản xuất để phát hiện lỗi của sản phẩm. Độ tin cậy cao là rất quan trọng để có thể chấp nhận rằng mọi phần sẽ hoạt động đúng như chức năng thiết kế của chúng.
- Với hầu hết thực nghiệm dựa trên giả thuyết, mức ý nghĩa 0,05 là chấp nhận được.
-
Quyết
định
dùng
kiểm
định
một
đầu
hay
kiểm
định
hai
đầu.
Một
trong
những
giả
định
của
kiểm
định
t
là
dữ
liệu
của
bạn
đang
có
phân
phối
chuẩn.
Phân
phối
chuẩn
sẽ
hình
thành
đường
cong
hình
chuông
với
đa
số
quan
sát
nằm
ở
giữa.[4]
Kiểm
định
t
là
một
kiểm
định
toán
học
được
tiến
hành
để
kiểm
tra
liệu
số
liệu
của
bạn
có
nằm
ở
phần
ngoài
của
phân
phối
chuẩn,
trên
hoặc
dưới,
trong
phần
“đầu”
của
đường
cong.
- Nếu không chắc liệu số liệu có nằm trên hay dưới nhóm kiểm soát, hãy dùng kiểm định hai đầu. Nó cho phép bạn kiểm tra mức ý nghĩa ở cả hai hướng.
- Nếu biết đâu là hướng kỳ vọng của số liệu, hãy dùng kiểm định một đầu. Trong ví dụ kể trên, bạn kỳ vọng rằng điểm của sinh viên sẽ được cải thiện. Do đó, bạn dùng kiểm định một đầu.
-
Quyết
định
kích
thước
mẫu
với
phân
tích
lực
lượng.
Lực
lượng
của
một
phép
kiểm
định
là
khả
năng
quan
sát
kết
quả
được
kỳ
vọng
với
một
kích
thước
mẫu
cho
trước.[5]
Ngưỡng
phổ
biến
cho
lực
lượng
(hay
β)
là
80%.
Phân
tích
lực
lượng
có
thể
tương
đối
phức
tạp
nếu
không
có
một
vài
dữ
liệu
sơ
bộ
bởi
bạn
cần
một
số
thông
tin
về
giá
trị
trung
bình
kỳ
vọng
giữa
các
nhóm
và
độ
lệch
chuẩn
của
chúng.
Hãy
sử
dụng
công
cụ
phân
tích
lực
lượng
trực
tuyến
để
xác
định
kích
cỡ
mẫu
tối
ưu
dành
cho
số
liệu
của
bạn.[6]
- Các nhà nghiên cứu thường thực hiện một nghiên cứu tiền đề nhỏ để có thông tin cho phân tích lực lượng và quyết định kích cỡ mẫu cần thiết cho nghiên cứu lớn và toàn diện.
- Nếu không có phương tiện để thực hiện nghiên cứu tiền đề phức tạp, hãy ước tính giá trị trung bình khả thi dựa trên việc đọc các bài viết và nghiên cứu mà các cá nhân khác có thể đã thực hiện. Nó có thể cho bạn một khởi đầu tốt để xác định kích thước mẫu.
Tính độ lệch chuẩn[sửa]
-
Xác
định
công
thức
độ
lệch
chuẩn.
Độ
lệch
chuẩn
đo
lường
mức
phân
tán
của
dữ
liệu.
Nó
cho
bạn
thông
tin
về
tính
đồng
nhất
của
mỗi
điểm
dữ
liệu
trong
mẫu.
Khi
mới
làm
quen,
phương
trình
có
thể
trông
khá
phức
tạp.
Thế
nhưng,
những
bước
dưới
đây
sẽ
giúp
bạn
dễ
dàng
nắm
rõ
quy
trình
tính
toán.
Công
thức
là
s
=
√∑((xi
–
µ)2/(N
–
1)).
- s là độ lệch chuẩn.
- ∑ biểu thị bạn sẽ phải cộng tất cả các quan sát được thu thập.
- xi đại diện mỗi giá trị dữ liệu của bạn.
- µ là giá trị trung bình của dữ liệu từng nhóm.
- N là tổng số quan sát.
-
Tính
trung
bình
số
liệu
quan
sát
ở
mỗi
nhóm.
Để
tính
độ
lệch
chuẩn,
trước
hết
bạn
cần
tính
giá
trị
trung
bình
các
quan
sát
ở
từng
nhóm
đơn
lẻ.
Giá
trị
này
được
ký
hiệu
bằng
chữ
cái
Hy
Lạp
mu
hay
µ.
Để
làm
điều
đó,
bạn
chỉ
việc
đơn
giản
cộng
các
quan
sát
với
nhau
và
chia
cho
tổng
số
quan
sát.[7]
- Ví dụ, để tìm điểm trung bình của nhóm đọc tài liệu trước khi đến lớp, chúng ta hãy cùng xem xét một vài dữ liệu. Để đơn giản hóa, chúng ta sẽ dùng bộ dữ liệu gồm 5 điểm: 90, 91, 85, 83 và 94 (trên thang điểm 100).
- Cộng tất cả các quan sát: 90 + 91 + 85 + 83 + 94 = 443.
- Chia tổng trên cho số quan sát N (N= 5): 443/5 = 88,6.
- Điểm trung bình cho nhóm này là 88,6.
-
Lấy
từng
giá
trị
quan
sát
trừ
đi
trung
bình.
Bước
tiếp
theo
liên
quan
đến
phần
(xi
–
µ)
của
phương
trình.
Bạn
sẽ
lấy
từng
giá
trị
quan
sát
trừ
đi
giá
trị
trung
bình
vừa
tính
được.
Với
ví
dụ
trên,
chúng
ta
có
năm
phép
trừ.
- (90 – 88,6), (91- 88,6), (85 – 88,6), (83 – 88,6) và (94 – 88,6).
- Giá trị tính được là 1,4; 2,4; -3,6; -5,6 và 5,4.
-
Bình
phương
những
hiệu
trên
và
cộng
lại.
Mỗi
giá
trị
mới
vừa
được
tính
giờ
đây
sẽ
được
lấy
bình
phương.
Ở
đây,
dấu
âm
cũng
sẽ
được
loại
bỏ.
Nếu
xuất
hiện
dấu
âm
sau
bước
này
hoặc
khi
kết
thúc
tính
toán,
có
lẽ
bạn
đã
quên
thực
hiện
bước
trên.
- Trong ví dụ đang xét, giờ đây, chúng ta sẽ làm việc với 1,96; 5,76; 12,96; 31,36 và 29,16.
- Cộng những kết quả bình phương này với nhau: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
-
Chia
cho
tổng
số
quan
sát
đã
trừ
đi
1.
Chia
cho
N
–
1
giúp
bù
trừ
việc
tính
toán
không
thực
hiện
trên
toàn
bộ
tổng
thể
mà
chỉ
ước
tính
dựa
trên
một
mẫu
trong
tổng
thể
mọi
sinh
viên.[7]
- Trừ: N – 1 = 5 – 1 = 4
- Chia: 81,2/4 = 20,3
-
Lấy
căn
bậc
hai.
Một
khi
đã
chia
cho
số
quan
sát
trừ
1,
lấy
căn
bậc
hai
giá
trị
thu
được.
Đây
là
bước
cuối
cùng
trong
tính
độ
lệch
chuẩn.
Một
số
chương
trình
thống
kê
sẽ
giúp
bạn
thực
hiện
tính
toán
này
sau
khi
được
nhập
dữ
liệu
gốc.
- Với ví dụ trên, độ lệch chuẩn của điểm cuối kỳ của sinh viên đọc tài liệu trước khi đến lớp là: s =√20,3 = 4,51.
Xác định ý nghĩa thống kê[sửa]
-
Tính
phương
sai
giữa
hai
nhóm
quan
sát
của
bạn.
Đến
thời
điểm
này,
ví
dụ
chỉ
mới
xử
lý
một
nhóm
quan
sát.
Để
so
sánh
hai
nhóm,
rõ
ràng
bạn
cần
dữ
liệu
từ
cả
hai.
Tính
độ
lệch
chuẩn
của
nhóm
quan
sát
thứ
hai
và
dùng
nó
để
tính
phương
sai
giữa
hai
nhóm
thực
nghiệm.
Công
thức
tính
phương
sai
là:
sd
=
√((s1/N1)
+
(s2/N2)).[8]
- sd là phương sai giữa các nhóm.
- s1 là độ lệch chuẩn của nhóm 1 và N1 là kích cỡ nhóm 1.
- s2 là độ lệch chuẩn của nhóm 2 và N2 là kích cỡ nhóm 2.
-
Trong
ví
dụ
của
chúng
ta,
giả
sử
dữ
liệu
từ
nhóm
2
(sinh
viên
không
đọc
bài
trước
khi
đến
lớp)
có
kích
cỡ
là
5
và
độ
lệch
chuẩn
là
5,81.
Phương
sai
là:
- sd = √((s1)2/N1) + ((s2)2/N2))
- sd = √(((4.51)2/5) + ((5.81)2/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
-
Tính
giá
trị
thống
kê
t
của
dữ
liệu.
Giá
trị
thống
kê
t
cho
phép
bạn
chuyển
dữ
liệu
thành
một
dạng
có
thể
so
sánh
với
dữ
liệu
khác.
Giá
trị
t
cũng
cho
phép
bạn
thực
hiện
kiểm
định
t,
kiểm
định
cho
phép
bạn
tính
khả
năng
hai
nhóm
khác
nhau
một
cách
có
ý
nghĩa
thống
kê.
Công
thức
tính
giá
trị
thống
kê
t
là:
t
=
(µ1
–
µ2)/sd.[8]
- µ1 là trung bình của nhóm thứ nhất.
- µ2 là trung bình của nhóm thứ hai.
- sd là phương sai giữa các quan sát.
- Dùng giá trị trung bình lớn hơn làm µ1 để không nhận được giá trị thống kê t âm.
- Với ví dụ của chúng ta, giả sử trung bình quan sát của nhóm 2 (những người không đọc bài trước) là 80. Giá trị thống kê t là: t = (µ1 – µ2)/sd = (88,6 – 80)/3,29 = 2,61.
- Xác định bậc tự do của mẫu. Khi dùng giá trị thống kê t, bậc tự do được xác định dựa trên kích cỡ mẫu. Cộng số quan sát của mỗi nhóm và sau đó trừ đi hai. Với ví dụ trên, bậc tự do (d.f.) là 8 bởi có 5 quan sát ở nhóm thứ nhất và 5 quan sát ở nhóm thứ hai ((5 + 5) – 2 = 8).[9]
-
Dùng
bảng
t
để
đánh
giá
mức
ý
nghĩa.
Bảng
giá
trị
thống
kê
t[10]
và
bậc
tự
do
có
thể
được
tìm
thấy
ở
sách
thống
kê
chuẩn
hoặc
qua
mạng.
Tìm
dòng
chứa
bậc
tự
do
của
dữ
liệu
và
giá
trị
p
tương
ứng
với
giá
trị
thống
kê
t
mà
bạn
có.
- Với bậc tự do 8 và t = 2,61, giá trị p cho kiểm định một đầu nằm giữa 0,01 và 0,025. Bởi mức ý nghĩa được chọn nhỏ hơn hoặc bằng 0,05, dữ liệu của chúng ta có ý nghĩa thống kê. Với dữ liệu này, chúng ta bác bỏ giả thuyết không và chấp nhận giả thuyết nghịch:[2] sinh viên đọc tài liệu trước khi đến lớp có điểm cuối kỳ cao hơn.
- Cân nhắc tiến hành nghiên cứu tiếp theo. Nhiều nhà nghiên cứu thực hiện nghiên cứu tiền đề với một vài giá trị đo lường để hiểu cách thiết kế một nghiên cứu lớn hơn. Thực hiện nghiên cứu khác với nhiều giá trị đo lường hơn sẽ nâng cao độ tự tin với kết luận của bạn.
Lời khuyên[sửa]
- Thống kê là một lĩnh vực lớn và phức tạp. Hãy tham gia một khóa kiểm định giả thuyết thống kê tương đương trình độ cấp ba hay đại học (hoặc cao hơn) để hiểu về ý nghĩa thống kê.
Cảnh báo[sửa]
- Phân tích này tập trung vào kiểm định t để kiểm tra sự khác biệt giữa hai tổng thể phân phối chuẩn. Tùy vào độ phức tạp của dữ liệu, có thể bạn sẽ cần một kiểm định thống kê khác.
Nguồn và Trích dẫn[sửa]
- ↑ http://blog.minitab.com/blog/adventures-in-statistics/how-to-correctly-interpret-p-values
- ↑ 2,0 2,1 https://statistics.laerd.com/statistical-guides/hypothesis-testing-3.php
- ↑ http://www.stat.yale.edu/Courses/1997-98/101/sigtest.htm
- ↑ https://web.csulb.edu/~msaintg/ppa696/696stsig.htm#INTERPRET THE Chi
- ↑ http://www.jeremymiles.co.uk/misc/power/
- ↑ http://powerandsamplesize.com/Calculators/Compare-2-Means/2-Sample-1-Sided
- ↑ 7,0 7,1 https://www.mathsisfun.com/data/standard-deviation-formulas.html
- ↑ 8,0 8,1 http://archive.bio.ed.ac.uk/jdeacon/statistics/tress4a.html
- ↑ http://www.kean.edu/~fosborne/bstat/07b2means.html
- ↑ http://www.sjsu.edu/faculty/gerstman/StatPrimer/t-table.pdf