Chủ đề nóng: Phương pháp kỷ luật tích cực - Cổ học tinh hoa - Những thói hư tật xấu của người Việt - Công lý: Việc đúng nên làm - Giáo án Điện tử - Sách giáo khoa - Học tiếng Anh - Bài giảng trực tuyến - Món ăn bài thuốc - Chăm sóc bà bầu - Môi trường - Tiết kiệm điện - Nhi khoa - Ung thư - Tác hại của thuốc lá - Các kỹ thuật dạy học tích cực
- Dạy học phát triển năng lực - Chương trình giáo dục phổ thông
Tính trị số p
Từ VLOS
Trị số P là đại lượng thống kê giúp các nhà khoa học quyết định giả thuyết của họ đúng hay sai. Trị số P được sử dụng để xác định liệu kết quả thí nghiệm có nằm trong dãy giá trị thông thường của các trường hợp được quan sát. Nếu trị số P của một chuỗi số liệu thấp hơn giá trị cụ thể dự định trước (ví dụ như 0,05), các nhà khoa học sẽ bác bỏ "giả thuyết vô hiệu" (null hypothesis) của thí nghiệm - nói cách khác, họ sẽ từ bỏ giả thuyết rằng các biến số của thí nghiệm không có tác động thực sự lên kết quả. Ngày nay, trị số p thường được tìm theo bảng tham chiếu bằng cách tính các trị số chi bình phương (chi square).
Các bước[sửa]
-
Xác
định
kết
quả
kỳ
vọng
của
thí
nghiệm.
Thông
thường,
khi
nhà
khoa
học
tiến
hành
thí
nghiệm
và
quan
sát
kết
quả,
họ
đã
dự
đoán
trước
kết
quả
"bình
thường"
hay
"điển
hình"
sẽ
như
thế
nào.
Việc
này
có
thể
dựa
trên
kết
quả
thí
nghiệm
đã
làm,
các
chuỗi
số
liệu
theo
dõi
được
đáng
tin
cậy,
tài
liệu
khoa
học,
và/hoặc
các
nguồn
khác.
Đối
với
thí
nghiệm
của
bạn,
hãy
xác
định
kết
quả
kỳ
vọng
và
thể
hiện
bằng
con
số.
- Ví dụ: Theo các nghiên cứu trước đây, xe ô tô màu đỏ hay bị nhận vé phạt quá tốc độ hơn xe ô tô màu xanh trên phạm vi toàn quốc. Giả sử kết quả trung bình là 2:1 nghiêng về xe đỏ. Ta muốn biết liệu có chuyện cảnh sát thành phố cũng thể hiện khuynh hướng này bằng cách phân tích số lượng vé phạt quá tốc độ do họ đưa ra. Nếu lấy mẫu ngẫu nhiên 150 vé phạt quá tốc độ đối với cả xe đỏ và xe xanh trong thành phố, ta dự tính 100 đối với xe đỏ và 50 cho xe xanh nếu cảnh sát thành phố buộc phải phạt theo khuynh hướng trên phạm vi quốc gia.
-
Xác
định
kết
quả
thí
nghiệm
được
quan
sát.
Giờ
bạn
đã
có
giá
trị
kỳ
vọng,
bạn
hãy
tiến
hành
thí
nghiệm
và
tìm
giá
trị
thực
tế
(hay
"quan
sát
được").
Hãy
thể
hiện
các
kết
quả
đó
bằng
con
số.
Nếu
ta
tác
động
vào
điều
kiện
thí
nghiệm
và
kết
quả
thực
tế
khác
so
với
kết
quả
kỳ
vọng,
hai
khả
năng
có
thể
xảy
ra:
hoặc
là
do
ngẫu
nhiên,
hoặc
việc
tác
động
vào
các
biến
số
trong
thí
nghiệm
dẫn
đến
sự
khác
biệt
đó.
Mục
đích
tìm
trị
số
p
về
cơ
bản
là
xác
định
liệu
kết
quả
quan
sát
được
có
khác
so
với
kết
quả
kỳ
vọng
tới
mức
đủ
để
bác
bỏ
"giả
thuyết
vô
hiệu"
-
giả
thuyết
rằng
không
có
mối
quan
hệ
giữa
các
biến
số
trong
thí
nghiệm
và
kết
quả
quan
sát
được.
- Ví dụ: Giả sử, trong thành phố, ta chọn ngẫu nhiên 150 vé phạt đối với xe đỏ và xe xanh. Ta phát hiện ra 90 vé phạt xe đỏ và 60 vé phạt xe xanh. Các con số này khác so với kết quả kỳ vọng tương ứng là 100 và 50. Có phải sự tác động của ta trong thí nghiệm (trong trường hợp này là thay đổi nguồn số liệu từ phạm vi quốc gia xuống phạm vi địa phương) dẫn đến thay đổi về kết quả không, hay cảnh sát thành phố cũng có khuynh hướng như kết quả trung bình trên phạm vi toàn quốc cho thấy, và chúng ta đang quan sát thấy sự thay đổi ngẫu nhiên? Trị số p sẽ giúp ta đưa ra quyết định trong trường hợp này.
-
Xác
định
các
bậc
tự
do
trong
thí
nghiệm.
Bậc
tự
do
là
thước
đo
mức
độ
dao
động
trong
nghiên
cứu,
được
quyết
định
bởi
số
lượng
các
nhóm
mà
bạn
kiểm
tra.
Biểu
thức
bậc
tự
do
được
viết
như
sau:
Bậc
tự
do
=
n-1,
trong
đó:
"n"
là
số
nhóm
hoặc
biến
số
được
phân
tích
trong
thí
nghiệm.
- Ví dụ: Thí nghiệm có hai nhóm kết quả: một đối với xe đỏ và một đối với xe xanh. Vì vậy, trong thí nghiệm này, ta có 2-1 = 1 bậc tự do. Nếu ta so sánh xe đỏ, xe xanh nước biển và xe xanh lá cây, ta sẽ có 2 bậc tự do, v.v...
-
Dùng
trị
số
chi
bình
phương
để
so
sánh
kết
quả
kỳ
vọng
và
kết
quả
thực
tế.
Trị
số
chi
bình
phương
(viết
là
"x2")
là
giá
trị
bằng
số
để
đo
sự
khác
nhau
giữa
giá
trị
kỳ
vọng
và
kết
quả
quan
sát
được.
Phương
trình
tính
chi
bình
phương
như
sau:
x2
=
Σ((o-e)2/e),
trong
đó:
"o"
là
giá
trị
quan
sát
được
và
"e"
là
giá
trị
kỳ
vọng.[1]
Cộng
các
đáp
số
của
phương
trình
trong
mọi
kết
quả
có
thể
xảy
ra
(xem
bên
dưới).
- Chú ý là phương trình này gồm toán tử Σ (sigma). Nói cách khác, bạn sẽ phải tính ((|o-e|-0,05)2/e) cho mỗi khả năng có thể xảy ra - hoặc là xe đỏ hoặc là xe xanh nhận vé phạt. Vì vậy, ta sẽ tính ((o-e)2/e) hai lần - một cho xe đỏ và một cho xe xanh.
-
Ví
dụ:
Hãy
lắp
giá
trị
kỳ
vọng
và
giá
trị
quan
sát
được
vào
phương
trình
x2
=
Σ((o-e)2/e).
Nhớ
là
vì
có
toán
tử
sigma,
ta
cần
tính
((o-e)2/e)
hai
lần
-
một
cho
xe
đỏ
và
một
cho
xe
xanh.
Phép
tính
thực
hiện
như
sau:
- x2 = ((90-100)2/100) + (60-50)2/50)
- x2 = ((-10)2/100) + (10)2/50)
- x2 = (100/100) + (100/50) = 1 + 2 = 3 .
-
Chọn
mức
ý
nghĩa
thống
kê.
Giờ
ta
có
bậc
tự
do
và
trị
số
chi
bình
phương
cho
thí
nghiệm,
việc
cuối
cùng
phải
làm
trước
khi
tìm
trị
số
p
là
xác
định
mức
ý
nghĩa
thống
kê.
Về
cơ
bản,
mức
ý
nghĩa
thống
kê
là
thước
đo
mức
độ
chắc
chắn
về
kết
quả
-
ý
nghĩa
thống
kê
thấp
tương
ứng
với
xác
suất
kết
quả
thí
nghiệm
có
được
ngẫu
nhiên
là
thấp,
và
ngược
lại.
Mức
ý
nghĩa
thống
kê
được
viết
dưới
dạng
thập
phân
(như
0,01),
tương
ứng
với
tỷ
lệ
kết
quả
thí
nghiệm
có
được
một
cách
ngẫu
nhiên
(trong
trường
hợp
này
là
1%).
- Theo thông lệ, các nhà khoa học lấy mức ý nghĩa thống kê cho thí nghiệm là 0,05, hay 5 phần trăm.[2] Điều này có nghĩa là kết quả thí nghiệm đáp ứng mức ý nghĩa thống kê có nhiều nhất 5% cơ hội là kết quả hoàn toàn ngẫu nhiên. Hay nói cách khác, có 95% cơ hội kết quả có được do tác động của nhà khoa học đối với các biến số trong thí nghiệm hơn là ngẫu nhiên. Đối với hầu hết thí nghiệm, 95% chắc chắn về mối liên hệ giữa hai biến số được xem là "thành công".
- Ví dụ: Trong thí nghiệm xe đỏ và xe xanh, ta hãy theo thông lệ khoa học và lấy mức ý nghĩa thống kê là 0,05.
-
Sử
dụng
bảng
phân
bố
chi
bình
phương
để
tính
trị
số
p.
Các
nhà
khoa
học
và
toán
học
dùng
bảng
có
nhiều
giá
trị
chi
bình
phương
để
tính
trị
số
p
cho
thí
nghiệm
của
họ.
Những
bảng
số
liệu
này
thường
được
tạo
với
trục
tung
ở
bên
trái
tương
ứng
với
bậc
tự
do
và
trục
hoành
ở
trên
tương
ứng
với
trị
số
p.
Sử
dụng
các
bảng
này
bằng
cách
tìm
bậc
tự
do
trước,
sau
đó
đọc
các
dòng
từ
trái
qua
phải
đến
khi
bạn
tìm
thấy
giá
trị
đầu
tiên
lớn
hơn
giá
trị
chi
bình
phương.
Hãy
nhìn
vào
trị
số
p
tương
ứng
trên
đầu
cột
-
trị
số
p
nằm
trong
khoảng
giá
trị
đó
và
giá
trị
lớn
nhất
tiếp
theo
(giá
trị
nằm
ở
bên
trái
liền
kề).
- Có nhiều nguồn tham khảo bảng phân bố giá trị chi bình phương - bạn có thể dễ dàng tìm thấy bảng này trên mạng hoặc trong các sách giáo khoa về khoa học và thống kê. Nếu không có sẵn, hãy sử dụng bảng trong ảnh ở trên hoặc miễn phí trực tuyến, giống như bảng trên trang web: medcalc.org ở đây.
- Ví dụ: Giá trị chi bình phương là 3. Vì vậy, hãy sử dụng bảng phân bố chi bình phương trong ảnh ở trên để tìm trị số p gần đúng. Ta đã biết thí nghiệm có bậc tự do là 1, hãy bắt đầu từ hàng đầu tiên. Đi từ trái sang phải của hàng đó ta tìm được giá trị cao hơn 3 - giá trị của chi bình phương. Giá trị đầu tiên ta gặp là 3,84. Nhìn vào đầu cột, ta thấy giá trị p tương ứng là 0,05. Điều đó có nghĩa là trị số p sẽ nằm trong khoảng từ 0,05 đến 0,1 (giá trị p lớn nhất tiếp theo trong bảng).
-
Quyết
định
liệu
có
giữ
lại
hay
bác
bỏ
giả
thuyết
vô
hiệu.
Bạn
đã
tìm
được
giá
trị
p
gần
đúng
cho
thí
nghiệm,
giờ
bạn
có
thể
quyết
định
bác
bỏ
hay
chấp
nhận
giả
thuyết
vô
hiệu
của
thí
nghiệm
(bạn
cần
nhớ
rằng,
đây
là
giả
thuyết
về
việc
các
biến
số
trong
thí
nghiệm
mà
bạn
tác
động
đến
không
ảnh
hưởng
tới
kết
quả
quan
sát
được).
Nếu
trị
số
p
thấp
hơn
mức
ý
nghĩa
thống
kê,
xin
chúc
mừng
-
bạn
đã
chứng
minh
được
khả
năng
cao
có
mối
quan
hệ
giữa
các
biến
số
mà
bạn
tác
động
và
kết
quả
do
quan
sát
được.
Nếu
giá
trị
p
cao
hơn
mức
ý
nghĩa
thống
kê,
bạn
không
thể
chắc
chắn
được
liệu
kết
quả
thực
tế
có
được
do
ngẫu
nhiên
hoàn
toàn
hay
do
bạn
tác
động
trong
khi
làm
thí
nghiệm.
- Ví dụ: Giá trị p nằm trong khoảng 0,05 và 0,1. Điều này có nghĩa giá trị đó hoàn toàn không nhỏ hơn 0,05, vì vậy, tiếc là ta không thể bác bỏ giả thuyết vô hiệu được. Điều đó có nghĩa là ta không đạt được ngưỡng chắc chắn tối thiểu 95% để có thể khẳng định rằng cảnh sát thành phố đưa ra vé phạt xe đỏ và xe xanh ở tỷ lệ khác đáng kể so với mức trung bình trên toàn quốc.
- Nói cách khác, có 5-10% khả năng kết quả quan sát được không bắt nguồn từ sự thay đổi địa điểm (phân tích số liệu thành phố thay vì số liệu toàn quốc), mà chỉ là do ngẫu nhiên. Vì ta tìm khả năng ít hơn 5%, nên không thể khẳng định được là ta biết chắc cảnh sát thành phố ít chú ý đến xe đỏ hơn - mặc dù ít nhưng vẫn có khả năng đáng kể về mặt thống kê cho thấy họ không làm như vậy.
Lời khuyên[sửa]
- Máy tính bỏ túi có thể tính toán nhanh hơn rất nhiều. Bạn có thể sử dụng máy tính trực tuyến.
- Bạn có thể tính trị số p bằng các chương trình máy tính, như phần mềm bảng tính thông thường hay phần mềm thống kê chuyên dụng hơn.
Nguồn và Trích dẫn[sửa]
- http://www.southalabama.edu/coe/bset/johnson/studyq/sq16.htm
- http://www2.lv.psu.edu/jxm57/irp/chisquar.html
- http://www.csulb.edu/~msaintg/ppa696/696stsig.htm#4)
- http://faculty.vassar.edu/lowry/tabs.html#z
- http://www.okstate.edu/ag/agedcm4h/academic/aged5980a/5980/newpage28.htm
- http://faculty.vassar.edu/lowry/ch8pt1.html