Định nghĩa Independent Samples T-Test
Nếu muốn so sánh giá trị trung bình của 2 nhóm tổng thể riêng biệt ta thực hiện phép kiểm định giả thuyết về sự bằng nhau của 2 trung bình tổng thể dựa trên 2 mẫu độc lập rút ra từ 2 tổng thể này (Biến định lượng kết hợp với 1 biến định tính dùng để chia nhóm ra so sánh).
Nếu kiểm định giả thuyết về trị trung bình của 2 mẫu độc lập vi phạm giả định là 2 mẫu được lấy ngẫu nhiên từ 2 tổng thể có phân phối chuẩn thì khi đó chúng ta sẽ thực hiện kiểm định phi tham số có tên Mann-Whitney.
Independent Samples T-Test dùng để so sánh giá trị trung bình của hai nhóm. Ví dụ cần so sánh giữa hai biến: biến nhóm giới tính( nhóm nam và nhóm nữ) và biến mức độ Hài Lòng. Ta cần biết giữa hai nhóm giới tính này, thì nhóm nào có mức độ hài lòng cao hơn. Thì ta sẽ dùng kiểm định này.
Independent Samples T-Test dùng tương tự như phân tích 1 way ANOVA, tuy nhiên hạn chế của kiểm định này là chỉ so sánh được 2 nhóm với nhau, trong khi đó 1 way ANOVA có thể so sánh được từ 3 nhóm nhóm trở lên.
Ví dụ: dùng so sánh có sự khác biệt giữa các nhóm giới tính( nam, nữ); nhóm nơi ở (nông thôn, thành thị); nhóm thu nhập (thu nhập dưới 10 triệu và thu nhập từ 10 triệu trở lên) với sự hài lòng (thang đo likert 5 điểm) hay không.
Cách thức tiến hành kiểm định giả thuyết về trị trung bình của 2 tổng thể độc lập (Independent Samples T-test)
Hướng dẫn trong bài viết này sẽ so sánh có sự khác biệt về sự Hài Lòng giữa hai nhóm giới tính ( Nam , Nữ) hay không. Ta có hai biến là biến hài lòng (HL) là biến định lượng và biến gioitinh là biến định tính gồm 2 nhóm (nam và nữ). Biến HL được tạo từ lệnh Transform –> Compute variables…(có thể xem thêm hướng dẫn cách tạo biến đại diện tại đây)
Vào menu Analyze -> Compare Means -> Independent-samples T-test
Chọn biến định lượng cần kiểm định trị trung bình đưa vào khung Test Variable(s). ( biến hài lòng (HL))
Chọn biến định tính chia số quan sát thành 2 nhóm mẫu để so sánh giữa 2 nhóm này với nhau đưa vào khung Grouping Variable.( biến gioitinh)
Chọn Define Groups… để nhập mã số của 2 nhóm( nhập giá trị 1 và 2 như trong hình). Trong data quy ước 1 là giới tính nam và 2 là giới tính nữ. Click Continue để trở lại hộp thoại chính -> Click Ok để thực hiện lệnh.
Cách phân tích kiểm định Levene:
Trong kiểm định Independent-samples T-test, ta cần dựa vào kết quả kiểm định sự bằng nhau của 2 phương sai tổng thể (kiểm định Levene). Phương sai diễn tả mức độ đồng đều hoặc không đồng đều (độ phân tán) của dữ liệu quan sát.
Trước khi kiểm định trung bình ta cần phải thực hiện một kiểm định khác mà kết quả nó ảnh hưởng rất quan trọng đến kiểm định trung bình, đó là kiểm định sự bằng nhau của 2 phương sai tổng thể. Vì phương sai diễn tả sự đồn đều hay không đồng đều của tập dữ liệu quan sát nên phải kiểm định sự bằng nhau về phương sai. Kiểm định này có tên là Levene test.
- Nếu giá trị Sig. trong kiểm định Levene (kiểm định F) < 0.05 (5%) thì phương sai của 2 tổng thể khác nhau, ta sử dụng kết quả kiểm định T-test ở dòng Equal variances not assumed.
- Nếu Sig. ≥ 0.05 (5%) thì phương sai của 2 tổng thể bằng nhau, ta sử dụng kết quả kiểm định T-test ở dòng Equal variances assumed.
- Trong ví dụ trên Sig. của kiểm định F = 0.111> 0.05 nên chấp nhận giả thuyết H0: không có sự khác nhau về phương sai của 2 nhóm giới tính => nên sử dụng kết quả T-test ở dòng Equal variances assumed.
Cách phân tích Independent-samples T-test:
- Nếu Sig. của kiểm định T-test ≤ α (mức ý nghĩa 5%) -> có sự khác biệt có ý nghĩa về trung bình của 2 tổng thể. Mức ý nghĩa thông thường là 0.05 (5%).
- Nếu Sig. > α (mức ý nghĩa 5%) -> không có sự khác biệt có ý nghĩa về trung bình của 2 tổng thể.
Trong ví dụ trên sig. của kiểm định T-test = 0.220 > 0.05 nên kết luận không có sự khác biệt có ý nghĩa về trung bình về mức độ hài lòng giữa 2 nhóm khách hàng nam và nữ. Nói cách khác, giữa hai nhóm giới tính khác nhau thì chưa có bằng chứng cho thấy có sự khác nhau về sự hài lòng.
Cụ thể, khi xét cột Mean trong bảng Group statistic ở trên. Ta thấy trung bình giá trị Hài Lòng của nhóm Nam là 3.893, của nhóm Nữ là 3.989. Kết quả cho thấy hai giá trị này không chênh lệnh nhau mấy, nên sự khác biệt này không có ý nghĩa thống kê ở mức 5%.
Nguồn: tổng hợp, Hoàng Trọng & Chu Nguyễn Mộng Ngọc (2008)
Leave a Reply