Khi quyết định sử dụng mô hình hồi quy bội, chúng ta phải kiểm tra các giả định cần thiết của nó xem kết quả có tin cậy được không (Trích Nguyễn Đình Thọ, 2011). Kiểm tra các giả định sau:
- Phương sai của sai số (phần dư) không đổi.
- Các phần dư có phân phối chuẩn.
- Không có mối tương quan giữa các biến độc lập.
- Kiểm định giả định phương sai của sai số (phần dư) không đổi
Nếu các giả định này bị vi phạm thì các ước lượng không đáng tin cậy nữa (Hoàng Trọng – Mộng Ngọc, 2008).
Kiểm định liên hệ tuyến tính giữa biến phụ thuộc và các biến độc lập cũng như hiện tượng phương sai thay đổi (heteroskedasticity)
Kiểm tra giả định này bằng cách vẽ đồ thị phân tán giữa các phần dư và giá trị dự đoán mà mô hình hồi quy tuyến tính cho ra. Người ta hay vẽ biểu đồ phân tán giữa 2 giá trị này đã được chuẩn hóa (standardized) với phần dư trên trục tung và giá trị dự đoán trên trục hoành. Nếu giả định liên hệ tuyến tính và phương sai bằng nhau được thỏa mãn, thì ta sẽ không nhận thấy có mối quan hệ gì giữa các giá trị dự đoán với phần dư, chúng sẽ phân tán ngẫu nhiên. (Trích Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2008, trang 224)

Nhận xét: Hình Scatter Plot cho thấy kết quả là giá trị phần dư chuẩn hóa phân tán rất ngẫu nhiên trong một vùng xung quanh đường đi qua tung độ 0 chứ không tạo thành một hình dạng nào. Vì vậy giả định phương sai không đổi của mô hình hồi quy không đổi.
Kiểm định giả định về phân phối chuẩn của phần dư
Phần dư có thể không tuân theo phân phối chuẩn vì nhiều lý do, sử dụng mô hình không đúng, phương sai không phải là hằng số, số lượng phần dư không đủ nhiều để phân tích (Hoàng Trọng & Chu Nguyễn Mộng Ngọc, 2008).
Biểu đồ tần số (Histogram, Q-Q plot, P-P plot) của các phần dư (đã được chuẩn hóa) sẽ được sử dụng để kiểm tra giả định này.

Nhận xét: Theo Hình Histogram cho thấy một đường cong xấp xỉ phân phối chuẩn đặt chồng lên biểu đồ tần số, với giá trị trung bình gần bằng 0, và độ lệch chuẩn 0.992 (gần bằng 1). Vì vậy giả định về phân phối chuẩn của phần dư không bị vi phạm.

Nhận xét: Kết quả từ biểu đồ tần số P-P plot cho thấy các điểm phân tán xung quanh được kỳ vọng. Cũng cho thấy giả định phân phối chuẩn của phần dư không vi phạm.
Hiện tượng tự tương quan giữa các phần dư
Trị số Durbin – Watson (DW) dùng để kiểm tra hiện tượng tự tương quan chuỗi bậc nhất kiểm định tương quan của các sai số kề nhau). DW có giá trị biến thiên trong khoảng từ 0 đến 4; nếu các phần sai số không có tương quan chuỗi bậc nhất với nhau thì giá trị sẽ gần bằng 2, nếu giá trị càng nhỏ, gần về 0 thì các phần sai số có tương quan thuận; nếu càng lớn, gần về 4 có nghĩa là các phần sai số có tương quan nghịch.
Theo Field (2009), nếu DW nhỏ hơn 1 và lớn hơn 3, chúng ta cần thực sự lưu ý bởi khả năng rất cao xảy ra hiện tượng tự tương quan chuỗi bậc nhất. Theo Yahua Qiao (2011), thường giá trị DW nằm trong khoảng 1.5 – 2.5 sẽ không xảy ra hiện tượng tự tương quan, đây cũng là mức giá trị tiêu chuẩn chúng ta sử dụng phổ biến hiện nay. Giá trị này thường nằm trong bảng Model Summary.

Nhận xét: Kết quả kiểm định Durbin-Watson được trình bày trong bảng Model Summary cho Giá trị (d) tính được bằng 1.570. Như vậy, chấp nhận giả định không có tương quan giữa các phần dư.
Hiện tượng đa cộng tuyến
Đa cộng tuyến là trạng thái trong đó các biến độc lập có tương quan chặt chẽ với nhau, từ đó chúng cung cấp cho mô hình những thông tin rất giống nhau, rất khó tách rời ảnh hưởng của từng biến đến biến phụ thuộc. Đồng thời nó làm tăng độ lệch chuẩn của hệ số hồi qui và làm giảm giá trị t của kiểm định ý nghĩa của chúng nên các hệ số có khuynh hướng kém ý nghĩa hơn trong khi R2 vẫn khá cao.
Hệ số phóng đại phương sai VIF dùng để kiểm tra hiện tượng đa cộng tuyến. Thông thường, nếu VIF của một biến độc lập lớn hơn 10 nghĩa là đang có đa cộng tuyến xảy ra với biến độc lập đó. Khi đó, biến này sẽ không có giá trị giải thích biến thiên của biến phụ thuộc trong mô hình hồi quy. Tuy nhiên, trên thực tế, nếu hệ số VIF > 2 thì khả năng rất cao đang xảy ra hiện tượng đa cộng tuyến giữa các biến độc lập. Giá trị này thường nằm trong bảng Coefficients.

Nhận xét: Kết quả bảng Cofficients cho thấy hệ số VIF của các biến độc lập dao động từ 1.203 đến 1.506. Vì vậy, kết quả phân tích hồi quy cho thấy mô hình không có hiện tượng đa cộng tuyến giữa các biến độc lập (VIF < 2).
Leave a Reply