Ứng dụng của hồi quy binary logistic
Hồi quy binary logistic sử dụng biến phụ thuộc dạng nhị phân để ước lượng xác suất một sự kiện sẽ xảy ra với những thông tin của biến độc lập mà ta có được.
Chẳng hạn, trong nghiên cứu chúng ta cần dự đoán khả năng xảy ra một sự kiện nào đó mà ta quan tâm (xác suất xảy ra) như: quyết định sử dụng hay không sử dụng, người vai nợ có trả được nợ không, mua hay không mua….Những biến nghiên cứu này chỉ có 2 biểu hiện và sẽ được mã hóa thành 2 giá trị là 0 và 1. Dạng này gọi là biến nhị phân.
Với hồi quy binary logistic, thông tin chúng ta cần thu thập về biến phụ thuộc là một sự kiện nào đó có xảy ra hay không. Biến phụ thuộc Y lúc này có 2 giá trị 0 và 1. Với 0 là không xảy ra sự kiện ta quan tâm và 1 là có xảy ra sự kiện. Từ biến phụ thuộc này, một thủ tục sẽ được dùng để dự đoán xác suất sự kiện xảy ra theo quy tắc nếu xác suất đượ dự đoán lớn hơn 0.5 thì kết quả dự đoán sẽ là “có” xảy ra sự kiện. Ngược lại, thì kết quả dự đoán sẽ là “không”.
Mô hình hàm Binary logistic như sau:
Trong công thức này Pi = E(Y = 1/X) = P(Y=1) gọi là xác suất để sự kiện xảy ra (Y1) khi biến độc lập có giá trị cụ thể là Xi.
Tiến hành phân tích hồi quy Binary logistic với SPSS
Giả sử chúng ta nghiên cứu về khả năng tiếp cận vốn của Doanh nghiệp nhỏ và vừa (DNNVV). Giả sử khả năng tiếp cận tín dụng ngân hàng của DNNVV chịu ảnh hưởng bởi các yếu tố sau: Vốn chủ sở hữu (VCSH), tỷ suất lợi nhuận trên tổng tài sản (ROA), tài sản bảo đảm (TSBD), tỷ lệ nợ trên tổng tài sản (TN_TTS), tuổi doanh nghiệp (TDN), mối quan hệ giữa doanh nghiệp với ngân hàng (MQH), học vấn chủ doanh nghiệp (HV), số lao động của DNNVV (LD), giới tính chủ DNNVV (GT).
Vào Analyze –> Regression –> Binary logistic, lựa chọn này mở ra hộp thoại Logistic regression
Chọn biến phụ thuộc đưa sang khung (Dependent). Lưu ý, chỉ chọn biến có 2 biểu hiện. Nếu biến phụ thuộc bạn chọn không có đúng 2 biểu hiện thì thủ tục này không thự hiện được.
Chọn các biến độc lập đưa sang khung Covaritate.
Trong Nút Method bạn chọn các phương pháp đưa biến độc lập vào mô hình, ở đây ta để chế độ mặc định là Enter
Trong Nút Options: Bạn chọn CI for Exp(B). Rồi bấm Continue –> Bấm OK
Kết quả kiểm định mức độ phù hợp của mô hình
Kết quả kiểm định giả thuyết về mức độ phù hợp của mô hình tổng quát có mức ý nghĩa < 0.05. Như vậy mô hình tổng quát cho thấy có sự tương quan giữa biến phụ thuộc và các biến độc lập có ý nghĩa thống kê với khoảng tin cậy trên 99%.
Kiểm định mức độ giải thích của mô hình
Trong kết quả này thì hệ số -2 Log likehood này nhỏ nên mô hình có sự phù hợp. Đồng thời hệ số Nagelkerke R Square = 0.673 cho thấy 67.3% sự thay đổi của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình, còn lại là do các yếu tố khác.
Kiểm định mức độ dự báo chính xác của mô hình
Overall Peracentage = (45 + 43)/(45 + 7 + 10 + 43) = 88/105 = 0.838 = 83.8%
Kết quả cho thấy khả năng số lượng DNNVV có khả năng tiếp cận vốn chiếm 53(43+10) DN, trong đó thì kết quả dự đoán là 40 DN, cho thấy khả năng dự đoán DN tiếp cận được vốn NH chính xác chiếm 81.1%. Đối với đối tượng không tiếp cận được vốn là: 52 doanh nghiệp (45+7), kết quả dự đoán là: 45 DN, chiếm tỷ lệ là: 86.5%. Kết quả cho thấy mô hình có mức độ dự đoán chính xác trung bình là: 83.8%.
Kết quả hồi quy nhị phân
Với mức ý nghĩa 5%, hệ số hồ quy của các biến tài sản đảm bảo (TSDB), tỷ lệ nợ trên tổng tài sản (TN_TTS), trình độ học vấn của chủ doanh nghiệp (HV), giới tính chủ doanh nghiệp (GT) có ý nghĩa thống kê, nói cách khác các yếu tố trên ảnh hưởng đến khả năng tiếp cận vốn của DNNVV.
Leave a Reply