Cách đọc trị số R2 / R-Squared trong Stata
Để dễ hiểu, ta có thể xem xét một ví dụ cụ thể: Giả sử cần phân tích mối quan hệ giữa biến y là nồng độ cholesterol trong máu và biến x là độ tuổi.
1 3.5 46
2 1.9 20
... ... ...
30 4.0 50
- Đầu tiên, ta thu thập số liệu của y và x thông qua khảo sát một nhóm người. Ta số liệu thu thập được:
1 3.5 46
2 1.9 20
... ... ...
30 4.0 50
- Tiếp theo ta chạy số liệu theo một mô hình có dạng: y = a + bx trong một phần mềm thống kê (SPSS, Eviews, Stata...)
- Ta có kết quả của hệ số a và b. Dấu và giá trị của b sẽ nói lên biến x có tác động thế nào đến biến y.
- Một hệ số quan trọng nữa cần lưu ý là R2 hay còn được biết đến với nhiều tên gọi như: R squared / R bình phương / coefficient of determination / hệ số xác định bội / goodness of fit statistics
- R2 có giá trị từ 0 đến 1
- Giả sử: R2 có giá trị là 0.88. Điều này có nghĩa là: Mô hình y = a + bx nói trên giải thích khoảng 88% các khác biệt về nồng độ cholesterol giữa các cá nhân. Giá trị R2 càng cao là một dấu hiệu cho thấy mối liên hệ giữa biến độ tuổi và biến nồng độ cholesterol càng chặt chẽ.