Luận án Nghiên cứu và phân tích các yếu tố rủi ro trong giai đoạn thi công của dự án đầu tư xây dựng

Luận án Nghiên cứu và phân tích các yếu tố rủi ro trong giai đoạn thi công của dự án đầu tư xây dựng trang 1

Trang 1

Luận án Nghiên cứu và phân tích các yếu tố rủi ro trong giai đoạn thi công của dự án đầu tư xây dựng trang 2

Trang 2

Luận án Nghiên cứu và phân tích các yếu tố rủi ro trong giai đoạn thi công của dự án đầu tư xây dựng trang 3

Trang 3

Luận án Nghiên cứu và phân tích các yếu tố rủi ro trong giai đoạn thi công của dự án đầu tư xây dựng trang 4

Trang 4

Luận án Nghiên cứu và phân tích các yếu tố rủi ro trong giai đoạn thi công của dự án đầu tư xây dựng trang 5

Trang 5

Luận án Nghiên cứu và phân tích các yếu tố rủi ro trong giai đoạn thi công của dự án đầu tư xây dựng trang 6

Trang 6

Luận án Nghiên cứu và phân tích các yếu tố rủi ro trong giai đoạn thi công của dự án đầu tư xây dựng trang 7

Trang 7

Luận án Nghiên cứu và phân tích các yếu tố rủi ro trong giai đoạn thi công của dự án đầu tư xây dựng trang 8

Trang 8

Luận án Nghiên cứu và phân tích các yếu tố rủi ro trong giai đoạn thi công của dự án đầu tư xây dựng trang 9

Trang 9

Luận án Nghiên cứu và phân tích các yếu tố rủi ro trong giai đoạn thi công của dự án đầu tư xây dựng trang 10

Trang 10

Tải về để xem bản đầy đủ

pdf 199 trang nguyenduy 07/08/2024 390
Bạn đang xem 10 trang mẫu của tài liệu "Luận án Nghiên cứu và phân tích các yếu tố rủi ro trong giai đoạn thi công của dự án đầu tư xây dựng", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

Tóm tắt nội dung tài liệu: Luận án Nghiên cứu và phân tích các yếu tố rủi ro trong giai đoạn thi công của dự án đầu tư xây dựng

Luận án Nghiên cứu và phân tích các yếu tố rủi ro trong giai đoạn thi công của dự án đầu tư xây dựng
o trong quá khứ qua một số năm nhất định, thông 
thường yêu cầu thời khoảng quá khứ có số liệu phải lớn hơn nhiều lần thời khoảng 
làm dự báo. Phương pháp này thích hợp để dự báo những đối tượng phát triển theo 
kiểu tiệm tiến. Phương pháp ngoại suy có ưu điểm là đơn giản, tuy nhiên, nhược 
điểm chính là không tính được ảnh hưởng của các yếu tố khách quan đến kết quả dự 
báo. 
 2.5.2. Phương pháp chuyên gia 
Bản chất của phương pháp chuyên gia là lấy ý kiến đánh giá của các chuyên 
gia để làm kết quả dự báo. Phương pháp này được triển khai theo một quy trình chặt 
chẽ bao gồm nhiều khâu: thành lập nhóm chuyên gia, đánh giá năng lực chuyên gia, 
lập biểu câu hỏi và xử lý toán học kết quả thu được từ ý kiến chuyên gia. Khó khăn 
của phương pháp này là việc tuyển chọn và đánh giá khả năng của các chuyên gia. 
Phương pháp này được áp dụng có hiệu quả cho những đối tượng thiếu (hoặc chưa 
đủ) số liệu thống kê, phát triển có độ bất ổn lớn hoặc đối tượng của dự báo phức tạp 
không có số liệu nền. Kết quả của phương pháp dự báo này chủ yếu phục vụ cho 
nhu cầu định hướng, quản lý vì thế cần kết hợp (trong trường hợp có thể) với các 
phương pháp định lượng khác. 
 2.5.3. Phương pháp mô hình hoá 
Bản chất của phương pháp này là kế thừa hai phương pháp nói trên. Cách 
thức tiếp cận của phương pháp này là dùng hệ thức toán học để mô tả mối liên hệ 
giữa đối tượng dự báo với các yếu tố có liên quan. Khó khăn của phương pháp này 
là phải viết được chính xác hệ thức toán học nói trên. Phương pháp mô hình hoá áp 
dụng cho nghiên cứu kinh tế, tài nguyên-môi trường sẽ phải sử dụng nhiều phương 
trình của mô hình kinh tế lượng vì đối tượng dự báo (mối liên hệ giữa hoạt động 
kinh tế và chất lượng môi trường, sử dụng tài nguyên) có liên quan đến nhiều yếu tố 
kinh tế ví dụ GDP, giá cả, Phương pháp này yêu cầu số liệu của nhiều yếu tố hữu 
65 
quan trong quá khứ trong khi đó, phương pháp ngoại suy chỉ yêu cầu một loại số 
liệu. Tuy nhiên, phương pháp này cũng có ưu điểm, đó là có thể giải thích được kết 
quả dự báo và có thể phân tích ảnh hưởng của các yếu tố liên quan đến kết quả dự 
báo. 
Hiện ở Việt Nam, các mô hình dự báo trong lĩnh vực tài nguyên và môi 
trường chưa nhiều. Mỗi lĩnh vực đặc thù đều áp dụng những công cụ/mô hình riêng, 
đáp ứng những yêu cầu cụ thể, những mô hình này chủ yếu chỉ áp dụng cho chuyên 
môn sâu. Ví dụ, trong lĩnh vực thủy văn để dự báo lũ, mô hình MARINE của Pháp, 
mô hình Mike11 (của Đan Mạch), mô hình SSARR, mô hình TANK, được sử 
dụng, trong dự báo thời tiết thì sử dụng các mô hình về dự báo thời tiết,... 
Trong lĩnh vực quản lý tài nguyên và môi trường, đã có một số mô hình dự 
báo được áp dụng trong nghiên cứu chính sách, quy hoạch phát triển như: 
- VS, TS Nguyễn Trần Dương, GS.TSKH. Nguyễn Quang Thái, TSKH. Trần 
Trọng Khuê, Bùi Trinh đã sử dụng mô hình I-O môi trường để (i) đánh giá định 
lượng giữa tăng trưởng kinh tế và biến động môi trường; (ii) cụ thể hóa mối tương 
quan giữa tăng trưởng kinh tế với lượng phát thải của vùng kinh tế trọng điểm phía 
Nam. 
- Các tác giả Bui Trinh, Francisco T. Secretario, Kim Kwangmun, Le Ha 
Thanh và Pham Huong Giang đã sử dụng mô hình I-O để phân tích tác động môi 
trường-kinh tế để phân tích mức độ phát thải của một số khí nhà kính, nước thải của 
từng ngành, từng khu vực khác nhau. 
- Trong nghiên cứu dự báo lũ nhiều nơi đã sử dụng mô hình MARINE của 
Pháp, mô hình Mike11 (của Viện Thủy lực, Đan Mạch), mô hình SSARR, mô hình 
TANK và mô hình HYDROGIS do Viện Khí tượng Thủy văn (Nay là Viện Khoa 
học Khí tượng Thủy văn và Môi trường) xây dựng cho hệ thống sông Hồng và sông 
Thái Bình để dự báo lũ. Các mô hình này để sử dụng phương pháp định lượng với 
nhiều công thức toán học. 
66 
- Mô hình kinh tế lượng vĩ mô (VN-MACRO) tại Trung tâm Thông tin và 
Dự báo Kinh tế Xã hội Quốc gia được xây dựng để đánh giá tác động của chính 
sách vĩ mô và môi trường bên ngoài cũng như dự báo ngắn hạn và trung hạn. 
- Về dự báo cho lĩnh vực xây dựng, một số tác giả giới thiệu các thành tựu 
của môn sinh học hiện đại để sử dụng cho công tác quản lý dự án [30], [18] như: 
+ Phương pháp hệ thần kinh nhân tạo ( ANN) sử dụng trong quản lý dự án. 
+ Phương pháp di chuyền (GAs) sử dụng nhằm đánh giá kết quả thực hiện 
dự án đầu tư và xây dựng. 
 Có thể sử dụng thuật toán di truyền làm công cụ để thực hiện những phép tối 
ưu hoá cho các bài toán trong tổ chức sản xuất xây dựng. 
2.6. Phương pháp phân tích hồi quy tuyến tính 
Phân tích hồi quy tuyến tính là một phương pháp phân tích quan hệ giữa biến 
phụ thuộc Y với một hay nhiều biến độc lập X. Mô hình hóa sử dụng hàm tuyến 
tính (bậc 1). Các tham số của mô hình (hay hàm số) được ước lượng từ dữ liệu. 
Trong cuốn sách "Kế thừa tự nhiên", Francis Galton đã viết: "mỗi đặc điểm ở 
một người được chia sẻ với các người thân của mình, nhưng về trung bình chỉ ở 
một mức độ thấp. Ví dụ, cha da trắng cao sẽ có xu hướng có con trai cao lớn, các 
con trai về trung bình thấp hơn cha của họ; và con trai với cha thấp, mặc dù có 
chiều cao dưới mức trung bình đối với toàn bộ dân số, sẽ có xu hướng cao hơn cha 
của họ. " Sau đó, ông kết luận một hiện tượng gọi là "luật hồi quy phổ quát" và là 
nguồn gốc của chủ đề chúng ta đang nghiên cứu bây giờ. Ngày nay, đặc tính quay 
về trung bình của toàn dân số từ các giá trị cực đoan đã được thừa nhận rộng rãi và 
được gọi là "hồi quy về trung bình".[36] 
Chúng ta sẽ xem xét các phương pháp đánh giá sự kết hợp giữa các biến liên 
tục bằng cách sử dụng hai phương pháp được gọi là phân tích sự tương quan và 
phân tích hồi quy tuyến tính, hai phương pháp này hiện nay nằm trong số những kĩ 
thuật thống kê phổ biến trong nghiên cứu y học, nghiên cứu về kinh tế. 
67 
 2.6.1. Phân tích sự tương quan 
 a. Phương sai hợp và hệ số tương quan 
Để mô tả độ tương quan giữa hai biến, chúng ta cần phải ước tính hệ số 
tương quan (coefficient of correlation). Và, để hiểu “cơ chế” của hệ số tương quan, 
chúng ta cần làm quen với khái niệm hiệp biến (covariance). Chúng ta biết rằng với 
một biến X hay Y, có ba thông số thống kê mô tả: số cỡ mẫu, số trung (mean), và 
phương sai (variance). Nhưng để mô tả mối tương quan giữa hai biến X và Y, 
chúng ta cần đến hiệp biến. Có thể hiểu hiệp biến qua hình học lượng giác như sau. 
Chúng ta biết rằng cho một tam giác vuông, nếu gọi cạnh huyền là c và hai cạnh còn 
lại là a và b, Định lí Pythagoras cho biết bình phương cạnh huyền bằng tổng bình 
phương hai cạnh kia: 
 c2 = a2 + b2 (2.6.1) 
Nhưng cho một tam giác thường, thì mối liên hệ giữa c và hai cạnh a và b 
phức tạp hơn với mối liên hệ được định lượng bằng hàm cosine của góc C như sau: 
c2 = a2 + b2 – 2ab.cosC (2.6.2) 
Tương tự như vậy, cho hai biến X và Y, và nếu hai biến này hoàn toàn độc 
lập với nhau, chúng ta có thể phát biểu rằng phương sai của biến X + Y bằng 
phương sai của X cộng với phương sai của Y: 
var(X + Y) = var(X) + var(Y) (2.6.3) 
Trong đó, “var” là viết tắt của phương sai (tức variance). Chú ý rằng X+Y là 
một biến mới. Chúng ta cũng chú ý rằng công thức này tương đương với Định lí 
Pythagoras cho tam giác vuông. 
Nếu hai biến X và Y có tương quan nhau, thì công thức trên được thay thế 
bằng một công thức khác với hiệp biến: 
var(X + Y) = var(X) + var(Y) + 2×Cov(X,Y) (2.6.4) 
trong đó, “Cov” là viết tắt của hiệp biến (tức covariance). Chú ý rằng công 
thức này tương đương với công thức của tam giác thường, và cũng chú ý rằng công 
thức trên giống như nhị thức 
(x+y)2 = x2 + y2 +2xy (2.6.5) 
68 
Trên đây là khái niệm. Bây giờ để đi vào chi tiết toán, cần một số kí hiệu để viết tắt 
các chỉ số trên. Gọi xi và yi là hai biến quan sát được của X và Y cho cá nhân i. Giả 
sử chúng ta có n đối tượng thì i = 1, 2, 3, ., n. Gọi x và y là hai số trung bình của 
biến quan sát được x và y; sx
2 và sy
2 lần lược là phương sai của hai biến, được định 
nghĩa như sau: 
Do đó, nếu X và Y độc lập, chúng ta có thể viết: 
 s2x+y = s
2
x + s
2
y (2.6.7) 
Nhưng nếu X và Y có liên hệ với nhau, công thức trên không đáp ứng được 
vấn đề mô tả. Chúng ta cần tìm một chỉ số khác mô tả mối liên hệ giữa hai biến, 
bằng cách nhân độ lệch của biến x từ số trung bình, (xi − x ) , cho độ lệch của biến 
y, (yi − y ) , thay vì bình phương độ lệch từng biến riêng lẻ như công thức (2.6.7). 
Nói cách khác, tích số hai độ lệch chính là hiệp biến. Đối với mỗi cá nhân, hiệp biến 
là: 
 Nhưng ở đây chúng ta có n đối tượng, cho nên cần phải cộng tất cả lại và 
chia cho số đối tượng: 
 (2.6.8) 
Công thức (2.6.8)chính là định nghĩa của hiệp biến. Từ hai công thức trên, có 
thể rút ra vài nhận xét sơ khởi: 
69 
- Phương sai lúc nào cũng là số dương, bởi vì chúng được tính toán từ bình 
phương, nhưng hiệp biến có thể âm mà cũng có thể dương vì được ước tính từ tích 
của hai độ lệch. 
- Một hiệp biến là số dương có nghĩa là độ lệch từ số trung bình của x tuân 
theo chiều hướng thuận với y. 
- Một hiệp biến là số âm có nghĩa là độ lệch từ số trung bình của x tuân theo 
chiều hướng nghịch với y. 
- Nếu hiệp biến là 0, thì hai biến x và y độc lập nhau, tức không có tương 
quan gì với nhau. 
Một cách để “chuẩn hóa” hiệp biến và phương sai là lấy tỉ số của hai chỉ số 
này, và đó chính là định nghĩa của hệ số tương quan. Hệ số tương quan thường 
được kí hiệu bằng r: 
(2.6.9) 
(Chú ý rằng căn số bậc hai của phương sai là độ lệch chuẩn, tức là: 
2
xx ss và 
2
yy ss , cho nên công thức trên được mô tả bằng độ lệch chuẩn, thay 
vì phương sai). Với vài thao tác đại số, có thể viết lại công thức (2.6.9) như sau: 
(2.6.10) 
Công thức còn được biết đến như là hệ số Pearson (Pearson’s correlation 
coefficient) để ghi nhận cống hiến của nhà thống kê học nổi tiếng Karl Pearson, 
người đầu tiên phát triển lí thuyết về tương quan vào đầu thế kỉ 20. 
Nếu giá trị của r là dương, hai biến x và y cùng biến thiên theo một hướng; 
nếu giá trị của r là âm, x và y liên hệ đảo ngược: tức khi khi x tăng thì y giảm, và 
ngược lại. Nếu r = 1 hay r = -1 (Biểu đồ 1a và 1b), mối liên hệ của y và x được 
hoàn toàn xác định; có nghĩa là cho bất cứ giá trị nào của x, chúng ta có thể xác định 
70 
giá trị của y. Nếu r = 0 (Biểu đồ 1c), hai biến x và y hoàn toàn độc lập, tức không có 
liên hệ với nhau. 
Hình 2.4. Biểu đồ mối quan hệ giữa x và y khi r =1 
Hình 2.5.Biểu đồ mối quan hệ giữa x và y khi r = -1 
71 
Hình 2.6.Biểu đồ mối quan hệ giữa x và y khi r = 0 (độc lập) 
Tất nhiên, trong thực tế khoa học thực nghiệm, ít khi nào chúng ta có những 
mối liên hệ xác định như vừa trình bày. Vì sai số trong đo lường, trong khảo sát, 
mối liên hệ giữa x và y thường dao động cao hơn -1 và thấp hơn 1, như hình 2.4, 
2.5, 2.6 
Hình 2.7.Biểu đồ mối quan hệ giữa x và y khi r = 0,8 
72 
Hình 2.8.Biểu đồ mối quan hệ giữa x và y khi r = -0,8 
Hình 2.9.Biểu đồ mối quan hệ giữa x và y khi r = 0,001 
Vấn đề đặt ra là diễn dịch ý nghĩa của hệ số tương quan như thế nào? Có thể 
xem hệ số tương quan như là một “hệ số ảnh hưởng” (effect size). Nếu hệ số ảnh 
hưởng càng cao, thì mối liên hệ có ý nghĩa thực tế. Tuy nhiên, vì ý nghĩa còn tùy 
73 
thuộc vào bộ môn khoa học. Chẳng hạn như đối với các bộ môn khoa học đòi hỏi 
độ chính xác cao, hệ số tương quan phải trên 0.8 mới có thể xem là “có ý nghĩa”; 
nhưng đối với các bộ môn khoa học một hệ số tương quan 0.6 cũng có thể là có ý 
nghĩa. Bảng 2.1 sau đây là những qui ước chung về cách diễn dịch hệ số tương 
quan. 
Bảng 2.1. Ý nghĩa của hệ số tương quan 
b. Khoảng tin cậy 95% của hệ số tương quan 
Cũng như các thông số thống kê khác như số trung bình và độ lệch chuẩn, hệ 
số tương quan cũng chịu ảnh hưởng của dao động giữa các mẫu. Do đó, chúng ta 
cần phải ước tính khoảng tin cậy 95% của hệ số tương quan. Xin nhắc lại rằng, 
chúng ta không biết hệ số tương quan thật (tức là hệ số trong quần thể, và hãy gọi 
hệ số này là ρ) là bao nhiêu, nên phải sử dụng hệ số r để ước tính ρ. 
Muốn ước tính khoảng tin cậy 95% của ρ, chúng ta cần phải ước tính độ lệch 
chuẩn của r. Lý thuyết thống kê cho biết độ lệch chuẩn của r là: 
2
1 2
n
r
sr 
Khó khăn ở đây, như công thức này cho thấy, là độ lệch chuẩn của r tùy 
thuộc vào r, tức là mất tính độc lập. Do đó, cần phải tìm một phương pháp khác sao 
cho khách quan hơn. Nhà thống kê học (và cũng là cha đẻ của khoa học thống kê 
hiện đại và cha đẻ của lí thuyết di truyền hiện đại) Ronald A. Fisher chứng minh 
rằng thay vì tính độ lệch chuẩn của r, có thể tính độ lệch chuẩn của một hàm số của 
r và sẽ đạt được mục tiêu khách quan. 
Theo phương pháp của Fisher, trước hết chúng ta cần phải hoán chuyển r 
sang một chỉ số mới z, qua công thức sau đây: 
74 
(2.6.11) 
Và, có thể chứng minh rằng độ lệch chuẩn của z là: 
3
1
n
sz (2.6.12) 
Do đó, khoảng tin cậy 95% của z là: z ± 1.96sz . Tất nhiên, sau khi đã ước 
tính được khoảng tin cậy 95% của z, chúng ta có thể hoán chuyển ngược lại cho 
khoảng tin cậy 95% của ρ. 
c. Kiểm định hai hệ số tương quan 
Giả sử chúng ta có hai hệ số tương quan r1 và r2, là ước số của hai hệ số ρ1 
và ρ2 trong một quần thể. Hai hệ số r1 và r2 được ước tính từ hai mẫu độc lập n1 và 
n2 đối tượng. Để kiểm định giả định rằng ρ1 = ρ2 và giả định ρ1 ≠ ρ2, chúng ta trước 
hết cần phải hoán chuyển r thành chỉ số z: 
Gọi d = z1 – z2, chúng ta có thể chứng minh rằng phương sai của d là: 
Hay, nói cách khác, độ lệch chuẩn của d là: 
Và kiểm định cho giả thuyết ρ1 = ρ2 có thể tính toán chỉ số t như sau: 
(2.6.13) 
(2.6.14) 
(2.6.15) 
75 
Có thể chứng minh rằng nếu giả thuyết ρ1 = ρ2 là đúng thì t tuân theo luật 
phân phối chuẩn với trung bình 0 và phương sai 1. Điều này có nghĩa là nếu giá trị 
của t thấp hơn - 2 hay cao hơn +2, chúng ta có thể nói hai hệ số tương quan khác 
nhau có ý nghĩa thống kê. 
 2.6.2. Phân tích hồi quy tuyến tính đơn giản 
 a. Ước lượng mô hình hồi quy tuyến tính 
Gọi các cặp giá trị quan sát của x và y là (x1, y1), ( x2, y2),. . . , ( xn, yn). Bản 
chất của một phân tích hồi quy có liên quan với các quan hệ giữa một đáp ứng hoặc 
biến phụ thuộc (y) và biến giải thích hoặc độc lập (x). Quan hệ đơn giản nhất là mô 
hình đường thẳng: 
yi = β0 + β1xi + εi 
 Trong đó: 
 β0: hệ số chặn Y trong tổng thể 
 β1: hệ số góc trong tổng thể 
 εi: sai số ngẫu nhiên của Y đối với quan sát thứ i 
 Phương trình mô hình hồi quy tuyến tính mẫu bằng giá trị dự đoán của Y 
bằng hệ số chặn của Y cộng với hệ số góc nhân với giá trị X: 
 ii XbbY 10ˆ 
 Trong đó: 
 iYˆ : giá trị dự đoán của Y đối với quan sát thứ i 
 Xi: giá trị dự đoán của X đối với quan sát thứ i 
Trong mô hình này, β0 và β1 là tham số chưa biết và phải được ước tính từ dữ 
liệu quan sát, εi là sai số ngẫu nhiên hoặc số hạng chệch (departure term) biểu thị 
cho mức độ không thống nhất có mặt trong các quan sát lặp đi lặp lại trong những 
điều kiện thí nghiệm tương tự. Để tiến hành việc ước lượng tham số, chúng ta cần 
một số giả định: 
Giá trị của x là cố định (không ngẫu nhiên); và về sai số ngẫu nhiên ε, chúng 
ta giả định rằng ε: 
- Phân bố bình thường; 
76 
- Có giá trị mong đợi là 0, tức là E (ε) = 0 
- Có phương sai σ2 là hằng số cho tất cả các cấp của X; và không tương quan 
liên tiếp nhau (độc lập thống kê ). 
Do β0 và β1 là tham số (vì thế, là hằng số) và giá trị của x là cố định, nên ta 
có: 
 E (yi) = E(β0 + β1 xi + εi) = E(β0 ) + E(β1 xi ) + E(εi) 
 E (yi) = β0 + β1 xi (2.6.16) 
và 
var (yi) = var (β0 + β1 xi + εi) = var(β0 ) + var(β1 xi ) + var (εi) = var (εi) 
var (yi) = σ
2. (2.6.17) 
* Ước lượng bình phương nhỏ nhất 
Để ước lượng β0 và β1 từ một loạt các điểm dữ liệu (x1, y1), ( x2, y2),. . . , ( 
xn, yn) chúng ta sử dụng phương pháp bình phương nhỏ nhất. Ý tưởng chính của 
phương pháp này là khi nhận thấy các điểm dữ liệu trên đồ thị phân tán gần như 
thẳng hàng thì dò tìm đường thẳng mà tất cả các điểm dữ liệu “gần” với nó nhất. 
Đường thẳng này gọi là đường thẳng hồi quy. Về mặt toán học, việc tìm đường 
thẳng hồi quy thu về việc tìm tung độ gốc b0 còn gọi là hệ số chắn) và độ dốc b1 của 
nó. Trong thực hành, phương pháp này ước lượng β0 và β1 bằng hai hệ số b0 và b1 
của đường thẳng y = b0 + b1x sao cho hai hệ số này làm cho tổng các bình phương 
độ lệch giữa tung độ yi của các điểm dữ liệu với tung độ yi (=b0 +b1xi)của các điểm 
cùng hoành độ trên đường thẳng có giá trị nhỏ nhất. Nói cách khác, chúng ta phải 
tìm cặp số (b0, b1) sao cho: 
  
2
1
10
n
i
ii xbbyQ có giá trị nhỏ nhất. 
Theo toán học, Q nhỏ nhất khi các đạo hàm riêng của Q theo b0 và theo b1 
đồng thời bằng 0, tức là chúng ta có hệ phương trình bậc nhất hai ẩn (b0 và b1) sau: 
  
i i
ioi xbnby 1 
  
i i
i
i
ioii xbxbyx
2
1 
Giải hệ phương trình trên ta được kết quả sau: 
77 
)var(
),cov(
)
))((
21 r
yx
xx
yyxx
b
i
i
i
ii


 (2.6.18) 
và xbyb 10 (2.6.19) 
Đẳng thức (2.6.19) còn cho thấy đường thẳng hồi quy y = b0 + b1x tìm được 
đi qua điểm ( yx, ). 
 b. Kiểm nghiệm giả thuyết về các tham số hồi quy 
Trong một chừng mức nào đó, sự quan tâm sẽ nằm ở các giá trị của độ dốc b1 
(hệ số góc). Giải thích về tham số này là vô nghĩa nếu không có một kiến thức về 
phân bố của nó. Do đó, sau khi đã tính toán các ước lượng b0 và b1, chúng ta cần 
phải xác định sai số chuẩn của các tham số để có thể đưa ra kết luận về ý nghĩa của 
chúng trong mô hình. Trước khi làm điều này, chúng ta hãy nhìn lướt qua về ý 
nghĩa của số hạng e. 
Chúng ta đã biết trong một chủ đề trước đây rằng nếu y là trung bình mẫu 
của một biến Y, thì phương sai của Y được cho bởi 
n
i
i yy
n 1
2)(
1
1
. 
Bây giờ, trong trường hợp hồi quy, y thật ra bằng với 

 yxbb 10 
Do đó, từ phương sai mẫu của các số dôi ei định ra một ước lượng cho σ
2 ở 
(2.6.10) là hợp lí. Chính vì lí do này mà ước lượng không thiên vị của σ2 được định 
nghĩa là: 

n
i
i
n
i
ii e
n
yy
n
s
1
2
1
22
2
1
)ˆ(
2
1
 (2.6.20) 
78 
Người ta có thể chứng minh rằng các giá trị mong đợi của b1 và b0 
chính là β1 và β0 (các tham số đúng), một cách tương ứng. Hơn nữa, từ 
(2.6.20), người ta có thể chứng minh rằng phương sai của b1 và b0 là: 
2
2
1
2
2
1
)1(
)(
)var(
x
n
i
i
sn
s
xx
s
b

 (2.6.21) 
Và )var()var()var( 1
2
0 bxyb 
 Tức là 

2
2
2
1
2
2
2
0
)1(
1
)(
1
)var(
x
n
i
i
sn
x
n
s
xx
x
n
sb (2.6.22) 
Có thể đi xa hơn một bước nữa bằng cách lập ước lượng cho phương sai hợp 
của b1 và b0 bởi: 
)(),cov( 1
22
01 bsxbb (2.6.23) 
Tức là, b1 phân bố bình thường với trung bình là β1 và phương sai được cho 
ở (2.6.18), và b0 phân bố bình thường với trung bình là β0 và phương sai được cho 
ở (2.6.19). Từ đó, kiểm nghiệm cho ý nghĩa của b1 (khi giả thuyết khống β1 = 0 
đúng) là: 
s
nsb
sn
s
b
t x
x
1
)1(
1
2
2
1 
Được phân bố theo phân bố t với n-2df 
Và 
2
2
0
)1(
1
xsn
x
n
b
t
là một kiểm nghiệm cho b0 (khi giả thuyết khống β0 = 0 đúng) được phân bố theo 
phân bố t với n - 2 df. 
 2.6.3. Phân tích phương sai 
79 
Phân tích phương sai cho biến thiên tổng thể giữa các quan sát Y thành biến 
thiên quy cho phép hồi quy về X và biến thiên dôi hay không giải thích được. Vì 
vậy, chúng ta có thể nói: 
Tổng biến thiên quanh TB = Biến thiên giải thích được bằng mô hình hồi quy 
+ Biến thiên dôi 
Chúng ta có thể viết bằng kí hiệu ANOVA tương đương: 
SSTO = SSR + SSE 
hoặc 2
1
2
1 1
2 )ˆ()ˆ()( i
n
i
i
n
i
n
i
ii yyyyyy  
SSTO liên kết với n - 1 df. Đối với SSR, có hai tham số (b0 và b1) trong mô hình, 
nhưng ràng buộc 0)ˆ( 2
1
 
yy
n
i
i làm mất đi 1 df, do đó cuối cùng nó có1 df. Đối với 
SSE, có n phần dôi (ei), tuy nhiên, bị mất 2 df vì hai ràng buộc trên các ei liên kết 
với việc ước lượng các tham số β1 và β0 bởi hai phương trình như trình bày (ở phần 
ước lượng mô hình hồi quy). 
Chúng ta có thể lắp ráp những dữ liệu này thành một bảng ANOVA như sau: 
Bảng 2.2. Bảng ANOVA 
Nguồn df Tổng các BP(SS) BP trung bình(MS) 
Hồi quy 1 2
1
)ˆ( yySSR
n
i
i 
MSR=

File đính kèm:

  • pdfluan_an_nghien_cuu_va_phan_tich_cac_yeu_to_rui_ro_trong_giai.pdf