Luận án Nghiên cứu và phân tích các yếu tố rủi ro trong giai đoạn thi công của dự án đầu tư xây dựng

Download

Trang 1

Trang 2

Trang 3

Trang 4

Trang 5

Trang 6

Trang 7

Trang 8

Trang 9

Trang 10

Tải về để xem bản đầy đủ

199 trang nguyenduy 07/08/2024 7960 Free

Download

Bạn đang xem 10 trang mẫu của tài liệu "Luận án Nghiên cứu và phân tích các yếu tố rủi ro trong giai đoạn thi công của dự án đầu tư xây dựng", để tải tài liệu gốc về máy hãy click vào nút Download ở trên.

Tóm tắt nội dung tài liệu: Luận án Nghiên cứu và phân tích các yếu tố rủi ro trong giai đoạn thi công của dự án đầu tư xây dựng

o trong quá khứ qua một số năm nhất định, thông
thường yêu cầu thời khoảng quá khứ có số liệu phải lớn hơn nhiều lần thời khoảng
làm dự báo. Phương pháp này thích hợp để dự báo những đối tượng phát triển theo
kiểu tiệm tiến. Phương pháp ngoại suy có ưu điểm là đơn giản, tuy nhiên, nhược
điểm chính là không tính được ảnh hưởng của các yếu tố khách quan đến kết quả dự
báo.
2.5.2. Phương pháp chuyên gia
Bản chất của phương pháp chuyên gia là lấy ý kiến đánh giá của các chuyên
gia để làm kết quả dự báo. Phương pháp này được triển khai theo một quy trình chặt
chẽ bao gồm nhiều khâu: thành lập nhóm chuyên gia, đánh giá năng lực chuyên gia,
lập biểu câu hỏi và xử lý toán học kết quả thu được từ ý kiến chuyên gia. Khó khăn
của phương pháp này là việc tuyển chọn và đánh giá khả năng của các chuyên gia.
Phương pháp này được áp dụng có hiệu quả cho những đối tượng thiếu (hoặc chưa
đủ) số liệu thống kê, phát triển có độ bất ổn lớn hoặc đối tượng của dự báo phức tạp
không có số liệu nền. Kết quả của phương pháp dự báo này chủ yếu phục vụ cho
nhu cầu định hướng, quản lý vì thế cần kết hợp (trong trường hợp có thể) với các
phương pháp định lượng khác.
2.5.3. Phương pháp mô hình hoá
Bản chất của phương pháp này là kế thừa hai phương pháp nói trên. Cách
thức tiếp cận của phương pháp này là dùng hệ thức toán học để mô tả mối liên hệ
giữa đối tượng dự báo với các yếu tố có liên quan. Khó khăn của phương pháp này
là phải viết được chính xác hệ thức toán học nói trên. Phương pháp mô hình hoá áp
dụng cho nghiên cứu kinh tế, tài nguyên-môi trường sẽ phải sử dụng nhiều phương
trình của mô hình kinh tế lượng vì đối tượng dự báo (mối liên hệ giữa hoạt động
kinh tế và chất lượng môi trường, sử dụng tài nguyên) có liên quan đến nhiều yếu tố
kinh tế ví dụ GDP, giá cả, Phương pháp này yêu cầu số liệu của nhiều yếu tố hữu
65
quan trong quá khứ trong khi đó, phương pháp ngoại suy chỉ yêu cầu một loại số
liệu. Tuy nhiên, phương pháp này cũng có ưu điểm, đó là có thể giải thích được kết
quả dự báo và có thể phân tích ảnh hưởng của các yếu tố liên quan đến kết quả dự
báo.
Hiện ở Việt Nam, các mô hình dự báo trong lĩnh vực tài nguyên và môi
trường chưa nhiều. Mỗi lĩnh vực đặc thù đều áp dụng những công cụ/mô hình riêng,
đáp ứng những yêu cầu cụ thể, những mô hình này chủ yếu chỉ áp dụng cho chuyên
môn sâu. Ví dụ, trong lĩnh vực thủy văn để dự báo lũ, mô hình MARINE của Pháp,
mô hình Mike11 (của Đan Mạch), mô hình SSARR, mô hình TANK, được sử
dụng, trong dự báo thời tiết thì sử dụng các mô hình về dự báo thời tiết,...
Trong lĩnh vực quản lý tài nguyên và môi trường, đã có một số mô hình dự
báo được áp dụng trong nghiên cứu chính sách, quy hoạch phát triển như:
- VS, TS Nguyễn Trần Dương, GS.TSKH. Nguyễn Quang Thái, TSKH. Trần
Trọng Khuê, Bùi Trinh đã sử dụng mô hình I-O môi trường để (i) đánh giá định
lượng giữa tăng trưởng kinh tế và biến động môi trường; (ii) cụ thể hóa mối tương
quan giữa tăng trưởng kinh tế với lượng phát thải của vùng kinh tế trọng điểm phía
Nam.
- Các tác giả Bui Trinh, Francisco T. Secretario, Kim Kwangmun, Le Ha
Thanh và Pham Huong Giang đã sử dụng mô hình I-O để phân tích tác động môi
trường-kinh tế để phân tích mức độ phát thải của một số khí nhà kính, nước thải của
từng ngành, từng khu vực khác nhau.
- Trong nghiên cứu dự báo lũ nhiều nơi đã sử dụng mô hình MARINE của
Pháp, mô hình Mike11 (của Viện Thủy lực, Đan Mạch), mô hình SSARR, mô hình
TANK và mô hình HYDROGIS do Viện Khí tượng Thủy văn (Nay là Viện Khoa
học Khí tượng Thủy văn và Môi trường) xây dựng cho hệ thống sông Hồng và sông
Thái Bình để dự báo lũ. Các mô hình này để sử dụng phương pháp định lượng với
nhiều công thức toán học.
66
- Mô hình kinh tế lượng vĩ mô (VN-MACRO) tại Trung tâm Thông tin và
Dự báo Kinh tế Xã hội Quốc gia được xây dựng để đánh giá tác động của chính
sách vĩ mô và môi trường bên ngoài cũng như dự báo ngắn hạn và trung hạn.
- Về dự báo cho lĩnh vực xây dựng, một số tác giả giới thiệu các thành tựu
của môn sinh học hiện đại để sử dụng cho công tác quản lý dự án [30], [18] như:
+ Phương pháp hệ thần kinh nhân tạo ( ANN) sử dụng trong quản lý dự án.
+ Phương pháp di chuyền (GAs) sử dụng nhằm đánh giá kết quả thực hiện
dự án đầu tư và xây dựng.
Có thể sử dụng thuật toán di truyền làm công cụ để thực hiện những phép tối
ưu hoá cho các bài toán trong tổ chức sản xuất xây dựng.
2.6. Phương pháp phân tích hồi quy tuyến tính
Phân tích hồi quy tuyến tính là một phương pháp phân tích quan hệ giữa biến
phụ thuộc Y với một hay nhiều biến độc lập X. Mô hình hóa sử dụng hàm tuyến
tính (bậc 1). Các tham số của mô hình (hay hàm số) được ước lượng từ dữ liệu.
Trong cuốn sách "Kế thừa tự nhiên", Francis Galton đã viết: "mỗi đặc điểm ở
một người được chia sẻ với các người thân của mình, nhưng về trung bình chỉ ở
một mức độ thấp. Ví dụ, cha da trắng cao sẽ có xu hướng có con trai cao lớn, các
con trai về trung bình thấp hơn cha của họ; và con trai với cha thấp, mặc dù có
chiều cao dưới mức trung bình đối với toàn bộ dân số, sẽ có xu hướng cao hơn cha
của họ. " Sau đó, ông kết luận một hiện tượng gọi là "luật hồi quy phổ quát" và là
nguồn gốc của chủ đề chúng ta đang nghiên cứu bây giờ. Ngày nay, đặc tính quay
về trung bình của toàn dân số từ các giá trị cực đoan đã được thừa nhận rộng rãi và
được gọi là "hồi quy về trung bình".[36]
Chúng ta sẽ xem xét các phương pháp đánh giá sự kết hợp giữa các biến liên
tục bằng cách sử dụng hai phương pháp được gọi là phân tích sự tương quan và
phân tích hồi quy tuyến tính, hai phương pháp này hiện nay nằm trong số những kĩ
thuật thống kê phổ biến trong nghiên cứu y học, nghiên cứu về kinh tế.
67
2.6.1. Phân tích sự tương quan
a. Phương sai hợp và hệ số tương quan
Để mô tả độ tương quan giữa hai biến, chúng ta cần phải ước tính hệ số
tương quan (coefficient of correlation). Và, để hiểu “cơ chế” của hệ số tương quan,
chúng ta cần làm quen với khái niệm hiệp biến (covariance). Chúng ta biết rằng với
một biến X hay Y, có ba thông số thống kê mô tả: số cỡ mẫu, số trung (mean), và
phương sai (variance). Nhưng để mô tả mối tương quan giữa hai biến X và Y,
chúng ta cần đến hiệp biến. Có thể hiểu hiệp biến qua hình học lượng giác như sau.
Chúng ta biết rằng cho một tam giác vuông, nếu gọi cạnh huyền là c và hai cạnh còn
lại là a và b, Định lí Pythagoras cho biết bình phương cạnh huyền bằng tổng bình
phương hai cạnh kia:
c2 = a2 + b2 (2.6.1)
Nhưng cho một tam giác thường, thì mối liên hệ giữa c và hai cạnh a và b
phức tạp hơn với mối liên hệ được định lượng bằng hàm cosine của góc C như sau:
c2 = a2 + b2 – 2ab.cosC (2.6.2)
Tương tự như vậy, cho hai biến X và Y, và nếu hai biến này hoàn toàn độc
lập với nhau, chúng ta có thể phát biểu rằng phương sai của biến X + Y bằng
phương sai của X cộng với phương sai của Y:
var(X + Y) = var(X) + var(Y) (2.6.3)
Trong đó, “var” là viết tắt của phương sai (tức variance). Chú ý rằng X+Y là
một biến mới. Chúng ta cũng chú ý rằng công thức này tương đương với Định lí
Pythagoras cho tam giác vuông.
Nếu hai biến X và Y có tương quan nhau, thì công thức trên được thay thế
bằng một công thức khác với hiệp biến:
var(X + Y) = var(X) + var(Y) + 2×Cov(X,Y) (2.6.4)
trong đó, “Cov” là viết tắt của hiệp biến (tức covariance). Chú ý rằng công
thức này tương đương với công thức của tam giác thường, và cũng chú ý rằng công
thức trên giống như nhị thức
(x+y)2 = x2 + y2 +2xy (2.6.5)
68
Trên đây là khái niệm. Bây giờ để đi vào chi tiết toán, cần một số kí hiệu để viết tắt
các chỉ số trên. Gọi xi và yi là hai biến quan sát được của X và Y cho cá nhân i. Giả
sử chúng ta có n đối tượng thì i = 1, 2, 3, ., n. Gọi x và y là hai số trung bình của
biến quan sát được x và y; sx
2 và sy
2 lần lược là phương sai của hai biến, được định
nghĩa như sau:
Do đó, nếu X và Y độc lập, chúng ta có thể viết:
s2x+y = s
2
x + s
2
y (2.6.7)
Nhưng nếu X và Y có liên hệ với nhau, công thức trên không đáp ứng được
vấn đề mô tả. Chúng ta cần tìm một chỉ số khác mô tả mối liên hệ giữa hai biến,
bằng cách nhân độ lệch của biến x từ số trung bình, (xi − x ) , cho độ lệch của biến
y, (yi − y ) , thay vì bình phương độ lệch từng biến riêng lẻ như công thức (2.6.7).
Nói cách khác, tích số hai độ lệch chính là hiệp biến. Đối với mỗi cá nhân, hiệp biến
là:
Nhưng ở đây chúng ta có n đối tượng, cho nên cần phải cộng tất cả lại và
chia cho số đối tượng:
(2.6.8)
Công thức (2.6.8)chính là định nghĩa của hiệp biến. Từ hai công thức trên, có
thể rút ra vài nhận xét sơ khởi:
69
- Phương sai lúc nào cũng là số dương, bởi vì chúng được tính toán từ bình
phương, nhưng hiệp biến có thể âm mà cũng có thể dương vì được ước tính từ tích
của hai độ lệch.
- Một hiệp biến là số dương có nghĩa là độ lệch từ số trung bình của x tuân
theo chiều hướng thuận với y.
- Một hiệp biến là số âm có nghĩa là độ lệch từ số trung bình của x tuân theo
chiều hướng nghịch với y.
- Nếu hiệp biến là 0, thì hai biến x và y độc lập nhau, tức không có tương
quan gì với nhau.
Một cách để “chuẩn hóa” hiệp biến và phương sai là lấy tỉ số của hai chỉ số
này, và đó chính là định nghĩa của hệ số tương quan. Hệ số tương quan thường
được kí hiệu bằng r:
(2.6.9)
(Chú ý rằng căn số bậc hai của phương sai là độ lệch chuẩn, tức là:
2
xx ss và
2
yy ss , cho nên công thức trên được mô tả bằng độ lệch chuẩn, thay
vì phương sai). Với vài thao tác đại số, có thể viết lại công thức (2.6.9) như sau:
(2.6.10)
Công thức còn được biết đến như là hệ số Pearson (Pearson’s correlation
coefficient) để ghi nhận cống hiến của nhà thống kê học nổi tiếng Karl Pearson,
người đầu tiên phát triển lí thuyết về tương quan vào đầu thế kỉ 20.
Nếu giá trị của r là dương, hai biến x và y cùng biến thiên theo một hướng;
nếu giá trị của r là âm, x và y liên hệ đảo ngược: tức khi khi x tăng thì y giảm, và
ngược lại. Nếu r = 1 hay r = -1 (Biểu đồ 1a và 1b), mối liên hệ của y và x được
hoàn toàn xác định; có nghĩa là cho bất cứ giá trị nào của x, chúng ta có thể xác định
70
giá trị của y. Nếu r = 0 (Biểu đồ 1c), hai biến x và y hoàn toàn độc lập, tức không có
liên hệ với nhau.
Hình 2.4. Biểu đồ mối quan hệ giữa x và y khi r =1
Hình 2.5.Biểu đồ mối quan hệ giữa x và y khi r = -1
71
Hình 2.6.Biểu đồ mối quan hệ giữa x và y khi r = 0 (độc lập)
Tất nhiên, trong thực tế khoa học thực nghiệm, ít khi nào chúng ta có những
mối liên hệ xác định như vừa trình bày. Vì sai số trong đo lường, trong khảo sát,
mối liên hệ giữa x và y thường dao động cao hơn -1 và thấp hơn 1, như hình 2.4,
2.5, 2.6
Hình 2.7.Biểu đồ mối quan hệ giữa x và y khi r = 0,8
72
Hình 2.8.Biểu đồ mối quan hệ giữa x và y khi r = -0,8
Hình 2.9.Biểu đồ mối quan hệ giữa x và y khi r = 0,001
Vấn đề đặt ra là diễn dịch ý nghĩa của hệ số tương quan như thế nào? Có thể
xem hệ số tương quan như là một “hệ số ảnh hưởng” (effect size). Nếu hệ số ảnh
hưởng càng cao, thì mối liên hệ có ý nghĩa thực tế. Tuy nhiên, vì ý nghĩa còn tùy
73
thuộc vào bộ môn khoa học. Chẳng hạn như đối với các bộ môn khoa học đòi hỏi
độ chính xác cao, hệ số tương quan phải trên 0.8 mới có thể xem là “có ý nghĩa”;
nhưng đối với các bộ môn khoa học một hệ số tương quan 0.6 cũng có thể là có ý
nghĩa. Bảng 2.1 sau đây là những qui ước chung về cách diễn dịch hệ số tương
quan.
Bảng 2.1. Ý nghĩa của hệ số tương quan
b. Khoảng tin cậy 95% của hệ số tương quan
Cũng như các thông số thống kê khác như số trung bình và độ lệch chuẩn, hệ
số tương quan cũng chịu ảnh hưởng của dao động giữa các mẫu. Do đó, chúng ta
cần phải ước tính khoảng tin cậy 95% của hệ số tương quan. Xin nhắc lại rằng,
chúng ta không biết hệ số tương quan thật (tức là hệ số trong quần thể, và hãy gọi
hệ số này là ρ) là bao nhiêu, nên phải sử dụng hệ số r để ước tính ρ.
Muốn ước tính khoảng tin cậy 95% của ρ, chúng ta cần phải ước tính độ lệch
chuẩn của r. Lý thuyết thống kê cho biết độ lệch chuẩn của r là:
2
1 2
n
r
sr
Khó khăn ở đây, như công thức này cho thấy, là độ lệch chuẩn của r tùy
thuộc vào r, tức là mất tính độc lập. Do đó, cần phải tìm một phương pháp khác sao
cho khách quan hơn. Nhà thống kê học (và cũng là cha đẻ của khoa học thống kê
hiện đại và cha đẻ của lí thuyết di truyền hiện đại) Ronald A. Fisher chứng minh
rằng thay vì tính độ lệch chuẩn của r, có thể tính độ lệch chuẩn của một hàm số của
r và sẽ đạt được mục tiêu khách quan.
Theo phương pháp của Fisher, trước hết chúng ta cần phải hoán chuyển r
sang một chỉ số mới z, qua công thức sau đây:
74
(2.6.11)
Và, có thể chứng minh rằng độ lệch chuẩn của z là:
3
1
n
sz (2.6.12)
Do đó, khoảng tin cậy 95% của z là: z ± 1.96sz . Tất nhiên, sau khi đã ước
tính được khoảng tin cậy 95% của z, chúng ta có thể hoán chuyển ngược lại cho
khoảng tin cậy 95% của ρ.
c. Kiểm định hai hệ số tương quan
Giả sử chúng ta có hai hệ số tương quan r1 và r2, là ước số của hai hệ số ρ1
và ρ2 trong một quần thể. Hai hệ số r1 và r2 được ước tính từ hai mẫu độc lập n1 và
n2 đối tượng. Để kiểm định giả định rằng ρ1 = ρ2 và giả định ρ1 ≠ ρ2, chúng ta trước
hết cần phải hoán chuyển r thành chỉ số z:
Gọi d = z1 – z2, chúng ta có thể chứng minh rằng phương sai của d là:
Hay, nói cách khác, độ lệch chuẩn của d là:
Và kiểm định cho giả thuyết ρ1 = ρ2 có thể tính toán chỉ số t như sau:
(2.6.13)
(2.6.14)
(2.6.15)
75
Có thể chứng minh rằng nếu giả thuyết ρ1 = ρ2 là đúng thì t tuân theo luật
phân phối chuẩn với trung bình 0 và phương sai 1. Điều này có nghĩa là nếu giá trị
của t thấp hơn - 2 hay cao hơn +2, chúng ta có thể nói hai hệ số tương quan khác
nhau có ý nghĩa thống kê.
2.6.2. Phân tích hồi quy tuyến tính đơn giản
a. Ước lượng mô hình hồi quy tuyến tính
Gọi các cặp giá trị quan sát của x và y là (x1, y1), ( x2, y2),. . . , ( xn, yn). Bản
chất của một phân tích hồi quy có liên quan với các quan hệ giữa một đáp ứng hoặc
biến phụ thuộc (y) và biến giải thích hoặc độc lập (x). Quan hệ đơn giản nhất là mô
hình đường thẳng:
yi = β0 + β1xi + εi
Trong đó:
β0: hệ số chặn Y trong tổng thể
β1: hệ số góc trong tổng thể
εi: sai số ngẫu nhiên của Y đối với quan sát thứ i
Phương trình mô hình hồi quy tuyến tính mẫu bằng giá trị dự đoán của Y
bằng hệ số chặn của Y cộng với hệ số góc nhân với giá trị X:
ii XbbY 10ˆ
Trong đó:
iYˆ : giá trị dự đoán của Y đối với quan sát thứ i
Xi: giá trị dự đoán của X đối với quan sát thứ i
Trong mô hình này, β0 và β1 là tham số chưa biết và phải được ước tính từ dữ
liệu quan sát, εi là sai số ngẫu nhiên hoặc số hạng chệch (departure term) biểu thị
cho mức độ không thống nhất có mặt trong các quan sát lặp đi lặp lại trong những
điều kiện thí nghiệm tương tự. Để tiến hành việc ước lượng tham số, chúng ta cần
một số giả định:
Giá trị của x là cố định (không ngẫu nhiên); và về sai số ngẫu nhiên ε, chúng
ta giả định rằng ε:
- Phân bố bình thường;
76
- Có giá trị mong đợi là 0, tức là E (ε) = 0
- Có phương sai σ2 là hằng số cho tất cả các cấp của X; và không tương quan
liên tiếp nhau (độc lập thống kê ).
Do β0 và β1 là tham số (vì thế, là hằng số) và giá trị của x là cố định, nên ta
có:
E (yi) = E(β0 + β1 xi + εi) = E(β0 ) + E(β1 xi ) + E(εi)
E (yi) = β0 + β1 xi (2.6.16)
và
var (yi) = var (β0 + β1 xi + εi) = var(β0 ) + var(β1 xi ) + var (εi) = var (εi)
var (yi) = σ
2. (2.6.17)
* Ước lượng bình phương nhỏ nhất
Để ước lượng β0 và β1 từ một loạt các điểm dữ liệu (x1, y1), ( x2, y2),. . . , (
xn, yn) chúng ta sử dụng phương pháp bình phương nhỏ nhất. Ý tưởng chính của
phương pháp này là khi nhận thấy các điểm dữ liệu trên đồ thị phân tán gần như
thẳng hàng thì dò tìm đường thẳng mà tất cả các điểm dữ liệu “gần” với nó nhất.
Đường thẳng này gọi là đường thẳng hồi quy. Về mặt toán học, việc tìm đường
thẳng hồi quy thu về việc tìm tung độ gốc b0 còn gọi là hệ số chắn) và độ dốc b1 của
nó. Trong thực hành, phương pháp này ước lượng β0 và β1 bằng hai hệ số b0 và b1
của đường thẳng y = b0 + b1x sao cho hai hệ số này làm cho tổng các bình phương
độ lệch giữa tung độ yi của các điểm dữ liệu với tung độ yi (=b0 +b1xi)của các điểm
cùng hoành độ trên đường thẳng có giá trị nhỏ nhất. Nói cách khác, chúng ta phải
tìm cặp số (b0, b1) sao cho:
 
2
1
10
n
i
ii xbbyQ có giá trị nhỏ nhất.
Theo toán học, Q nhỏ nhất khi các đạo hàm riêng của Q theo b0 và theo b1
đồng thời bằng 0, tức là chúng ta có hệ phương trình bậc nhất hai ẩn (b0 và b1) sau:
 
i i
ioi xbnby 1
 
i i
i
i
ioii xbxbyx
2
1
Giải hệ phương trình trên ta được kết quả sau:
77
)var(
),cov(
)
))((
21 r
yx
xx
yyxx
b
i
i
i
ii


(2.6.18)
và xbyb 10 (2.6.19)
Đẳng thức (2.6.19) còn cho thấy đường thẳng hồi quy y = b0 + b1x tìm được
đi qua điểm ( yx, ).
b. Kiểm nghiệm giả thuyết về các tham số hồi quy
Trong một chừng mức nào đó, sự quan tâm sẽ nằm ở các giá trị của độ dốc b1
(hệ số góc). Giải thích về tham số này là vô nghĩa nếu không có một kiến thức về
phân bố của nó. Do đó, sau khi đã tính toán các ước lượng b0 và b1, chúng ta cần
phải xác định sai số chuẩn của các tham số để có thể đưa ra kết luận về ý nghĩa của
chúng trong mô hình. Trước khi làm điều này, chúng ta hãy nhìn lướt qua về ý
nghĩa của số hạng e.
Chúng ta đã biết trong một chủ đề trước đây rằng nếu y là trung bình mẫu
của một biến Y, thì phương sai của Y được cho bởi 
n
i
i yy
n 1
2)(
1
1
.
Bây giờ, trong trường hợp hồi quy, y thật ra bằng với

yxbb 10
Do đó, từ phương sai mẫu của các số dôi ei định ra một ước lượng cho σ
2 ở
(2.6.10) là hợp lí. Chính vì lí do này mà ước lượng không thiên vị của σ2 được định
nghĩa là:

n
i
i
n
i
ii e
n
yy
n
s
1
2
1
22
2
1
)ˆ(
2
1
(2.6.20)
78
Người ta có thể chứng minh rằng các giá trị mong đợi của b1 và b0
chính là β1 và β0 (các tham số đúng), một cách tương ứng. Hơn nữa, từ
(2.6.20), người ta có thể chứng minh rằng phương sai của b1 và b0 là:
2
2
1
2
2
1
)1(
)(
)var(
x
n
i
i
sn
s
xx
s
b

(2.6.21)
Và )var()var()var( 1
2
0 bxyb
Tức là

2
2
2
1
2
2
2
0
)1(
1
)(
1
)var(
x
n
i
i
sn
x
n
s
xx
x
n
sb (2.6.22)
Có thể đi xa hơn một bước nữa bằng cách lập ước lượng cho phương sai hợp
của b1 và b0 bởi:
)(),cov( 1
22
01 bsxbb (2.6.23)
Tức là, b1 phân bố bình thường với trung bình là β1 và phương sai được cho
ở (2.6.18), và b0 phân bố bình thường với trung bình là β0 và phương sai được cho
ở (2.6.19). Từ đó, kiểm nghiệm cho ý nghĩa của b1 (khi giả thuyết khống β1 = 0
đúng) là:
s
nsb
sn
s
b
t x
x
1
)1(
1
2
2
1
Được phân bố theo phân bố t với n-2df
Và
2
2
0
)1(
1
xsn
x
n
b
t
là một kiểm nghiệm cho b0 (khi giả thuyết khống β0 = 0 đúng) được phân bố theo
phân bố t với n - 2 df.
2.6.3. Phân tích phương sai
79
Phân tích phương sai cho biến thiên tổng thể giữa các quan sát Y thành biến
thiên quy cho phép hồi quy về X và biến thiên dôi hay không giải thích được. Vì
vậy, chúng ta có thể nói:
Tổng biến thiên quanh TB = Biến thiên giải thích được bằng mô hình hồi quy
+ Biến thiên dôi
Chúng ta có thể viết bằng kí hiệu ANOVA tương đương:
SSTO = SSR + SSE
hoặc 2
1
2
1 1
2 )ˆ()ˆ()( i
n
i
i
n
i
n
i
ii yyyyyy  
SSTO liên kết với n - 1 df. Đối với SSR, có hai tham số (b0 và b1) trong mô hình,
nhưng ràng buộc 0)ˆ( 2
1

yy
n
i
i làm mất đi 1 df, do đó cuối cùng nó có1 df. Đối với
SSE, có n phần dôi (ei), tuy nhiên, bị mất 2 df vì hai ràng buộc trên các ei liên kết
với việc ước lượng các tham số β1 và β0 bởi hai phương trình như trình bày (ở phần
ước lượng mô hình hồi quy).
Chúng ta có thể lắp ráp những dữ liệu này thành một bảng ANOVA như sau:
Bảng 2.2. Bảng ANOVA
Nguồn df Tổng các BP(SS) BP trung bình(MS)
Hồi quy 1 2
1
)ˆ( yySSR
n
i
i 
MSR=

File đính kèm:

luan_an_nghien_cuu_va_phan_tich_cac_yeu_to_rui_ro_trong_giai.pdf