View Categories

Phụ lục 7. Thuật toán Moment Kỳ vọng (EMA)

Phụ lục này mô tả các đặc điểm của EMA, bao gồm một số chi tiết tính toán, một dạng tổng quát của thuật toán moment kỳ vọng, độ bất định của các moment EMA và khoảng tin cậy với EMA.

1. Chi tiết tính toán EMA

Các moment EMA cho tình huống tổng quát với một ngưỡng nhận biết lũ lịch sử \(X_h\) và một ngưỡng PILF \(X_l\) như sau:

Trung bình:

$$\hat{\mu}_{i+1} = \frac{\sum X_s^> + \sum X_l^> + \sum X_h^> + n_l^< E[X_l^<] + n_h^< E[X_h^<]}{n_s + n_h} \tag{7–1}$$

Phương sai:

$$\hat{\sigma}^2_{i+1} = \frac{c_2}{n} \left[ \sum (X_s^> – \hat{\mu}_i)^2 + \sum (X_l^> – \hat{\mu}_i)^2 + \sum (X_h^> – \hat{\mu}_i)^2 + n_l^< E[(X_l^< – \hat{\mu}_i)^2] + n_h^< E[(X_h^< – \hat{\mu}_i)^2] \right] \tag{7–2}$$

Hệ số độ lệch (skewness):

$$\hat{\gamma}_{i+1} = \frac{c_3}{n \hat{\sigma}^3_{i+1}} \left[ \sum (X_s^> – \hat{\mu}_i)^3 + \sum (X_l^> – \hat{\mu}_i)^3 + \sum (X_h^> – \hat{\mu}_i)^3 + n_l^< E[(X_l^< – \hat{\mu}_i)^3] + n_h^< E[(X_h^< – \hat{\mu}_i)^3] \right] \tag{7–3}$$

trong đó \(c_2\) và \(c_3\) là các hệ số hiệu chỉnh sai số, được định nghĩa:

$$c_2 = \frac{n_s + n_h^>}{n_s + n_h^> – 1} \tag{7–4}$$

$$c_3 = \frac{(n_s + n_h^>)^2}{(n_s + n_h^> – 1)(n_s + n_h^> – 2)} \tag{7–5}$$

và nhớ rằng \(n_s + n_h = n\).

Biểu thức \(E[X_l^<]\) là giá trị kỳ vọng của một quan sát được biết có giá trị nhỏ hơn ngưỡng lịch sử \(X_h\), và là kỳ vọng có điều kiện với \(X < X_h\), được tính theo:

$$E[X \mid X \le X_h; \hat{\tau}, \hat{\alpha}, \hat{\beta}] = \hat{\tau} + \hat{\beta} \frac{\Gamma\left(\frac{X_h – \hat{\tau}}{\hat{\beta}}, \hat{\alpha} + 1\right)}{\Gamma\left(\frac{X_h – \hat{\tau}}{\hat{\beta}}, \hat{\alpha}\right)} \tag{7–6}$$

Trong đó \(\Gamma(y,\alpha)\) là hàm gamma không đầy đủ:

$$\Gamma(y,\alpha) = \int_0^{y} t^{\alpha – 1} e^{-t} \, dt. \tag{7–7}$$

Kỳ vọng cho các moment bậc cao hơn được cho bởi:

$$E[(X – \hat{\mu})^p \mid X \le X_h; \hat{\tau}, \hat{\alpha}, \hat{\beta}]$$

$$ = \sum_{j=0}^{p} \binom{p}{j} \hat{\beta}^j (\hat{\tau} – \hat{\mu})^{p-j} \left[ \frac{\Gamma\left( \frac{X_h – \hat{\tau}}{\hat{\beta}}, \hat{\alpha} + j \right)}{\Gamma\left( \frac{X_h – \hat{\tau}}{\hat{\beta}}, \hat{\alpha} \right)} \right] \tag{7–8}$$

trong đó p là chỉ số moment trung tâm (p = 2,3). Giá trị kỳ vọng có điều kiện cho PILFs với \(X < X_l\) và ngưỡng \(X_l\) tương tự như các phương trình (7–6) và (7–8).

Các moment EMA trong (7–1) đến (7–3), và các giá trị kỳ vọng trong (7–6) và (7–8), áp dụng cho các quan sát có giá trị biết chính xác, trong đó \(X_{\text{lower}} = X_{\text{upper}}\).

Đối với các trường hợp biên độ lũ được mô tả bởi khoảng hoặc quan sát 0/1, các phương trình này được điều chỉnh để tính đến logarit của các khoảng lưu lượng (\(X_{Y,\text{lower}}, X_{Y,\text{upper}}\)) và được trình bày trong (7–9). Việc xử lý thông tin từ các hồ sơ bị ngắt quãng, các trạm crest-stage, và nhiều ngưỡng (ví dụ Hình 12) được thực hiện bằng cách bổ sung thêm các giá trị kỳ vọng vào moment cho từng năm Y hoặc từng giai đoạn mà ngưỡng nhận biết thay đổi.

EMA sử dụng các khoảng lưu lượng đỉnh (\(Q_{\text{lower}}, Q_{\text{upper}}\)) để ước tính các moment của phân phối LP-III. Khi dùng logarit cơ số 10 của lưu lượng, với \(X_{\text{lower}} = \log_{10}(Q_{\text{lower}})\) và \(X_{\text{upper}} = \log_{10}(Q_{\text{upper}})\), dữ liệu bị chặn khoảng hoặc dạng 0/1 được tính bằng:

$$E[(X – \hat{\mu})^p \mid X_{\text{lower}} \le X \le X_{\text{upper}}; \hat{\tau}, \hat{\alpha}, \hat{\beta}]$$

$$ = \sum_{j=0}^{p} \binom{p}{j} \hat{\beta}^j (\hat{\tau} – \hat{\mu})^{p-j} \times \left[ \frac{\Gamma\left( \frac{X_{\text{upper}} – \hat{\tau}}{\hat{\beta}}, \hat{\alpha} + j \right) – \Gamma\left( \frac{X_{\text{lower}} – \hat{\tau}}{\hat{\beta}}, \hat{\alpha} + j \right)} {\Gamma\left( \frac{X_{\text{upper}} – \hat{\tau}}{\hat{\beta}}, \hat{\alpha} \right) – \Gamma\left( \frac{X_{\text{lower}} – \hat{\tau}}{\hat{\beta}}, \hat{\alpha} \right)} \right] \tag{7–9}$$

Khi thông tin về hệ số độ lệch vùng G có sẵn, nó được đưa trực tiếp vào EMA để đảm bảo giá trị trung bình và độ lệch chuẩn điều chỉnh khớp với dữ liệu. Phương trình (7–3) cho hệ số độ lệch được sửa đổi để bao gồm G như sau:

$$\hat{\gamma}_{i+1} = \frac{1}{(n + n_G)\hat{\sigma}^3_{i+1}} \left \{ c_3 \left[ \sum (X_s^> – \hat{\mu}_i)^3 + \sum (X_l^> – \hat{\mu}_i)^3 + \sum (X_h^> – \hat{\mu}_i)^3 + n_l^< E[(X_l^< – \hat{\mu}_i)^3] + n_h^< E[(X_h^< – \hat{\mu}_i)^3] \right] + n_G G \hat{\sigma}^3_{i+1} \right\} \tag{7–10}$$

trong đó \(n_G\) là số năm bổ sung được gán cho hệ số độ lệch vùng G (Griffis và cộng sự, 2004). Một ràng buộc về độ lệch được áp dụng trong mỗi vòng lặp EMA sao cho \(\hat{\gamma}_{i+1} > -1.4\), vì khả năng độ lệch thật sự của tổng thể nhỏ hơn –1.4 là rất thấp.

Một danh sách tổng quát các bước tính toán tần suất dòng lũ bằng EMA (được triển khai trong phần mềm, xem mục Software and Examples) như sau:

1. Kiểm tra ngoại lai thấp bằng MGBT. Nếu phát hiện ngoại lai thấp, mã hóa lại lưu lượng như dữ liệu bị chặn với khoảng (\(Q_{Y,\text{lower}} = 0,\ Q_{Y,\text{upper}} = Q_{\text{lower}}\)). Điều chỉnh các ngưỡng nhận biết tương ứng: (\(T_{Y,\text{lower}} = Q_{\text{lower}},\ T_{Y,\text{upper}} = \infty\)).

2. Sắp xếp tất cả các khoảng lưu lượngngưỡng nhận biết để ước lượng tham số và khoảng tin cậy.

3. Bắt đầu lắp ráp lặp phân phối LP-III bằng EMA với toàn bộ dữ liệu, bao gồm thông tin hệ số độ lệch vùng. Ở mỗi vòng lặp, đảm bảo hệ số độ lệch có trọng số \(\hat{G} \ge -1.41\) và giá trị quan sát lớn nhất nằm trong miền hỗ trợ của phân phối đã lắp được (đối với trường hợp độ lệch < 0).

(a) Lắp LP-III bằng EMA với dữ liệu tại trạm (at-site data) để ước lượng hệ số độ lệch tại trạm.
(b) Ước lượng sai số bình phương trung bình (MSE) của hệ số độ lệch tại trạm bằng EMA.
(c) Ước lượng hệ số độ lệch có trọng số.
(d) Lắp LP-III bằng EMA với hệ số độ lệch có trọng số.
(e) Kiểm tra hội tụ của các moment EMA. Nếu chưa hội tụ, quay lại bước 3a.

4. Ước lượng phương sai phân vị và tính khoảng tin cậy dựa trên mô hình LP-III đã lắp, bao gồm cả độ bất định của hệ số độ lệch tại trạm và vùng.

2. Thuật toán Moment Kỳ vọng Tổng quát (The Generalized Expected Moments Algorithm)

Phần này trình bày cách tham số hóa của phân phối P-III và Thuật toán Moment Kỳ vọng Tổng quát. Ký hiệu và thuật ngữ được sử dụng để giải thích sự bất định của các moment EMA và khoảng tin cậy.

Các ký hiệu in đậm như Mθ dùng để chỉ vector hoặc ma trận. Dấu mũ (^) biểu thị giá trị ước lượng mẫu, dấu ngã (~) biểu thị moment không tâm (đối với số vô hướng) hoặc ước lượng (đối với vector).

Phân phối P-III thường được đặc trưng bởi ba tham số: vị trí {τ}, tỷ lệ {β}, và dạng {α}, trong đó vector θ={τ,α,β}.

Phân phối P-III cũng có thể được đặc trưng bằng các moment không tâm \(\boldsymbol{\mu} = \{\tilde{\mu}_1, \tilde{\mu}_2, \tilde{\mu}_3\}\)

(khoảng gần 0) để thuận tiện cho đại số, và các moment trung tâm M={M,S,G}={μ,σ,γ} cho đơn giản trong giải thích.

Moment trung tâm được định nghĩa như sau:

$$\mathbf{M} = \begin{bmatrix} M \\ S \\ G \end{bmatrix} \equiv \begin{bmatrix} E[X] \\ \sqrt{E[(X – M)^2]} \\ E[(X – M)^3 / S^3] \end{bmatrix} \equiv \begin{bmatrix} \tilde{\mu}_1 \\ \sqrt{\tilde{\mu}_2 – \tilde{\mu}_1^2} \\ \frac{\tilde{\mu}_3 – 3\tilde{\mu}_2 \tilde{\mu}_1 + 2\tilde{\mu}_1^3}{\sqrt{\tilde{\mu}_2 – \tilde{\mu}_1^2}^3} \end{bmatrix} \equiv \begin{bmatrix} \tau + \alpha \beta \\ \sqrt{\alpha \beta^2} \\ \text{sign}(\beta) \cdot \frac{2}{\sqrt{\alpha}} \end{bmatrix} \tag{7–11}$$

Các moment không trung tâm

$$\tilde{\mu} \equiv \begin{bmatrix} \tilde{\mu}_1 \\ \tilde{\mu}_2 \\ \tilde{\mu}_3 \end{bmatrix} \equiv \begin{bmatrix} E_\theta[X] \\ E_\theta[X^2] \\ E_\theta[X^3] \end{bmatrix} \equiv \begin{bmatrix} M \\ S^2 + M^2 \\ S^3 G + 3S^2 M + M^3 \end{bmatrix}$$

$$\equiv \begin{bmatrix} \alpha\beta + \tau \\ \alpha(1+\alpha)\beta^2 + 2\alpha\beta\tau + \tau^2 \\ \alpha(1+\alpha)(2+\alpha)\beta^3 + 3\alpha(1+\alpha)\beta^2\tau + 3\alpha\beta\tau^2 + \tau^3 \end{bmatrix}. \tag{7-12}$$

Các tham số phân phối P-III

$$\boldsymbol{\theta} = \begin{bmatrix} \alpha \\ \beta \\ \tau \end{bmatrix} = \begin{bmatrix} \frac{4}{G^2} \\ \frac{SG}{2} \\ M – \frac{2S}{G} \end{bmatrix} \begin{bmatrix} \frac{4(\tilde{\mu}_2 – \tilde{\mu}_1^2)^3}{(\tilde{\mu}_3 – 3\tilde{\mu}_2 \tilde{\mu}_1 + 2\tilde{\mu}_1^3)^2} \\ \frac{\tilde{\mu}_3 – 3\tilde{\mu}_2 \tilde{\mu}_1 + 2\tilde{\mu}_1^3}{2(\tilde{\mu}_2 – \tilde{\mu}_1^2)} \\ \frac{\tilde{\mu}_3 \tilde{\mu}_1 – 2\tilde{\mu}_2^2 + \tilde{\mu}_2 \tilde{\mu}_1^2}{\tilde{\mu}_3 – 3\tilde{\mu}_2 \tilde{\mu}_1 + 2\tilde{\mu}_1^3} \end{bmatrix}. \tag{7-13}$$

Ở đây, E[ ] là toán tử kỳ vọng. Các công thức trong (7-11), (7-12) và (7-13) giúp chuyển đổi giữa các dạng tham số hóa khác nhau.

Khi dùng các ước lượng mẫu, việc chuyển đổi từ moment không trung tâm \(\hat{\mu}\) sang moment trung tâm \(\mathbf{M}\) cần bao gồm hệ số hiệu chỉnh sai số chệch với

$$\hat{\mathbf{M}} = \left[ 1 \quad \frac{N}{N-1} \quad \frac{\sqrt{N(N-1)}}{(N-2)} \right] * \; (\hat{\mu}) \tag{7-14}$$

trong đó dấu “*” chỉ phép nhân ma trận.

Một EMA tổng quát sử dụng các moment trung tâm M được thực hiện như sau, với N là tổng số năm số liệu.
Để tiện lợi trong các phương trình, các ký hiệu được viết tắt như sau:
\(X_{i,\text{lower}} = X_{i,l}\) và \(X_{i,\text{upper}} = X_{i,u}\).

1. Khởi tạo
(a) Đặt \(\hat{\mathbf{M}}_0 = \{0, 1, 0\}\)
(b) Xác định \(\varepsilon > 0\) là mức hội tụ mong muốn.

Một giá trị điển hình cho \(\varepsilon\) là \(10^{-10}\)

2. Lặp: với \(j = 1, 2, \dots\)

(a) Cập nhật các moment kỳ vọng:

$$\hat{\mathbf{M}}_j = \begin{Bmatrix} M_j \\ S_j^2 \\ G_j \end{Bmatrix} = \begin{Bmatrix} \frac{1}{N} \sum_{i=1}^N E_{\hat{\mathbf{M}}_{j-1}}\left[ X_i \; \big| \; X_{i,l} \le X_i < X_{i,u} \right] \\ \frac{1}{N-1} \sum_{i=1}^N E_{\hat{\mathbf{M}}_{j-1}}\left[ (X_i – M_j)^2 \; \big| \; X_{i,l} \le X_i < X_{i,u} \right] \\ \frac{N}{S^3 (N-1)(N-2)} \sum_{i=1}^N E_{\hat{\mathbf{M}}_{j-1}}\left[ (X_i – M_j)^3 \; \big| \; X_{i,l} \le X_i < X_{i,u} \right] \end{Bmatrix} \tag{7-15}$$

Trong đó:

$$E_{\hat{\mathbf{M}}_{j-1}} \left[ (X_i – M_j)^k \; \big| \; X_{i,l} \le X_i < X_{i,u} \right] = \sum_{l=0}^k \binom{k}{l} E_{\hat{\mathbf{M}}_{j-1}}\left[ X_i^l \; \big| \; X_{i,l} \le X_i < X_{i,u} \right] (-M_j)^{k-l} \tag{7-16}$$

Nếu cận dưới và cận trên của \(X_i\) bằng nhau (ví dụ \(X_{i,l} = X_{i,u}\), nghĩa là ta biết chính xác giá trị \(X_i\)), thì:

$$E_{\hat{\mathbf{M}}_{j-1}}[X_i^k \; | \; X_{i,l} \le X_i < X_{i,u}] = X_{i,l}^k = X_{i,u}^k. \tag{7-17}$$

Nếu \(X_{i,l} < X_{i,u}\), thì ta phải tính giá trị kỳ vọng:

$$E_\theta[X^k \; | \; X_{i,l} \le X < X_{i,u}] = \begin{cases} \displaystyle \sum_{j=0}^k \binom{k}{j} \beta^j \tau^{k-j} \frac{\Gamma\left(\alpha + j, \frac{X_{i,u} – \tau}{\beta}, \frac{X_{i,l} – \tau}{\beta}\right)}{\Gamma\left(\alpha, \frac{X_{i,u} – \tau}{\beta}, \frac{X_{i,l} – \tau}{\beta}\right)}, & \beta < 0, \\[1.2em] \displaystyle \sum_{j=0}^k \binom{k}{j} \beta^j \tau^{k-j} \frac{\Gamma\left(\alpha + j, \frac{X_{i,l} – \tau}{\beta}, \frac{X_{i,u} – \tau}{\beta}\right)}{\Gamma\left(\alpha, \frac{X_{i,l} – \tau}{\beta}, \frac{X_{i,u} – \tau}{\beta}\right)}, & \beta > 0. \end{cases} \tag{7-18}$$

Trong đó \(\theta\) là các tham số P-III tương ứng với \(\hat{\mathbf{M}}_{j-1}\), và

$$\Gamma(\alpha, X_{i,l}, X_{i,u}) = \int_{\max(0, X_{i,l})}^{\max(0, X_{i,u})} t^{\alpha – 1} \exp(-t) \, dt. \tag{7-19}$$

(b) Nếu có thể, áp dụng trọng số với skew khu vực. Điều này có thể thực hiện về mặt khái niệm như sau:

$$\tilde{G}_j = \frac{\text{MSE}_G \times \hat{\gamma}_j + \text{MSE}_{\hat{\gamma}_j} \times G} {\text{MSE}_G + \text{MSE}_{\hat{\gamma}_j}} \tag{7-20}$$

Số năm số liệu và các ngưỡng chặn được dùng để ước lượng MSEs, như trong phương trình (7-10).

(c) Kiểm tra hội tụ:

Nếu \(\|\hat{\mathbf{M}}_j – \hat{\mathbf{M}}_{j-1}\| < \varepsilon\), trả về \(\mathbf{M} = \hat{\mathbf{M}}_j\) làm ước lượng EMA. Ngược lại, tăng j và quay lại bước 2a.

3. Độ bất định của các moment EMA

Độ bất định của các moment, cụ thể là hệ số độ lệch tại trạm (\(\hat{\gamma}\)), được ước lượng bằng EMA. Các chi tiết và phương trình được trình bày trong Phụ lục A1 của Cohn và cộng sự (2001) và của Cohn (thông tin trao đổi cá nhân, 2015).

Trong các trường hợp có thông tin lịch sử, các ngưỡng nhận thức lũ (PILFs), lưu lượng đo tại trạm, hoặc một dạng dữ liệu bị chặn hay dữ liệu khoảng, EMA sử dụng một phương pháp để ước lượng MSEγ̂ dựa trên toàn bộ dữ liệu. Điều này bao gồm dữ liệu bị chặn, dữ liệu khoảng, dữ liệu lịch sử, các PILFs, và các tham số phân phối P-III, vì chúng được dùng để ước lượng các moment bằng EMA. Để thuận tiện trong các phương trình, các ký hiệu được viết gọn như sau:
\(X_{i,lower} = X_{i,l}\) và \(X_{i,upper} = X_{i,u}\). Về mặt khái niệm, việc này được thực hiện như sau:

$$MSE_{\hat{\gamma}} \approx Var(\hat{\gamma}) \approx Var(\hat{m}_3) \approx \frac{1}{n} f(X_{i,l}, X_{i,u}, T_{i,l}, T_{i,u}, \hat{\theta}) \tag{7–21}$$

Trong đó \(MSE_{\hat{\gamma}}\) tỷ lệ với phương sai (Var) của độ lệch (\(\hat{\gamma}\)), và phương sai của moment bậc ba không tâm \(Var(\hat{m}_3)\) là một hàm f của các quan trắc (bao gồm cả dữ liệu bị chặn) và các tham số P-III \(\hat{\theta}\). Trong trường hợp này, n là tổng số bản ghi (ví dụ \(n = n_s + n_h = N\)), bao gồm cả giai đoạn lịch sử, các PILFs và dữ liệu bị chặn hoặc dữ liệu khoảng.

Như trình bày trong Phụ lục A1 của Cohn và cộng sự (2001), EMA ước lượng phương sai của từng moment không tâm \(\{ \hat{\mu} = [\hat{\mu}_1, \hat{\mu}_2, \hat{\mu}_3] \}\), trong đó \(\{ \hat{\mu} = \hat{\mathbf{M}} = [m_1, m_2, m_3] \}\) như đã nêu trong Cohn và cộng sự (2001). Moment không tâm \(\hat{m}_3\) (moment tính quanh giá trị 0) được dùng để ước lượng \(MSE_{\hat{\gamma}}\). Các phương trình then chốt từ Cohn và cộng sự (2001, phụ lục A1) được trình bày ngay sau đây.

EMA ước lượng các moment không tâm \(\hat{\mathbf{M}} = [\hat{m}_1, \hat{m}_2, \hat{m}_3] \)trực tiếp xét đến dữ liệu bị chặn thông qua:

$$\mathbf{\hat{M}} = (1/n) \sum_{i=1}^{n} \chi(\psi(X_i), \mathbf{\hat{M}}) \, \mathcal{I}[\psi(X_i)] \tag{7–22}$$

trong đó:

$$\mathcal{I}[X] \equiv \begin{bmatrix} \mathcal{I}(X < a) \\ \mathcal{I}(a \leq X \leq b) \\ \mathcal{I}(X > b) \end{bmatrix} \tag{7–23}$$

$$\mathcal{I}(\text{điều kiện}) \equiv \begin{cases} 1 & \text{nếu điều kiện đúng} \\ 0 & \text{ngược lại} \end{cases} \tag{7–24}$$

$$\chi(\psi(X), \mathbf{M}) = \begin{bmatrix} E_{\theta[\mathbf{M}]}[X \,|\, X<a] & X_i & E_{\theta[\mathbf{M}]}[X \,|\, X>b] \\ E_{\theta[\mathbf{M}]}[X^2 \,|\, X<a] & X_i^2 & E_{\theta[\mathbf{M}]}[X^2 \,|\, X>b] \\ E_{\theta[\mathbf{M}]}[X^3 \,|\, X<a] & X_i^3 & E_{\theta[\mathbf{M}]}[X^3 \,|\, X>b] \end{bmatrix} \tag{7–25}$$

Hàm \(\mathcal{I}(\text{X})\) xác định loại dữ liệu bị chặn cho logarit lưu lượng X. Có ba loại:

  • less: X nhỏ hơn “ngưỡng nhận biết” a;
  • between: X nằm trong khoảng [a, b];
  • greater: X lớn hơn “ngưỡng nhận biết” b.

Các khoảng [a, b] tương ứng với phần mô tả trong mục Data Representation Using Flow Intervals and Perception Thresholds, trong đó:

  • “between” là loại dữ liệu khoảng (interval);
  • “greater” là loại 0/1 (binomial);
  • “less than” là loại dữ liệu bao gồm lũ lịch sử chưa quan sát, lưu lượng thấp hơn mức cơ sở đo hoặc mực nước thấp.

Chỉ có thể xác định ngưỡng X nếu X < a hoặc X > b. Số lượng quan sát trong mỗi loại lần lượt là \(n_l, n_b, n_g\). Vì mỗi X chỉ thuộc một trong ba loại, tổng kích thước mẫu n là hằng số, với \(n = n_l + n_b + n_g\).

Bảng 7–1. Các loại ngưỡng dữ liệu bị kiểm duyệt trong thuật toán Expected Moments (EMA).

Giá trị \(X_i\)Loại dữ liệu(\(T_{i,l}, T_{i,u}\))
x < al (less)(−∞,a)
a ≤ X ≤ bb (between)(X,X)
x > bg (greater)(b,∞)

MSE\(\hat{\gamma}\) có thể được ước lượng bằng cách lấy phương sai của phương trình (7–22), như trong (7–26). Công thức cho giá trị tiệm cận của bộ ước lượng moment EMA, ký hiệu \(\mathbf{\Sigma}_{\hat{\mu}}\), được trình bày trong Cohn và cộng sự (2001, phụ lục A1). Công thức này thu được bằng cách tuyến tính hóa các kỳ vọng trong phương trình (7–22) và giải \(\mathbf{M}\) theo các giá trị mẫu \(X_i\).

Bộ ước lượng \(\Sigma_{\hat{\mu}}\) sau đó được biểu diễn như một hàm của các tham số đặc trưng của tổng thể, chiều dài chuỗi số liệu, và các ngưỡng chặn. Nó có thể được sử dụng như một ước lượng của ma trận hiệp phương sai–phương sai khi đã biết các tham số ước lượng (\(\hat{\Sigma}_M\)):

$$\text{Var} \, \hat{\mathbf{M}} = \text{Var} \begin{bmatrix} \hat{m}_1 \\ \hat{m}_2 \\ \hat{m}_3 \end{bmatrix} \approx \hat{\Sigma}_{\hat{\mu}} \approx \hat{\Sigma}_{\mathbf{M}}. \tag{7–26}$$

Phương sai của \(\hat{\mathbf{M}}\) là (Cohn và các cộng sự, 2001, phương trình 55):

$$\hat{\Sigma}_{\hat{\mu}} = \frac{1}{n^2} \mathbf{A} \left( \text{Var}[\mathbf{B}] + \text{Var}[\mathbf{C}] \right) \mathbf{A}^\prime \tag{7–27}$$

trong đó:

$$\mathbf{B} = \mu_X \times \mathbf{n} $$

$$\mathbf{C} = \sum_{i=1}^{\mu_{n_b}} (X_i – \mu_{X_b}) $$

$$\mathbf{D} = \frac{\mu_{n_l} \mathbf{J}_l + \mu_{n_g} \mathbf{J}_g}{n}$$

$$\mathbf{A} = (\mathbf{I} – \mathbf{D})^{-1} \tag{7–28}$$

và \(\mu_X\) là vectơ giá trị kỳ vọng cho các moment không tâm, cho trước các tham số và giá trị của X (Cohn và các cộng sự, 2001, phương trình 50–51), và \(()^{-1}\) là phép nghịch đảo ma trận. Phương sai của \(\mathbf{B}\) được cho bởi:

$$\text{Var}[\mathbf{B}] = \mu_X \, \text{Var}[\mathbf{n}] \, \mu_X^\prime. \tag{7–29}$$

Trong trường hợp mẫu lớn, phương sai của \(\mathbf{C}\) là giá trị kỳ vọng của số hạng nhân với phương sai của từng thành phần:

$$\text{Var}[\mathbf{C}] = \mu_{n_B} \begin{bmatrix} V_{1,1} & V_{1,2} & V_{1,3} \\ V_{2,1} & V_{2,2} & V_{2,3} \\ V_{3,1} & V_{3,2} & V_{3,3} \end{bmatrix}. \tag{7–30}$$

Sai số trung bình bình phương (MSE) của hệ số độ lệch (skewness) tại vị trí của EMA được ước tính bằng xấp xỉ bậc nhất (Cohn và các cộng sự, 2001, phương trình 55), được viết lại trong phương trình 7–27, với \(\hat{m}_3\) là moment không tâm cần quan tâm.

4. Khoảng tin cậy với EMA

Một công thức đơn giản để tính khoảng tin cậy cho một phân vị lũ \(\hat{X}_q\) là (Stedinger và các cộng sự, 1993; Cohn và các cộng sự, 2001):

$$\hat{X}_q \pm z_{1-\alpha/2} \sqrt{\mathrm{Var}(\hat{X}_q)} \tag{7–31}$$

Trong đó q là phân vị quan tâm (chẳng hạn như q = 0.99), \(z_{1-\alpha/2}\) là phân vị (\((1-\alpha)/2\) của phân phối Normal chuẩn, α là mức tin cậy và

$$\sqrt{\mathrm{Var}(\hat{X}_q)} = \hat{\sigma}_{\hat{X}_q} \tag{7–32}$$

là sai số chuẩn ước lượng của phân vị lũ. Thông thường, mức tin cậy α=0.05 sẽ cho khoảng tin cậy 90% (giới hạn tin cậy 5% và 95%).

Khoảng tin cậy cho các phân vị lũ (\(\hat{X}_p\)) được ước lượng bằng EMA. Cohn và các cộng sự (2001) xây dựng chi tiết các khoảng tin cậy EMA cho lũ và đưa ra các phương trình then chốt. Cohn (thông tin trao đổi cá nhân, 2015) đã cải thiện các khoảng tin cậy EMA cho các độ lệch \(|\hat{\gamma}| > 0.5\).

Các khoảng tin cậy được ước lượng bằng:

$$\left( \hat{X}_p + \frac{\hat{\sigma}_{\hat{X}_p} T_{\nu,(1-\epsilon)/2}}{1 – \kappa T_{\nu,(1+\epsilon)/2}}, \quad \hat{X}_p + \frac{\hat{\sigma}_{\hat{X}_p} T_{\nu,(1+\epsilon)/2}}{1 – \kappa T_{\nu,(1+\epsilon)/2}} \right) \tag{7–33}$$

trong đó

\(T_{\nu}\) là biến Student’s T (Abramowitz và Stegun, 1964),

\(\epsilon\) là mức tin cậy,

\(\hat{\sigma}_{\hat{X}_p}\) là độ lệch chuẩn của phân vị \(\hat{X}_p\),

$$\kappa \equiv \frac{\mathrm{Cov}[\hat{X}_p, \hat{\sigma}_{\hat{X}_p}]}{\hat{\sigma}^2_{\hat{X}_p}} \tag{7–34} $$

là một hàm của kích thước mẫu và ngưỡng chặn-censoring threshold (và, ở một mức độ nào đó, của \(\alpha\)). Các ước lượng cho \(\mathrm{Cov}[\hat{X}_p, \hat{\sigma}_{\hat{X}_p}]\) và \(\hat{\sigma}^2_{\hat{X}_p}\) có thể lấy từ Cohn và các cộng sự (2001, phương trình 70).

Phương sai tiệm cận của \(\hat{X}_p\) có thể thu được từ khai triển bậc nhất của \(\hat{X}_p\) như một hàm của M:

$$\hat{X}_p \approx X_p + J_{\hat{X}_p} (\mathbf{M} – \mu_{\mathbf{M}}) \tag{7–35}$$

trong đó

$$.J_{\hat{X}_p} = \left[ \frac{\partial \hat{X}_p}{\partial m_1}, \frac{\partial \hat{X}_p}{\partial m_2}, \frac{\partial \hat{X}_p}{\partial m_3} \right] \tag{7–36}$$

Jacobian có thể được tính bằng cách đầu tiên lấy đạo hàm theo \(\{\alpha, \beta, \tau\}\) rồi áp dụng quy tắc dây chuyền.

Phương sai của \(\hat{X}_p\) có thể xấp xỉ bằng:

$$\hat{\sigma}^2_{\hat{X}_p} \approx J_{\hat{X}_p} \cdot \hat{\Sigma}_{\hat{\mu}} \cdot J_{\hat{X}_p}^\prime \tag{7–37}$$

trong đó độ lệch chuẩn tuyến tính hóa, \(\hat{\sigma}_{\hat{X}_p}\), được định nghĩa là \(\sqrt{\hat{\sigma}^2_{\hat{X}_p}}\). Cohn (thông tin trao đổi cá nhân, 2015) đã cung cấp các ước lượng cải thiện cho \(\mathrm{Var}[\hat{X}_p]\) bằng cách sử dụng phép tính tích phân ngược (inverse quadrature).