View Categories

Phụ lục 8. Mở rộng chuỗi số liệu với các trạm lân cận

Phụ lục này mô tả bối cảnh và chi tiết tính toán cho việc chuyển giao thông tin từ một trạm có chuỗi số liệu dài ở gần sang trạm cần phân tích nhưng có chuỗi số liệu tương đối ngắn hơn. Việc chuyển giao dựa trên tương quan quan sát được giữa logarit cơ số 10 của chuỗi giá trị cực đại hàng năm tại hai trạm. Đây là một phương pháp hữu ích để truyền thông tin từ trạm có chuỗi dài sang trạm cần phân tích, đồng thời vẫn tuân thủ tiêu chí “lũ nhỏ có thể ảnh hưởng” (PILF) và cân nhắc thông tin tương đối do dữ liệu lịch sử và ước lượng độ lệch vùng (regional skewness) cung cấp. Một ví dụ được đưa ra để minh họa phương pháp này.

Về mặt hình thức, phương pháp dựa trên tương quan chéo giữa các đỉnh lũ tại trạm chuỗi ngắn và trạm chuỗi dài được gọi là bổ sung chuỗi số liệu (record augmentation). Tuy nhiên, vì thuật toán Bulletin 17C sử dụng ngưỡng PILF để giới hạn phân tích tần suất đối với các trận lũ lớn hơn ngưỡng PILF, nên một quy trình bổ sung chuỗi số liệu bỏ qua giới hạn này sẽ là không phù hợp. Thông tin bổ sung thu được từ phân tích bổ sung chuỗi được thể hiện như một phần mở rộng của chuỗi lũ ban đầu. Độ dài bổ sung của chuỗi được chọn sao cho xấp xỉ với “độ dài chuỗi hiệu dụng” của phần thông tin bổ sung cho phương sai được xây dựng phục vụ phân tích tần suất lũ tại trạm chuỗi ngắn. Ngưỡng PILF sau đó có thể được áp dụng cho chuỗi đã mở rộng này để đảm bảo phân tích đồng nhất các đỉnh lũ lớn hơn ngưỡng đó.

Việc bổ sung chuỗi số liệu là hấp dẫn khi đáp ứng hai điều kiện. Thứ nhất, chuỗi số liệu tại trạm quan tâm tương đối ngắn. Thứ hai, có một trạm chuỗi dài gần đó mà chuỗi lũ của nó tương quan cao với chuỗi lũ tại trạm chuỗi ngắn. Khi đó, chuỗi dài có thể được dùng để kéo dài hiệu quả chuỗi tại trạm chuỗi ngắn bằng cách sử dụng tương quan chéo giữa lũ tại hai trạm. Khuyến nghị là chỉ nên bổ sung chuỗi khi hệ số tương quan chéo \(\rho > 0.80\) và trạm chuỗi ngắn có thời gian ghi nhận dưới 20 năm. Việc bổ sung chuỗi vẫn có thể hữu ích khi trạm chuỗi ngắn có thời gian ghi nhận vượt quá 20 năm. Trong mọi trường hợp, tối thiểu cần có 10 năm dữ liệu trùng thời gian tại cả hai trạm.

Matalas và Jacobs (1964) và Vogel và Stedinger (1985) đã thảo luận các quy trình bổ sung chuỗi, đồng thời đưa ra các tiêu chí phức tạp hơn cho các trường hợp khi tương quan chéo giữa hai chuỗi lũ và thời gian trùng nhau của số liệu không đủ để quy trình mang lại lợi ích về giá trị trung bình và phương sai tại trạm chuỗi ngắn. Tương quan chéo càng lớn thì hiệu quả càng cao.

1. Bổ sung chuỗi để ước lượng trung bình (Mean) và phương sai (Variance)

Matalas và Jacobs (1964) đã phát triển một cách tiếp cận để thu được các ước lượng không chệch (unbiased) của trung bình và phương sai của chuỗi thời gian được kéo dài (chuỗi quan trắc cộng với phần chuỗi mở rộng) dựa trên hồi quy bình phương tối thiểu thông thường (OLS). Cách tiếp cận này là nền tảng của phương pháp “So sánh hai trạm” được mô tả trong Bulletin 17B (IACWD, 1982, phụ lục 7). Dùng phương pháp moment được khuyến nghị trong Bulletin 17B, có thể tính các ước lượng được cải thiện của trung bình và phương sai (độ lệch chuẩn) dựa trên thủ tục Matalas–Jacobs rồi đưa chúng vào các phép tính. Moran (1974) đã xem xét việc dùng nhiều hơn một biến giải thích—là mở rộng tiềm năng hữu ích của khái niệm này.

Do Bulletin 17C đưa vào tiêu chí PILF với EMA, tích hợp độ lệch vùng (regional skewness), và có thể cả thông tin lịch sử cùng các dữ liệu khác, nên việc tiếp nhận thông tin do bổ sung chuỗi cung cấp không còn đơn giản. Điều đó sẽ được thực hiện bằng Systematic record mở rộng đại diện cho phần thông tin bổ sung thu được từ tương quan với trạm có chuỗi dài. Systematic record mở rộng này được đưa vào tính toán EMA, và sau đó chịu các tiêu chí PILF.

Gọi logarit cơ số 10 của lũ tại trạm ngắn cần phân tích là \(y = \log_{10}(Q_y)\) với các giá trị được ký hiệu là \(y_i\), và logarit của lũ tại trạm dài là \(x = \log_{10}(Q_x)\) với các giá trị được ký hiệu là \(x_i\).

Giả sử \(n_1\) là độ dài chuỗi tại trạm ngắn, khi đó chuỗi sẽ là \(y_i, \ i = 1, \ldots, n_1\). Gọi \(n_2\) là số năm bổ sung của chuỗi tại trạm x, khi đó chuỗi x sẽ có dạng \(x_i, \ i = 1, \ldots, (n_1 + n_2)\).

Để thuận tiện, trình bày giả sử rằng \(n_1\) giá trị quan trắc đồng thời giữa hai trạm y và x tương ứng với \(n_1\) quan trắc đầu tiên. Điều này không bắt buộc phải đúng, và các giá trị đồng thời cũng không cần liên tiếp nhau. Chuỗi x ở đây nên được lấy từ một trạm có ý nghĩa thủy văn, với điều kiện khí hậu và đặc điểm lưu vực tương tự.

Các định nghĩa được sử dụng trong phần trình bày này bao gồm các giá trị trung bình mẫu và phương sai mẫu sau:

$$\bar{y}_1 = \frac{1}{n_1} \sum_{i=1}^{n_1} y_i \tag{8–1}$$

$$\bar{x}_1 = \frac{1}{n_1} \sum_{i=1}^{n_1} x_i \tag{8–2}$$

$$\bar{x}_2 = \frac{1}{n_2} \sum_{i=n_1+1}^{n_1+n_2} x_i \tag{8–3}$$

$$s^2_{y_1} = \frac{1}{n_1-1} \sum_{i=1}^{n_1} (y_i – \bar{y}_1)^2 \tag{8–4}$$

$$s^2_{x_1} = \frac{1}{n_1-1} \sum_{i=1}^{n_1} (x_i – \bar{x}_1)^2 \tag{8–5}$$

$$s^2_{x_2} = \frac{1}{n_2-1} \sum_{i=n_1+1}^{n_1+n_2} (x_i – \bar{x}_2)^2 \tag{8–6}$$

Với các định nghĩa trên, các ước lượng Matalas–Jacobs là (Matalas và Jacobs, 1964; Vogel và Stedinger, 1985):

$$\hat{\mu}_y = \bar{y}_1 + \frac{n_2}{n_1 + n_2} \hat{\beta} \left( \bar{x}_2 – \bar{x}_1 \right) \tag{8–7}$$

$$\hat{\sigma}^2_y = \frac{1}{n_1 + n_2 – 1} \left[ (n_1 – 1)s^2_{y_1} + (n_2 – 1)\hat{\beta}^2 s^2_{x_2} + (n_2 – 1)\alpha^2(1 – \hat{\rho}^2)s^2_{y_1} \right.$$

$$\left. + \frac{n_1 n_2}{n_1 + n_2} \hat{\beta}^2 \left( \bar{x}_2 – \bar{x}_1 \right)^2 \right] \tag{8–8}$$

trong đó

$$\hat{\rho} = \hat{\beta} \frac{s_{x_1}}{s_{y_1}} \tag{8–9}$$

$$\hat{\beta} = \frac{\sum_{i=1}^{n_1} (x_i – \bar{x}_1)(y_i – \bar{y}_1)} {\sum_{i=1}^{n_1} (x_i – \bar{x}_1)^2} \tag{8–10}$$

$$\alpha^2 = \frac{n_2 (n_1 – 4)(n_1 – 1)}{(n_2 – 1)(n_1 – 3)(n_1 – 2)} \tag{8–11}$$

Điều quan trọng là cần hiểu độ chính xác của các ước lượng Matalas–Jacobs cho giá trị trung bình và phương sai của đỉnh lũ tại trạm ngắn. Sử dụng các định nghĩa ở trên, phương sai \(\mathrm{Var}(\cdot)\) của giá trị trung bình ước lượng tại trạm y được cho bởi:

$$\mathrm{Var}(\hat{\mu}_y) = \frac{\sigma_y^2}{n_1} \left[ 1 – \frac{n_2}{n_1 + n_2} \left( \rho^2 – \frac{1 – \rho^2}{n_1 – 3} \right) \right] \tag{8–12}$$

trong khi phương sai của phương sai đỉnh lũ tại trạm y là:

$$\mathrm{Var}(\hat{\sigma}^2_y) = \frac{2\sigma_y^4}{n_1 – 1} + \frac{n_2 \sigma_y^4}{(n_1 + n_2 – 1)^2 (n_1 – 3)} \left( A\rho^4 + B\rho^2 + C \right) \tag{8–13}$$

trong đó:

$$A = \frac{(n_2 + 2)(n_1 – 6)(n_1 – 8)}{(n_1 – 5)} + (n_1 – 4) \left( \frac{n_1 n_2 (n_1 – 4)}{(n_1 – 3)(n_1 – 2)} – \frac{2n_2 (n_1 – 4)}{(n_1 – 3)} – 4 \right) \tag{8–14} $$

$$B = \frac{6(n_2 + 2)(n_1 – 6)}{(n_1 – 5)} + 2(n_2^2 – n_1 – 14)$$

$$ + (n_1 – 4) \left( \frac{2n_2 (n_1 – 5)}{(n_1 – 3)} – 2(n_1 + 3) – \frac{2n_1 n_2 (n_1 – 4)}{(n_1 – 3)(n_1 – 2)} \right) \tag{8–15} $$

$$C = 2(n_1 + 1) + \frac{3(n_2 + 2)}{(n_1 – 5)} + \frac{(n_1 + 1)(2n_1 + n_2 – 2)}{(n_1 – 1)(n_1 – 3)}$$

$$+ (n_1 – 4) \left( \frac{2n_2}{(n_1 – 3)} + 2(n_1 + 1) + \frac{n_1 n_2 (n_1 – 4)}{(n_1 – 3)(n_1 – 2)} \right) \tag{8–16}$$

Các công thức này tương ứng với các phương trình trong Matalas và Jacobs (1964), IACWD (1982, phụ lục 7) và Vogel & Stedinger (1985).

Nếu cải thiện độ chính xác của ước lượng trung bình tại trạm y được mô tả bằng sự gia tăng độ dài chuỗi hiệu dụng \(n_e\), thì \(n_e\) được xác định bởi phương trình:

$$\mathrm{Var}(\hat{\mu}_y) = \frac{\sigma_y^2}{n_e + n_1} \tag{8–17}$$

trong đó \(\sigma_y^2\) là phương sai thực của chuỗi y. Vì \(\mathrm{Var}(\hat{\mu}_y)\) trong phương trình (8–12) tỉ lệ thuận với \(\sigma_y^2\), nên phương sai của chuỗi y được triệt tiêu khi tính \(n_e\). Do đó, tổng độ dài chuỗi hiệu dụng tính theo ước lượng trung bình là

$$n_e + n_1 = \frac{n_1}{ 1 – \frac{n_2}{n_1+n_2} \left( \rho^2 – \frac{1 – \rho^2}{n_1 – 3} \right) } \tag{8–18}$$

và tương ứng với phương trình 7-7 trong IACWD (1982, phụ lục 7).

Về mặt tính toán phân vị lũ, ước lượng phương sai quan trọng hơn nhiều so với ước lượng giá trị trung bình. Do đó, khi sử dụng các ước lượng Matalas–Jacobs cho phân tích tần suất lũ, vấn đề then chốt là mức gia tăng hiệu dụng về độ dài chuỗi xét theo độ chính xác của ước lượng phương sai. Sử dụng các phương trình (8–13) đến (8–16), mối quan hệ cần thiết để tính tổng độ dài chuỗi hiệu dụng cho ước lượng phương sai là:

$$(n_e + n_1) = \frac{2}{ \frac{2}{n_1 – 1} + \frac{n_2}{(n_1 + n_2 – 1)^2 (n_1 – 3)} \left( A\rho^4 + B\rho^2 + C \right) } + 1. \tag{8–19}$$

Việc sử dụng các ước lượng Matalas–Jacobs là phù hợp khi chúng mang lại cải thiện đáng kể cho cả ước lượng trung bình và phương sai của đỉnh lũ tại trạm chuỗi ngắn y, tương ứng với \(n_e\) khoảng 4 hoặc 5 năm trở lên. Điều này thường xảy ra khi \(\hat{\rho} > 0.80\) (Vogel và Stedinger, 1985).

Các phương trình trên được xây dựng với giả định rằng logarit của các quan trắc đồng thời tại trạm chuỗi ngắn \(y_i\) và tại trạm chuỗi dài \(x_i\) tuân theo phân phối normal chung với độ lệch (skewness) bằng 0. Khi giả định này bị vi phạm nghiêm trọng, các phương trình trên không còn chính xác và kỹ thuật này cần được sử dụng một cách thận trọng.

2. Mở rộng chuỗi với MOVE

Sau khi tính được các ước lượng Matalas–Jacobs cải tiến cho giá trị trung bình và phương sai tại trạm y, và độ dài chuỗi hiệu dụng \(n_1 + n_e\) tương ứng với cải thiện trong ước lượng phương sai (phương trình 8–19), bước tiếp theo là tạo ra \(n_e\) giá trị quan trắc bổ sung để thêm vào chuỗi y, nhằm đưa phần thông tin bổ sung này vào phân tích tần suất. Đây là phương pháp sử dụng ý tưởng Maintenance of Variance Extension (MOVE) do Hirsch (1982) đề xuất. Như tên gọi, các kỹ thuật này được phát triển nhằm duy trì phương sai của chuỗi y được tạo ra khi nó được mở rộng bằng một chuỗi dài hơn bổ sung, ký hiệu ở đây là x.

Theo gợi ý của Vogel và Stedinger (1985), có thể thận trọng trong việc chọn tham số mô hình sao cho các giá trị gốc và các giá trị mở rộng có giá trị trung bình và phương sai đúng với yêu cầu của nhà thủy văn. Trong trường hợp này, \(n_1\) quan trắc gốc thể hiện chính nó, và \(n_e\) giá trị bổ sung biểu thị phần thông tin do các quan trắc bổ sung trong chuỗi x cung cấp, với điều kiện tương quan chéo giữa hai chuỗi không hoàn hảo.

Cần lưu ý rằng quy trình này chỉ thêm đúng \(n_e\) giá trị quan trắc vào chuỗi y gốc và các giá trị \(n_e\) đó có chứa thông tin cần thiết để truyền tải về giá trị trung bình và phương sai tại trạm y.

Một mô hình hồi quy tuyến tính được sử dụng để mở rộng chuỗi tại trạm \(y_i\) thêm \(n_e\) năm như sau (Vogel và Stedinger, 1985):

$$\hat{y}_i = a + b (x_i – \bar{x}_e) \quad \text{với} \quad i = n_1+1, \ldots, n_1 + n_e \tag{8–20}$$

trong đó \(\bar{x}_e\) là giá trị trung bình của \(n_e\) phần tử trong chuỗi x thuộc giai đoạn không trùng với chuỗi y gốc, được dùng để mở rộng chuỗi y:

$$\bar{x}_e = \frac{1}{n_e} \sum_{i=n_1+1}^{n_1+n_e} x_i \tag{8–21}$$

$$s^2_{x_e} = \frac{1}{n_e – 1} \sum_{i=n_1+1}^{n_1+n_e} (x_i – \bar{x}_e)^2. \tag{8–22}$$

Hệ số chặn a dùng để tạo \(n_e\) giá trị mới được tính như sau:

$$a = \frac{(n_1 + n_e)\hat{\mu}_y – n_1 \bar{y}_1}{n_e} \tag{8–23}$$

Hệ số góc b (b > 0) được ước lượng từ:

$$b^2 = \frac{(n_1 + n_e – 1)\hat{\sigma}^2_y – (n_1 – 1)s^2_{y_1} – n_1(\bar{y}_1 – \hat{\mu}_y)^2 – n_e(a – \hat{\mu}_y)^2} {(n_e – 1)s^2_{x_e}}. \tag{8–24}$$

Nếu \(b^2\) nhỏ hơn không, điều đó cho thấy việc mở rộng hữu ích với phương pháp này là không thể thực hiện.

3. Tóm tắt quy trình

Các bước bổ sung chuỗi để ước lượng trung bình và phương sai tại trạm chuỗi ngắn và xây dựng chuỗi mở rộng với \(n_e\) quan trắc bổ sung đưa vào EMA như sau:

  1. Chọn trạm chuỗi dài gần và có ý nghĩa thủy văn để mở rộng trạm chuỗi ngắn cần phân tích. Tương quan chéo giữa hai trạm là yếu tố then chốt và cần càng lớn càng tốt. Đồ thị chuỗi theo thời gian của hai trạm có thể cho thấy việc truyền thông tin giữa hai trạm có hợp lý không. Trạm chuỗi dài có cung cấp góc nhìn tốt hơn về các sự kiện thủy văn trong chuỗi ngắn không?
  2. Phân tích thống kê và quan hệ hồi quy giữa trạm chuỗi dài và ngắn sử dụng logarit cơ số 10 của đỉnh lũ. Nếu hệ số tương quan \(\hat{\rho}\) (tính theo (8–9)) vượt ngưỡng quan trọng (\(\hat{\rho} > 0.80\)), thì có thể mở rộng chuỗi. Nếu không, có thể cần dùng phương pháp khác như dùng sai số bình phương có trọng số hoặc ước lượng khu vực.
  3. Ước lượng các thống kê mẫu cho chuỗi \(n_1\) năm đồng thời bằng (8–1) đến (8–6), sau đó tính trung bình và phương sai ước lượng cho trạm y dựa trên toàn bộ chuỗi của trạm chuỗi dài bằng (8–7) và (8–8).
  4. Tính tổng độ dài chuỗi hiệu dụng \(n_1 + n_e\) theo (8–19); \(n_e\) là số quan trắc cần bổ sung vào chuỗi y.
  5. Ước lượng các tham số mở rộng bằng (8–23) và (8–24). Dùng mô hình (8–20) để sinh \(n_e\) giá trị bổ sung từ \(n_2\) năm không cùng thời gian. Kiểm tra tính hợp lý của kết quả mở rộng. Ví dụ: nếu \(n_e\) năm mở rộng ngắn lại chứa các trận lũ lớn nhất trong chuỗi dài, thì hệ số lệch có thể bị sai lệch so với thực tế của chuỗi ngắn; trong trường hợp này, cần chọn \(n_e\) năm khác hợp lý hơn để phản ánh đúng hệ số lệch dự kiến.
  6. Có thể tiến hành phân tích tần suất bằng cách sử dụng chuỗi lưu lượng đã được mở rộng \(n_1 + n_e\).

Quy trình này gần đây được phát triển với trọng tâm vào \(n_e\) năm. Có thể cần thực hiện thêm công việc để lựa chọn các năm \(n_e\). Như đã nêu ở trên và trong Matalas và Jacobs (1964), giả định cơ bản của mô hình là phân phối Normal chung giữa hai trạm, với độ lệch bằng 0, cần được xem xét lại.

Một ví dụ được trình bày ở phần tiếp theo. Tài liệu bổ sung để thực hiện các phép tính này và ví dụ có sẵn tại:
https://acwi.gov/hydrology/Frequency/b17c/.

4. Ví dụ MOVE — Suwanee Creek tại Suwanee, Georgia

Một ví dụ về mở rộng chuỗi sử dụng MOVE được trình bày cho Suwanee Creek tại Suwanee, Georgia (USGS trạm 02334885), nơi diện tích lưu vực là 47,0 dặm vuông (mi²). Lưu vực này nằm ở miền trung-bắc Georgia như thể hiện ở Hình 8–1. Có 20 năm số liệu tại trạm 02334885 từ 1985 đến 2004, được coi là tương đối ngắn, như thể hiện ở Hình 8–2. Phân tích 20 năm số liệu của Suwanee Creek cho kết quả ước lượng thấp đối với lưu lượng lũ, chẳng hạn như lũ 0,01 AEP, so với các trạm dài hạn khác trong khu vực.

Có một trạm đo lân cận trên sông Etowah tại Canton, Georgia (USGS trạm 02392000), có 113 năm số liệu từ 1892 đến 2004 và diện tích lưu vực là 613 mi². Số liệu đỉnh lũ hàng năm của sông Etowah được dùng để mở rộng chuỗi của Suwanee Creek thêm 13 năm nhằm ước lượng lũ thiết kế như lũ 0,01 AEP.

Số liệu đỉnh lũ hàng năm đồng thời của sông Etowah và Suwanee Creek đến năm 2004 được liệt kê trong bảng 8–1. Trong 8 của 20 năm số liệu, đỉnh lũ hàng năm lớn nhất xảy ra cùng một sự kiện lũ ở cả Suwanee Creek và sông Etowah. Tuy nhiên, trong 12 của 20 năm số liệu đồng thời, đỉnh lũ hàng năm này lại tương ứng với các trận lũ khác nhau.

Trong mục đích của việc mở rộng chuỗi số liệu, đỉnh lũ đồng thời được hiểu là những đỉnh xảy ra trong cùng một năm thủy văn, chứ không nhất thiết là trong cùng một trận lũ.

Hình 8–1. Bản đồ thể hiện vị trí của
Suwanee Creek tại Suwanee, Georgia, trạm USGS mã 02334885,
và sông Etowah tại Canton, Georgia, trạm USGS mã 02392000.

Bảng 8–1. Tóm tắt số liệu đỉnh lũ hàng năm quan trắc đồng thời cho sông Etowah và Suwanee Creek từ năm 1985 đến 2004.

Năm thủy vănLưu lượng đỉnh
hàng năm
sông Etowah
(ft³/s)
Lưu lượng đỉnh
hàng năm
Suwanee Creek
(ft³/s)
19855,0301,440
19863,090386
198712,2002,150
19889,340948
19899,0801,220
199027,1003,760
19915,9401,320
19927,660696
199310,9002,540
19949,4201,190
199510,5002,650
199619,5004,350
199711,3002,360
199815,0002,900
19995,530816
20008,900862
20019,2702,090
20027,1001,260
200313,6002,940
200415,3003,270

Hình 8–2. Biểu đồ thể hiện lưu lượng đỉnh hàng năm của Suwanee Creek, trạm USGS mã 02334885, trạm có chuỗi số liệu ngắn, từ năm 1985 đến 2004.

Hình 8–3. Biểu đồ thể hiện lưu lượng đỉnh hàng năm của sông Etowah, trạm USGS mã 02392000, trạm có chuỗi số liệu dài, từ năm 1892 đến 2004.

Lưu lượng đỉnh hàng năm của sông Etowah tại Canton, Georgia (trạm chuỗi dài), được thể hiện ở Hình 8–3 cho giai đoạn 1892–2004. Như thể hiện ở Hình 8–3, đã có một số trận lũ lớn được ghi nhận trên sông Etowah trước năm 1985, khi việc thu thập số liệu hệ thống tại Suwanee Creek bắt đầu. Giai đoạn thu thập số liệu hệ thống tại Suwanee Creek từ 1985 đến 2004 không bao gồm một số trận lũ lớn đã xảy ra vào các năm 1892, 1916 và 1919 tại trạm đo gần đó trên sông Etowah. Những trận lũ lớn này, cùng với thông tin từ các sự kiện trong giai đoạn 1892–1984, có thể được sử dụng thông qua phương pháp bổ sung chuỗi để cải thiện ước lượng trung bình và phương sai, cũng như mở rộng chuỗi lũ tại Suwanee Creek.

20 năm số liệu đồng thời của Suwanee Creek và sông Etowah được thể hiện ở Hình 8–4 theo thang log-log. Như thể hiện ở Hình 8–4, logarit của lưu lượng đỉnh hàng năm xác lập một quan hệ tuyến tính với giá trị \(R^2\) bằng 0,7258. Hệ số tương quan là 0,8519, lớn hơn giá trị ngưỡng (\(\hat{\rho} > 0.80\)) cho cả trung bình và phương sai. Điều này cho thấy giá trị trung bình và độ lệch chuẩn từ chuỗi mở rộng sẽ được cải thiện nếu sử dụng chuỗi dài hơn. Mặc dù sông Etowah lớn hơn nhiều so với Suwanee Creek, nhưng có mối tương quan mạnh giữa lưu lượng đỉnh hàng năm, điều này tạo điều kiện cho việc mở rộng chuỗi. Quan hệ tuyến tính trong Hình 8–4 là đường hồi quy bình phương tối thiểu thông thường được tính bằng logarit của dữ liệu.

Chuỗi 20 năm của Suwanee Creek từ 1985 đến 2004 cho kết quả ước lượng thấp về lưu lượng lũ, như lũ có xác suất vượt 0,01 hằng năm, vì các trận lũ lớn trước khi có thu thập số liệu hệ thống không được xét trong phân tích tần suất. Giai đoạn 1985–2004 là thời kỳ tương đối khô hạn so với giai đoạn trước 1985, như thể hiện qua chuỗi dài hạn của sông Etowah ở Hình 8–3.

Chuỗi số liệu lũ của Suwanee Creek đã được mở rộng bằng phương pháp bổ sung chuỗi cho giá trị trung bình và phương sai, và MOVE, dựa trên dữ liệu lưu lượng đỉnh hàng năm của sông Etowah từ 1892–1984 và giai đoạn trùng nhau từ 1985–2004. Như thể hiện ở Hình 8–4, có mối quan hệ tuyến tính mạnh giữa logarit của lưu lượng đỉnh hàng năm. Hệ số tương quan ước lượng cho giai đoạn trùng nhau 1985–2004 là 0,8519.

Các đại lượng thống kê của chuỗi quan trắc là:

  • \(y_i\) = lưu lượng theo logarit cho Suwanee Creek tại năm i
  • \(x_i\) = lưu lượng theo logarit cho sông Etowah tại năm i
  • \(n_1\) = giai đoạn số liệu đồng thời hoặc trùng nhau, 20 năm (1985–2004)
  • \(n_2\) = giai đoạn số liệu không đồng thời, 93 năm (1892–1984)
  • \(\bar{y}_1\) = giá trị trung bình logarit cho Suwanee Creek trong giai đoạn đồng thời = 3,215 log units
  • \(\bar{x}_1\) = giá trị trung bình logarit cho sông Etowah trong giai đoạn đồng thời = 3,984 log units
  • \(\bar{x}_2\) = giá trị trung bình logarit cho sông Etowah trong giai đoạn không đồng thời = 4,079 log units
  • \(s_{y_1}\) = độ lệch chuẩn logarit cho Suwanee Creek trong giai đoạn đồng thời = 0,279 log units
  • \(s_{x_1}\) = độ lệch chuẩn logarit cho sông Etowah trong giai đoạn đồng thời = 0,214 log units
  • \(s_{x_2}\) = độ lệch chuẩn logarit cho sông Etowah trong giai đoạn không đồng thời = 0,219 log units

Từ phương trình (8–19), độ dài chuỗi mở rộng ước lượng \(n_e\) là 13 năm.

Chuỗi \(n_e\) năm mở rộng của \(y_i\) cho Suwanee Creek được ước lượng bằng cách sử dụng 13 năm gần nhất của giai đoạn không trùng (1972–1984). Dùng các phương trình Matalas–Jacobs (8–7) đến (8–11), trung bình và phương sai đã bổ sung lần lượt là: \(\mu_y = 3,3024 \quad \text{và} \quad \sigma_y^2 = 0,08105\)

Giải các phương trình (8–20) đến (8–24), phương trình MOVE ở dạng tuyến tính logarit dùng để tạo chuỗi \(n_e\) lưu lượng là:

$$y_i = 3,4364 + 1,4416 \,(x_i – 4,1414) \tag{8–25}$$

trong đó \(x_i\) là logarit cơ số 10 của lưu lượng sông Etowah cho giai đoạn 1972–1984.

và:

$$Q_i = 10^{y_i} \tag{8–26}$$

trong đó \(Q_i\) là lưu lượng mở rộng (đơn vị ft³/s) cho Suwanee Creek.
Phương trình 8–26 được sử dụng để ước lượng lưu lượng đỉnh hàng năm cho Suwanee Creek trong giai đoạn 1972–1984, qua đó mở rộng chuỗi thêm 13 năm bằng dữ liệu từ sông Etowah.
Các ước lượng lưu lượng mở rộng cho Suwanee Creek được liệt kê trong bảng 8–2.
Các ước lượng lưu lượng gốc từ trạm chuỗi dài (sông Etowah) được liệt kê trong bảng 8–3.

Hình 8–4. Biểu đồ 20 năm số liệu đồng thời của Suwanee Creek và sông Etowah trong giai đoạn 1985–2004, kèm theo đường hồi quy bình phương tối thiểu thông thường.

Bảng 8–2. Chuỗi mở rộng bằng phương pháp MOVE trong 13 năm (1972 đến 1984) cho Suwanee Creek tại Suwanee, Georgia (trạm 02334885).

Năm thủy vănLưu lượng đỉnh
hàng năm
(ft³/s)
19722,830
19732,010
19742,300
19752,200
19764,310
19774,150
19783,730
19795,180
19803,040
1981722
19826,070
19831,460
19842,440

Bảng 8–3. Ghi nhận lũ trong 93 năm (1892 đến 1984) cho sông Etowah tại Canton, Georgia (trạm 02335000).

Năm
thủy văn
Lưu lượng đỉnh
hàng năm
(ft³/s)
Năm
thủy văn
Lưu lượng đỉnh
hàng năm
(ft³/s)
Năm
thủy văn
Lưu lượng đỉnh
hàng năm
(ft³/s)
Năm
thủy văn
Lưu lượng đỉnh
hàng năm
(ft³/s)
189236,700192311,700195415,500196911,900
18939,38019244,960195512,60019706,590
18944,36019258,74019567,30019715,790
189512,40019266,530195715,500197214,200
18965,30019279,46019585,440197311,200
189714,000192810,70019597,230197412,300
189810,900192913,60019606,320197511,900
189920,800193015,300196119,300197619,000
190012,30019315,200196220,900197718,500
190119,600193211,700196322,600197817,200
190220,800193328,200196425,000197921,600
190320,20019349,06019658,740198014,900
19048,87019356,530196619,00019815,500
19058,870193622,700196715,900198224,100
190612,900193715,300196811,00019838,970
19076,950193819,700198412,800
190810,60019396,360
190914,90019408,900
19106,88019418,820
191111,100194213,300
191218,400194310,100
19138,350194410,600
19147,44019455,180
19159,300194632,300
191636,100194714,500
191714,30019488,500
19186,320194917,200
191929,50019508,500
192036,10019517,790
192121,500195219,500
192210,20019538,140