II. Các giả định dữ liệu và Những vấn đề cần quan tâm

Mục lục

II.1. Sai số đo đạc
II.2. Tính ngẫu nhiên của các sự kiện
II.3. Tổng thể hỗn hợp (Mixed Populations)
II.4. Biến đổi lưu vực
II.5. Biến đổi khí hậu

Các giả định thông thường đối với một phân tích thống kê là chuỗi thông tin về lũ là đáng tin cậy và đại diện cho một mẫu thời gian của các sự kiện ngẫu nhiên và đồng nhất. Việc đánh giá mức độ đầy đủ và khả năng áp dụng của các hồ sơ lũ vì vậy là bước cần thiết đầu tiên trong phân tích tần suất lũ. Phần này thảo luận về các sai số đo đạc, tính ngẫu nhiên của các sự kiện, tổng thể hỗn hợp, thay đổi lưu vực, và những cân nhắc về biến đổi khí hậu cũng như thay đổi khí hậu trong phân tích tần suất lũ.

II.1. Sai số đo đạc

Sai số đo lưu lượng đỉnh tồn tại trong các bản ghi lưu lượng, cũng như trong tất cả các giá trị đo khác. Sauer và Meyer (1992) đã mô tả các nguồn sai số trong đo đạc lưu lượng. Sai số tuyệt đối trong các ước tính lưu lượng thường lớn nhất trong các trận lũ cực đại. Ước lượng lưu lượng đỉnh của các trận lũ lớn nhất từ các bản ghi có hệ thống (gaging), lũ lịch sử, lũ cổ (paleofloods), hoặc các nguồn khác có thể chứa sai số đáng kể do không chắc chắn ở cả mối quan hệ giữa mực nước và lưu lượng (stage–discharge relationship), và do các lưu lượng này thường được ước lượng từ phần mở rộng của đường quan hệ mực nước–lưu lượng (rating-curve) hoặc các phương pháp gián tiếp, thay vì được đo đạc trực tiếp.

Nhiều cải tiến đã được thực hiện trong việc đo đạc lưu lượng trực tiếp bởi USGS trong vài thập kỷ qua (Turnipseed và Sauer, 2010), với độ chính xác “tốt” (sai số 5%) cho hầu hết các phép đo lưu lượng. Tuy nhiên, các trận lũ lớn nhất thường không được đo đạc trực tiếp vì các vấn đề như vật cản, vị trí khó tiếp cận, và các yếu tố an toàn (Costa và Jarrett, 2008). Các nguồn sai số tiềm năng khác trong lưu lượng lớn bao gồm dòng tràn chưa được ghi nhận từ các nhánh chính của sông và ảnh hưởng của băng (Rantz and others, 1982b).

Các trận lũ lớn nhất thường được ước lượng bằng cách mở rộng rating-curve hoặc các phương pháp gián tiếp, với sai số ước lượng có thể vượt quá 25% trong nhiều trường hợp, thậm chí hơn 100% trong các suối có độ dốc lớn (Jarrett, 1987). Sai số đo đạc có thể làm suy giảm nghiêm trọng các ước lượng của phân vị lũ trong một số tình huống (Potter và Walker, 1985); do đó, cần điều tra các sai số ước lượng trong các trận lũ lớn nhất.

Trong nhiều trường hợp, lưu lượng đỉnh hàng năm được ước tính từ phần kéo dài của rating-curve. Sai số đáng kể trong việc ước tính lưu lượng có thể phát sinh từ phần kéo dài này (Cook, 1987; Kuczera, 1996), đặc biệt nếu giá trị lưu lượng lớn hơn gấp đôi giá trị đo lớn nhất bằng lưu tốc kế. Thật không may, các giá trị đỉnh lũ lớn hoặc dị thường thường không được đo trực tiếp và thường lớn hơn nhiều lần so với giá trị đã được đo (Klemeš, 1987). Kuczera (1996) cho rằng phần kéo dài rating-curve, khi có sai số tương quan, có thể ảnh hưởng đáng kể đến các ước lượng của phân vị.

Các phương pháp gián tiếp được sử dụng để đo lưu lượng đỉnh sau khi lũ xảy ra (Benson và Dalrymple, 1967; Rantz and others, 1982a), sử dụng các dấu vết mực nước cao (HWMs) hoặc chỉ số PSI (Koenig and others, 2016). Phương pháp độ dốc – diện tích mặt cắt (slope-area method) của Dalrymple và Benson (1967) được USGS sử dụng phổ biến nhất; các phương pháp gián tiếp khác được trình bày trong Cook (1987) Webb và Jarrett (2002). Phương pháp độ dốc – diện tích đã ghi nhận nhiều nguồn sai số (Bathurst 1986; Jarrett 1987; Kirby 1987; McCuen và Knight, 2006). Sai số đáng kể trong ước tính lưu lượng bằng phương pháp gián tiếp đã được ghi nhận ở các vùng núi; các giá trị đo thường bị ước lượng cao hơn thực tế (Jarrett, 1987). Việc bỏ qua hiện tượng xói hoặc bồi đáy là yếu tố quan trọng nhất có thể gây sai số lớn trong các ước tính gián tiếp (Kirby, 1987). Quick (1991) đã trình bày các nguồn sai số trong phương pháp độ dốc – diện tích và chỉ ra rằng phương pháp này thường có xu hướng đưa ra giá trị cao. Webb và Jarrett (2002) mô tả các giả định trong việc ước tính lưu lượng đỉnh từ dữ liệu lịch sử và lũ cổ; họ cũng nêu rõ những thông tin cần có để hỗ trợ cho các ước tính lưu lượng.

Trong nhiều trường hợp, sai số có thể được nhận ra hoặc nghi ngờ. Cần nỗ lực đáng kể để hiểu rõ các nguồn sai số trong đo đạc lưu lượng và định lượng mức độ bất định liên quan đến các sai số đó. Nếu sai số lớn, nên báo cáo với cơ quan thu thập dữ liệu kèm theo bằng chứng hỗ trợ và đề nghị hiệu chỉnh giá trị đo.

II.2. Tính ngẫu nhiên của các sự kiện

Nói chung, chuỗi số liệu lưu lượng đỉnh hàng năm có thể được xem là một mẫu ngẫu nhiên của các biến ngẫu nhiên độc lập và cùng phân phối. Chuỗi số liệu này được giả định là một mẫu ngẫu nhiên đại diện cho tổng thể các trận lũ trong tương lai. Giả định này phụ thuộc vào việc thực hiện phân tích sơ bộ dữ liệu (exploratory data analysis) (phụ lục 4) và hiểu biết vật lý sâu hơn về hệ thống.

Về bản chất, quá trình ngẫu nhiên sinh ra lũ được giả định là dừng (stationary) hay bất biến theo thời gian. Tính dừng là một thuộc tính của quá trình ngẫu nhiên tiềm ẩn, chứ không phải của dữ liệu quan sát được. Các chuỗi phát sinh từ quá trình dừng vẫn có thể biểu hiện các đợt lệch xa (excursions) và xu thế kéo dài (trends that persis) hàng thập kỷ hoặc thế kỷ (Cohn và Lins, 2005). Các quá trình không dừng (nonstationary) khó phát hiện trong chuỗi lưu lượng đỉnh (Villarini and others, 2009a) và có thể khó xác định (Koutsoyiannis, 2011).

Trong một số tình huống, có thể cân nhắc các khái niệm long-term persistence (Lins và Cohn, 2011) hoặc shifting-mean models (Salas và Boes, 1980; Svensson and others, 2003).

Trước khi tiến hành phân tích tần suất lũ, Hướng dẫn này khuyến nghị các nhà phân tích nên thực hiện một phân tích sơ bộ về dữ liệu. Helsel và Hirsch (2002) và Hirsch and others (1993) cung cấp cái nhìn tổng quan và chi tiết về việc thực hiện phân tích sơ bộ dữ liệu. Các thủ tục khuyến nghị cho việc phân tích dữ liệu ban đầu bao gồm vẽ chuỗi số liệu, kiểm tra serial correlation (tương quan giữa các quan sát theo thời gian), xem xét xu thế và sự thay đổi đột ngột (changepoints), được trình bày trong phụ lục 4.

Tại một số khu vực, số liệu lũ có thể cho thấy dấu hiệu không ngẫu nhiên rõ rệt và biểu hiện xu hướng nhiều thập kỷ hoặc chu kỳ khô – ẩm mạnh mẽ mà không thể giải thích được bằng các yếu tố như thay đổi sử dụng đất, quản lý nguồn nước hoặc biến đổi khí hậu. Những bộ số liệu như vậy đặc biệt gây khó khăn và là một trong những vấn đề nan giải nhất trong phân tích tần suất lũ. Nhóm công tác đã không đánh giá các phương pháp xử lý vấn đề không ngẫu nhiên và/hoặc xu hướng nhiều thập kỷ trong tần suất lũ. Cần có thêm các nghiên cứu trong lĩnh vực này vì đây là một vấn đề chưa được giải quyết một cách nghiêm túc. Nếu các xu hướng nhiều thập kỷ kiểu này được phát hiện thông qua các kiểm định thống kê thích hợp và phân tích dữ liệu, nên điều tra các cơ chế vật lý tiềm ẩn nhằm hiểu rõ hơn về thủy văn (Lins và Cohn, 2011). Cách điều chỉnh một bộ số liệu như vậy để phục vụ phân tích tần suất lũ vẫn là một vấn đề chưa có lời giải.

Ngay cả khi các kiểm định thống kê về hệ số serial correlation cho thấy sự sai khác đáng kể so với giả định độc lập, thì số liệu đỉnh lũ hàng năm vẫn có thể cung cấp một ước lượng không sai lệch về hoạt động lũ trong tương lai nếu các giả định khác được đảm bảo. Tuy nhiên, tính không ngẫu nhiên của chuỗi số liệu đỉnh lũ sẽ dẫn đến sai số trong việc ước lượng bất định liên quan đến đường tần suất được lắp vào. Các khái niệm về độ dài chuỗi số liệu hiệu dụng (Tasker, 1983; Vogel và Kroll, 1991) nên được sử dụng để hiệu chỉnh việc ước lượng bất định trong trường hợp có tồn tại serial correlation.

(nd: cùng phân phối – identically distributed)

identically distributed ở đây nghĩa là các biến ngẫu nhiên có cùng phân phối xác suất — tức là mọi quan sát đều tuân theo cùng một hàm phân phối F với cùng tham số.

Ký hiệu: \(X_1, X_2,\dots,X_n \sim F\) (giống hệt nhau về phân phối).
Ví dụ thủy văn: mỗi năm \(Q_t\) (đỉnh lũ năm) đều ~ Log-Pearson Type III với cùng \((\mu,\sigma,\gamma)\). Khi đó ta nói các \(Q_t\) “cùng phân phối”.
Lưu ý: Điều này khác “phân phối đều/Uniform” (một loại phân phối cụ thể). Nhiều người dễ nhầm.

(nd: tính dừng – stationary)

Stationary (tính dừng / bất biến theo thời gian) của một quá trình ngẫu nhiên nghĩa là các đặc trưng thống kê không đổi theo thời gian.

Có hai mức hay dùng:

Dừng yếu (weak / covariance-stationary)

Kỳ vọng: \(E[X_t]=\mu\) (hằng số)
Phương sai: \({Var}(X_t)=\sigma^2\) (hằng số, hữu hạn)
Hiệp phương sai: \({Cov}(X_t, X_{t+k})=\gamma(k)\) chỉ phụ thuộc vào độ trễ k, không phụ thuộc t.

Dừng mạnh (strict-stationary)

Mọi phân phối đồng thời của \((X_{t_1},\dots,X_{t_m})\) không đổi khi trượt toàn bộ dãy theo thời gian (bảo toàn toàn bộ phân phối, không chỉ các moment).

Trong thủy văn (chuỗi lưu lượng đỉnh năm):

Stationary ≈ các năm đều tuân theo cùng một phân phối (VD cùng Log-Pearson III với cùng \(\mu,\sigma,\gamma)\); trung bình, phương sai, cấu trúc tương quan không đổi theo thời gian.
Nonstationary khi có xu thế/nhảy bậc/biến đổi tham số phân phối do khí hậu, đô thị hóa, đê – hồ chứa, thay đổi đường quan hệ mực-lưu, v.v.

Dấu hiệu nhận biết nhanh

Đồ thị có xu thế dài hạn, bước nhảy rõ → thường nonstationary.
Tham số ước lượng theo cửa sổ thời gian trượt thay đổi mạnh → nonstationary.

Kiểm tra thường dùng (EDA trước B17C)

Xu thế: Mann–Kendall, Spearman (trên chuỗi hoặc trên phần dư đã xử lý tự tương quan).
Điểm đổi (changepoint): Pettitt, Buishand.
Tự tương quan: ACF/PACF, Ljung–Box (để phân biệt persistence với xu thế).

(nd: đợt lệch xa – excursions)

“Excursions” (các đợt lệch xa): là những khoảng thời gian khá dài mà chuỗi nằm liên tục trên hoặc dưới mức “bình thường” (ví dụ trên/ dưới trung bình dài hạn hay vượt một ngưỡng). Với chuỗi có tương quan dương (AR(1), H>0.5, “red noise”), bạn dễ thấy nhiều năm liền lũ cao hơn bình thường (đợt ướt) hoặc thấp hơn (đợt khô) dù quá trình nền vẫn stationary.
“Trends that persist” (xu thế kéo dài): là dáng vẻ tăng/giảm kéo dài hàng thập kỷ nhìn như có “xu thế”, nhưng có thể chỉ là dao động ngẫu nhiên tần số thấp của một quá trình stationary (do nội tại có độ bền/persistence), chứ không phải tham số thật sự đổi theo thời gian.

Nói ngắn gọn: stationary là thuộc tính của quá trình (tham số không đổi). Một hiện thực (realization) cụ thể ta quan sát có thể vẫn trông như có đợt lệch dài hoặc xu thế dài hạn, chỉ vì tính bền/độ nhớ của hệ (tự tương quan), không nhất thiết là nonstationary. Vì vậy mới phải làm EDA/kểm định xu thế–điểm đổi và xét giải thích vật lý trước khi kết luận “không dừng”.

(nd: long-term persistence)

Long-term persistence (LTP) còn gọi long-range dependence / long memory = “tính bền lâu dài” của một quá trình stationary, khi các ảnh hưởng quá khứ kéo dài rất xa về thời gian.

Định nghĩa (ngắn):

Tự tương quan ở độ trễ lớn giảm rất chậm theo luật lũy thừa (không phải mũ): \(\rho(k)\;\sim\; C\,k^{2H-2}\quad (k\to\infty)\) với Hurst exponent \(H\in(0.5,1)\).
(Tương đương tham số “memory” \(d=H-0.5\in(0,0.5)\) trong mô hình ARFIMA.)
Hệ quả: tổng \(\sum_{k=1}^{\infty}\rho(k)\) không hội tụ ⇒ “nhớ dài”.
Đối chiếu AR(1) (short memory): \(\rho(k)=\phi^k\) giảm mũ và tổng hội tụ.

Trực giác thủy văn:

Dù nền stationary, bạn vẫn thấy nhiều thập kỷ ẩm/khô kéo dài, hay giai đoạn lũ lớn/nhỏ kéo dài — hiện tượng Hurst (phát hiện từ số liệu sông Nile).
Vì “nhớ dài”, chuỗi dễ trông như có xu thế hoặc “đợt lệch xa” dài ngày.

Tác động thực hành:

Phương sai của trung bình giảm chậm hơn \(\sim n^{2H-2}\) ⇒ khoảng tin cậy ước lượng hẹp giả nếu bỏ qua LTP.
Kiểm định xu thế/điểm đổi có thể báo động giả nếu không hiệu chỉnh “memory”.

Cách kiểm tra/ước lượng (nên làm sau khi loại xu thế/bước nhảy rõ):

DFA (Detrended Fluctuation Analysis) để ước lượng H.
Log-periodogram (GPH), Whittle/wavelet ML, hoặc mô hình ARFIMA(p,d,q) rồi ước lượng d.
Kết luận nhanh: \(H\approx0.5\) → không bền lâu; H>0.5 → bền lâu; H<0.5 → anti-persistence (đảo chiều nhanh).

(nd: shifting-mean models)

Thuật ngữ “shifting-mean models” không phải là một thuật ngữ chuẩn trong khoa học dữ liệu hay thống kê. Tuy nhiên, nó có thể được hiểu là các mô hình hoặc kỹ thuật xử lý dữ liệu mà trong đó, giá trị trung bình của một tập dữ liệu thay đổi hoặc dịch chuyển theo thời gian hoặc theo một đặc điểm nào đó.

Mean Shift Algorithm (Thuật toán dịch chuyển trung bình):
Trong học máy, Mean Shift là một thuật toán phổ biến được dùng để phân cụm (clustering) và phân đoạn hình ảnh (image segmentation). Thuật toán này không tạo ra các cụm với hình dạng xác định trước (non-parametric) và hoạt động dựa trên ý tưởng tìm kiếm các đỉnh (modes) của một hàm mật độ. Cách hoạt động:
1. Chọn ngẫu nhiên một điểm dữ liệu làm tâm ban đầu (centroid).
2. Tính toán giá trị trung bình của tất cả các điểm dữ liệu nằm trong một bán kính (bandwidth) nhất định xung quanh tâm này.
3. Dịch chuyển tâm ban đầu đến giá trị trung bình vừa tính được.
4. Lặp lại quá trình này cho đến khi tâm không còn dịch chuyển đáng kể nữa, tức là đã hội tụ về một đỉnh mật độ.
5. Những điểm dữ liệu cuối cùng hội tụ về cùng một đỉnh sẽ được gán vào cùng một cụm.
Thuật toán Mean Shift rất hữu ích vì nó không yêu cầu phải xác định trước số lượng cụm (như K-Means) và có thể phát hiện các cụm có hình dạng phức tạp.

Ứng dụng trong chuỗi thời gian
Trong phân tích chuỗi thời gian (time series), khái niệm “shifting mean” có thể ám chỉ sự thay đổi trong giá trị trung bình của dữ liệu theo thời gian, được gọi là trung bình động (Moving Averages). Đây là một kỹ thuật làm mịn dữ liệu để làm nổi bật xu hướng dài hạn bằng cách loại bỏ các biến động ngắn hạn hoặc theo mùa. Cách hoạt động:
+ Tính giá trị trung bình của một “cửa sổ” dữ liệu di động (ví dụ: trung bình của 12 tháng gần nhất).
+ Cửa sổ này sẽ dịch chuyển dần theo thời gian, tạo ra một chuỗi giá trị trung bình mới, phản ánh xu hướng chung.

Khác biệt chính
“Shifting Mean” (trong chuỗi thời gian): Một kỹ thuật để phân tích xu hướng của dữ liệu bằng cách tính toán các giá trị trung bình động.
Mean Shift (trong phân cụm): Một thuật toán lặp đi lặp lại để tìm các cụm bằng cách dịch chuyển các tâm cụm đến các vùng có mật độ dữ liệu cao hơn.

II.3. Tổng thể hỗn hợp (Mixed Populations)

Lũ lụt ở một số lưu vực sông xảy ra do các loại hiện tượng khí tượng khác nhau, gắn liền với các quá trình vật lý riêng biệt. Ví dụ, lũ có thể bắt nguồn từ tuyết tan, mưa giông, hoặc sự kết hợp của cả hai yếu tố này (Jarrett và Costa, 1988). Một bộ số liệu như vậy có thể không đồng nhất và có thể cần xử lý đặc biệt. Tổng thể hỗn hợp này dẫn đến các đường tần suất lũ có hệ số lệch rất lớn, được phản ánh qua sự thay đổi độ dốc bất thường khi vẽ trên giấy xác suất chuẩn theo thang logarit.

Trong một số trường hợp, đường tần suất của các trận lũ hàng năm có thể được mô tả tốt nhất bằng cách tính riêng đường cong cho từng loại sự kiện, rồi sau đó kết hợp các kết quả lại.

Một ví dụ về tổng thể hỗn hợp là sự kết hợp giữa dòng chảy do mưa và do tuyết tan. Tại vùng Sierra Nevada ở California, các yếu tố và mối quan hệ thủy văn trong các trận lũ mùa đông thông thường thường rất khác so với các trận lũ do tuyết tan mùa xuân hoặc lũ cục bộ do mưa dông mùa hè. Tại đây, đỉnh lũ ở vùng thấp chủ yếu do mưa mùa đông, còn ở vùng cao thì đỉnh lũ thường do tuyết tan mùa xuân hoặc mưa trên nền tuyết. Các nghiên cứu tần suất ở vùng Sierra Nevada đã được thực hiện riêng cho lũ do mưa (chủ yếu từ tháng 11 đến tháng 3) và lũ do tuyết tan (từ tháng 4 đến tháng 7). Các đỉnh lũ được phân loại theo nguyên nhân – chủ yếu do tuyết tan và chủ yếu do mưa. Tương tự, tại dãy Colorado Front Range, đỉnh lũ xảy ra trong mùa xuân và hè là kết quả của cả mưa và tuyết tan, đặc biệt ở vùng chân núi thấp.

Lũ lụt ở miền Đông Hoa Kỳ là kết quả từ sự pha trộn của nhiều cơ chế gây lũ khác nhau, trong đó các xoáy thuận nhiệt đới và hệ thống ngoài vùng nhiệt đới đóng vai trò trung tâm. Dọc theo bờ biển Đại Tây Dương và Vịnh Mexico, trong một số trường hợp, lũ do bão và không do bão đã được tách biệt, từ đó cải thiện độ chính xác trong ước lượng tần suất lũ. Một ví dụ khác về tổng thể hỗn hợp là lũ do tắc nghẽn băng xảy ra ở các vùng phía Bắc.

Dữ liệu khí hậu thủy văn (hydroclimatological), bao gồm việc sử dụng các mô hình thời tiết đồng thời (synoptic weather patterns), đặc biệt hữu ích trong việc cung cấp thông tin độc lập, có cơ sở vật lý về các quá trình gây lũ liên quan đến khí hậu, và để phân loại chuỗi số liệu lũ theo từng loại. Ngoài ra, các dữ liệu khác như dữ liệu cổ về thủy văn (paleohydrologic) và dữ liệu cổ về khí hậu (paleoclimate) cũng có thể được xem xét. Các kiểu lũ và cơ chế nguyên nhân cụ thể cũng có thể được nghiên cứu dưới góc nhìn lưu vực, bằng cách xem xét các biến số như lượng mưa và thời lượng mưa, tính mùa vụ của lũ, thời gian xuất hiện và phản ứng dòng chảy.

Khi có thể chứng minh rằng có hai hay nhiều nguyên nhân khác nhau và nhìn chung là độc lập gây ra lũ, thì việc phân tách dữ liệu lũ theo nguyên nhân, phân tích và tính toán các đường tần suất riêng cho từng loại sự kiện và sau đó gộp các đường này lại để phân tích tổng thể về tần suất lũ tại vị trí nghiên cứu sẽ là cách làm đáng tin cậy hơn. Có thể tham khảo các quy trình như được mô tả trong Crippen (1978), U.S. Army Corps of Engineers (1982), Jarrett và Costa (1988), và Murphy (2001). Đối với các tình huống lũ do băng trôi, có thể áp dụng cách tiếp cận phân phối hỗn hợp tương tự (Murphy, 2001), hoặc sử dụng một phương pháp tập trung vào cao độ cực đại (Vogel và Stedinger, 1984).

Một ví dụ về việc kết hợp các đường tần suất đã được thực hiện tại khu vực Black Hills như một phần trong ước lượng tần suất lưu lượng đỉnh lũ cho South Dakota (Sando và cộng sự, 2008). Alila và Mtiraoui (2002) mô tả thêm các ví dụ khác. Trong một số tình huống, có thể không có đủ dữ liệu để thực hiện phân tích phân phối hỗn hợp, hoặc kết quả có thể không đáng tin cậy như mong muốn (Gotvald và cộng sự, 2012). Nhóm công tác đã không tiến hành đánh giá các quy trình này. Cần có thêm nỗ lực để cung cấp hướng dẫn về việc nhận diện và xử lý các phân phối hỗn hợp.

Phân tách theo các khoảng thời gian trên lịch thay vì theo sự kiện không được xem là hợp lý về mặt thủy văn, trừ khi các sự kiện trong các khoảng thời gian khác nhau đó rõ ràng do các điều kiện thủy khí tượng khác nhau gây ra. Các quy trình hiệu chỉnh trong Hướng dẫn này có thể được sử dụng để hiệu chỉnh riêng từng chuỗi số liệu lũ, với ngoại lệ rằng hệ số lệch vùng không được sử dụng trừ khi nó được phát triển dành riêng cho các loại sự kiện đang được xem xét. Nếu các sự kiện lũ được cho là bao gồm hai hoặc nhiều tổng thể nhưng không thể xác định và phân tách chúng dựa trên một tiêu chí khách quan và có ý nghĩa thủy văn, thì chuỗi số liệu đó sẽ được xử lý như là thuộc về một tổng thể duy nhất.

II.4. Biến đổi lưu vực

Ngày càng trở nên khó khăn hơn để tìm được các lưu vực mà chế độ dòng chảy chưa bị thay đổi do những biến đổi đối với lòng sông, vùng ngập lũ, việc xây dựng hoặc phá hủy các hồ chứa và đê điều, hoặc các thay đổi đối với đặc điểm tổng thể của lưu vực (ví dụ: đô thị hóa, cháy rừng, thay đổi phương thức canh tác, kiểm soát xói mòn, thoát nước, hoặc phá rừng). Các hoạt động phát triển có thể làm thay đổi điều kiện dòng chảy bao gồm: đô thị hóa, nắn dòng, thoát nước nông nghiệp, đê điều và việc xây dựng các hồ chứa, công trình chuyển hướng dòng chảy, và thay đổi điều kiện thảm phủ mặt đất (Sauer và cộng sự, 1983). Các khu vực không thấm nước trong lưu vực và ảnh hưởng của chúng đến dòng chảy cũng là những yếu tố quan trọng cần xem xét (Moglen, 2009).

Lịch sử lưu vực và các hồ sơ lũ nên được xem xét cẩn thận để đảm bảo rằng không có thay đổi lớn nào trong lưu vực đã xảy ra trong suốt thời gian ghi nhận dữ liệu. Các tài liệu đi kèm với hồ sơ lũ thường liệt kê những thay đổi đã xảy ra vào các thời điểm riêng biệt. Tuy nhiên, những ảnh hưởng do đô thị hóa hoặc việc xây dựng hàng loạt hồ chứa nhỏ trong nhiều năm có thể sẽ không được ghi chép lại. Những thay đổi dần dần như vậy có thể không làm thay đổi rõ rệt chế độ dòng chảy từ năm này sang năm khác, nhưng ảnh hưởng tích lũy lại có thể rất đáng kể.

Cần có nỗ lực đặc biệt để xác định các chuỗi số liệu không đồng nhất. Các công cụ phân tích dữ liệu được mô tả trong phụ lục 4 có thể được sử dụng để đánh giá các hồ sơ về các xu thế dần dần hoặc sự thay đổi có thể liên quan đến sự thay đổi lưu vực. Các ước lượng không gian và thời gian về sử dụng đất bên trong lưu vực nên được thu thập khi có thể. Những dữ liệu này đặc biệt hữu ích trong việc định lượng tác động của đô thị hóa đến tần suất lũ (Moglen và Beighley, 2002; McCuen, 2003).

Chỉ nên sử dụng những chuỗi số liệu đại diện cho điều kiện lưu vực tương đối ổn định để phân tích tần suất (Konrad, 2003; Moglen và Shivers, 2006). Trong một số trường hợp, các hồ sơ dòng chảy có thể được điều chỉnh để phản ánh điều kiện lưu vực hiện tại, khi có bằng chứng vật lý về sự thay đổi lưu vực xảy ra trong một phần đáng kể của lưu vực (McCuen, 2003). Nhóm công tác không đánh giá các phương pháp để xử lý sự thay đổi lưu vực và không đưa ra khuyến nghị cụ thể nào, vì cần có thêm nghiên cứu trong lĩnh vực này.

II.5. Biến đổi khí hậu

Hiện nay có nhiều lo ngại về thay đổi rủi ro lũ lụt liên quan đến biến động khí hậu và biến đổi khí hậu dài hạn. Tính bất biến theo thời gian đã được giả định trong quá trình xây dựng các Hướng dẫn này. Tuy nhiên, trong những trường hợp có đủ bằng chứng khoa học để định lượng rõ ràng tác động của biến đổi khí hậu hoặc thay đổi rủi ro lũ lụt, thì kiến thức này cần được đưa vào phân tích tần suất lũ bằng cách sử dụng các tham số thay đổi theo thời gian hoặc các kỹ thuật thích hợp khác. Tất cả các phương pháp áp dụng đều cần được ghi chép và chứng minh rõ ràng.

Nhóm công tác không thực hiện đánh giá các phương pháp xử lý biến đổi khí hậu trong phân tích tần suất lũ. Do đó, cần có thêm nhiều nghiên cứu trong lĩnh vực này. Một số thông tin và kiến thức nền về tính không ổn định theo thời gian đã được trình bày trong các tài liệu của Olsen và cộng sự (2010) và Kiang và cộng sự (2011). Trong thời gian chờ đợi, các nhà phân tích có thể cân nhắc các nguồn dữ liệu và phương pháp sau:

Dữ liệu về các kiểu thời tiết tổng hợp – Data on synoptic weather patterns (Hirschboeck, 1987b);
Thông tin về khí hậu cổ – Paleoclimate information (Redmond và cộng sự, 2002);
Thông tin về biến động khí hậu và dự báo khí hậu – Climate variability and climate projection information (Brekke và cộng sự, 2009);
Biến động khí hậu trong năm và theo chu kỳ nhiều thập kỷ – Interannual and interdecadal variations in climate (Jain và Lall, 2001);
Các tham số phân phối thay đổi theo thời gian – Time-varying distribution parameters (Stedinger và Griffis, 2011; Salas và Obeysekera, 2014).

Hỗ trợ duy trì trang:

Tôi xây dựng trang này để chia sẻ các tài liệu kỹ thuật cốt lõi trong thiết kế hạ tầng giao thông.

Nếu bạn thấy nội dung hữu ích và muốn góp phần duy trì trang hoạt động bền vững, tôi rất trân trọng mọi sự ủng hộ.

Qua USD (Buy Me a Coffee)

BIDV • STK: 3101226659 • HOANG HAI HA

Updated on August 26, 2025