Khi xây dựng đường cong tần suất lũ, nhà phân tích nên xem xét tất cả thông tin sẵn có. Các loại dữ liệu và thông tin tổng quát có thể được đưa vào trong phân tích tần suất lũ được trình bày trong các phần sau, cùng với cách đặc trưng hóa tốt nhất các dữ liệu hiện có. Phân tích tần suất lũ chủ yếu dựa vào các hồ sơ đo đạc có hệ thống, vốn thường có thể được biểu diễn dưới dạng các quan trắc điểm. Các loại dữ liệu khác, chẳng hạn như dữ liệu lịch sử và dữ liệu lũ cổ, có thể được biểu diễn dưới dạng khoảng hoặc ngưỡng, do độ lớn của đỉnh lũ có thể chỉ được biết đến với độ chính xác thấp hơn. Nhà phân tích cũng cần xem xét việc sử dụng thông tin khu vực và các ước lượng lũ từ lượng mưa. Các ứng dụng cụ thể sẽ được trình bày trong những phần sau của Hướng dẫn này.
I.1. Sử dụng chuỗi cực đại hàng năm
Các sự kiện lũ có thể được phân tích bằng cách sử dụng chuỗi cực đại năm (Annual Maximum Series – AMS) hoặc chuỗi thời đoạn (partial-duration series – PDS). AMS được dựa trên giá trị cực đại của đỉnh lũ trong mỗi năm. Lũ cực đại theo trung bình ngày hoặc cực đại hàng năm theo số ngày n (U.S. Army Corps of Engineers, 1993; Lamontagne and others, 2012) cũng có thể được xem xét, tùy thuộc vào mục đích sử dụng của quan hệ tần suất lũ. Một PDS được thu nhận bằng cách lấy tất cả các đỉnh lũ lớn hơn hoặc bằng một ngưỡng cơ sở lũ xác định trước. Do đó, một chuỗi có n năm có thể có m đỉnh lũ với m > n.
Ước tính tần suất lũ sử dụng Hướng dẫn này phù hợp cho lũ có AEP 0.10 hoặc nhỏ hơn (Qₚ > Q₀.₁₀), trong đó AEP p ≤ 0.1, chẳng hạn như 0.01. Chuỗi cực đại năm cung cấp một mẫu đủ tốt cho kiểu phân tích này. Có rất ít khác biệt giữa các ước lượng khi sử dụng chuỗi cực đại năm hoặc chuỗi thời đoạn đối với các AEP tương ứng với xác suất lũ hiếm này (Langbein, 1949). Chuỗi cực đại năm cũng được sử dụng do tính phổ biến và chiều dài chuỗi dữ liệu mở rộng. Dữ liệu chuỗi thời đoạn còn hạn chế và việc xác định ngưỡng PDS còn gặp nhiều thách thức (Madsen and others, 1997).
Nếu các trận lũ nhỏ được quan tâm, với Qₚ ≤ Q₀.₁₀ (tức AEP lớn hơn 0.10), thì PDS có thể phù hợp. Cơ sở của PDS được chọn để đảm bảo rằng tất cả các sự kiện có liên quan đều được đánh giá. Một vấn đề lớn thường gặp khi sử dụng PDS là phải định nghĩa các sự kiện lũ sao cho tất cả các sự kiện đều độc lập với nhau. Thực tiễn phổ biến là thiết lập một ngưỡng thực nghiệm để phân tách các sự kiện lũ (Lang and others, 1999). Cơ sở cho việc phân tách sẽ phụ thuộc vào người nghiên cứu và mục đích sử dụng. Không có hướng dẫn cụ thể nào được khuyến nghị cho việc xác định các sự kiện lũ cần được đưa vào PDS.
Beard (1974) đã cố gắng xác định xem có tồn tại một mối quan hệ nhất quán giữa AMS và PDS hay không, nhằm sử dụng mối quan hệ đó để chuyển đổi từ AMS sang PDS. Dựa trên nghiên cứu đó, khuyến nghị rằng PDS nên được xây dựng từ dữ liệu quan trắc. Một giải pháp thay thế — tuy kém chính xác hơn — là chuyển đổi từ AMS sang PDS bằng cách sử dụng một hệ số.
Các quy trình được mô tả trong các Hướng dẫn này áp dụng cho AMS. Nếu cần ước lượng lũ nhỏ hơn (ví dụ: \(Q_p \leq Q_{0.10}\), như \(Q_{0.95}\)), thì phân tích tần suất sử dụng dữ liệu PDS, chẳng hạn như phương pháp đếm đỉnh vượt ngưỡng (Stedinger and others, 1993; Coles, 2001), có thể là phù hợp. Tuy nhiên, không có hướng dẫn cụ thể nào được đề xuất trong tài liệu này cho việc thực hiện phân tích tần suất theo PDS.
I.2. Nguồn dữ liệu tại một vị trí
Các nguồn dữ liệu chính được khuyến nghị sử dụng trong phân tích tần suất lũ bao gồm: dữ liệu hệ thống, thông tin lũ lịch sử, dữ liệu lũ cổ và thông tin thực vật. Các dữ liệu lũ tại chỗ này được mô tả ngắn gọn; thông tin bổ sung về nguồn dữ liệu được trình bày trong Phụ lục 3. Tham khảo phần Thuật ngữ (Glossary) để biết các định nghĩa và ký hiệu liên quan đến dữ liệu.
I.2.1. Dữ liệu hệ thống (Systematic Records)
Dữ liệu lũ hệ thống bao gồm các giá trị đỉnh lưu lượng hàng năm được thu thập định kỳ, tại các khoảng thời gian đều đặn tại các trạm đo lưu lượng (Salas and others, 1994; Wahl and others, 1995). Dữ liệu lũ hệ thống liên quan đến việc quan trắc liên tục các đặc trưng của lũ do các nhà thủy văn thực hiện (Rantz and others, 1982a; Baker, 1987). Tại Hoa Kỳ, USGS (Cơ quan Khảo sát Địa chất Hoa Kỳ) vận hành và duy trì một mạng lưới trạm đo trên toàn quốc (Wahl and others, 1995), và đây là nguồn dữ liệu chính cho dữ liệu lũ hệ thống. Các trạm đo dòng chảy cũng được vận hành bởi các cơ quan liên bang (ví dụ: Cục Khai hoang và Binh đoàn Công binh Hoa Kỳ), các cơ quan bang (ví dụ, bang California, Colorado), các cơ quan địa phương và các doanh nghiệp tư nhân.
Dữ liệu được sử dụng phổ biến trong phân tích tần suất lũ thường là các giá trị đỉnh lưu lượng hàng năm hoặc các giá trị lưu lượng vượt một ngưỡng cơ sở xác định trước (PDS). Phần lớn các giá trị đỉnh lưu lượng hàng năm được thu thập từ chuỗi số liệu liên tục của mực nước hoặc từ các quan trắc định kỳ được cung cấp bởi thiết bị đo đỉnh lũ (crest-stage gauge – CSG, xem hình 1). Dữ liệu từ thiết bị đo có thể cung cấp thông tin chỉ về các đỉnh lũ vượt một mức ngưỡng đã chọn trước. Các dữ liệu này thường là liên tục, mặc dù có thể có các năm thiếu số liệu hoặc không có dòng chảy.
Phân tích thống kê các dữ liệu này là cơ sở chính để xác định đường tần suất dòng chảy cho từng trạm. Phần lớn các dữ liệu này có sẵn trong Hệ thống Thông tin Nước Quốc gia (NWIS) của USGS và các tệp điện tử khác; thông tin bổ sung, cả đã công bố và chưa công bố, có thể được tìm thấy từ nhiều nguồn khác nhau (phụ lục 3).

I.2.2. Thông tin lũ lịch sử (Historical Flood Information)
Tại nhiều địa điểm — đặc biệt là những nơi người dân đã sinh sống lâu dài trên vùng ngập lũ, hoặc nơi các công trình dân dụng đã được xây dựng bởi các cơ quan liên bang hoặc tổ chức khác — thường có thông tin về các trận lũ lớn đã xảy ra trước hoặc sau giai đoạn thu thập dữ liệu hệ thống.

Những thông tin tương tự cũng có thể có tại các vị trí mà trạm đo đã ngừng hoạt động, hoặc nơi mà hồ sơ bị thiếu hoặc không đầy đủ. Dữ liệu về các trận lũ gần đây xảy ra ngoài khoảng thời gian thu thập dữ liệu hệ thống cũng được xem là lũ lịch sử. Thông tin lũ lịch sử này thường có thể được sử dụng để ước tính lưu lượng đỉnh. Nó cũng có thể xác định một khoảng thời gian mở rộng trong đó các trận lũ lớn nhất — dù được ghi nhận hay từ lịch sử — đều đã biết. Trong nhiều trường hợp, người ta để lại một dấu mốc vật lý, thể hiện mực nước lũ cao nhất ước lượng (Koenig and others, 2016) trên một bề mặt tương đối cố định (xem hình 2). Cao trình của dấu mốc mực nước lũ này phải được gắn với một mốc chuẩn đã biết để có thể xác định lưu lượng đỉnh từ mối quan hệ giữa mực nước và lưu lượng được thiết lập sau khi trận lũ xảy ra.
Dữ liệu lịch sử là nguồn thông tin quý giá được sử dụng trong phân tích tần suất như sau: Gọi \(n_s\) là số năm trong chuỗi dữ liệu hệ thống (trạm đo), \(n_h\) là số năm trong giai đoạn lịch sử và n là tổng số năm của chuỗi dữ liệu, trong đó \(n_s + n_h = n\). Gọi \(T_h\) là ngưỡng cảm nhận lưu lượng, biểu thị mức mà tại đó người ta có thể xác định rằng lũ đã vượt hoặc không vượt qua mức này trong giai đoạn lịch sử (xem hình 3). Dữ liệu lũ lịch sử được biểu diễn bởi các đỉnh lũ lịch sử \(e_h\) và các đỉnh lũ hệ thống \(e_s\) vượt qua ngưỡng \(T_h\) trong toàn bộ giai đoạn lũ n.
Ngoài ra còn có thông tin cho thấy trong giai đoạn lịch sử \(n_h\), có nhiều năm không có lũ nào vượt ngưỡng \(T_h\) (được thể hiện bằng vùng tô xám trong hình 3). Tổng số trận lũ vượt qua ngưỡng cảm nhận này là k, trong đó \(k = e_s + e_h\). Phần Data Representation Using Flow Intervals and Perception Thresholds trình bày về cách xác định giai đoạn lịch sử \(n_h\) và cách ước lượng các ngưỡng cảm nhận \(T_h\).
Dữ liệu lịch sử phục vụ cho phân tích tần suất lũ thường bao gồm ba loại sau, giúp mở rộng thông tin theo thời gian về độ lớn của các trận lũ:
- Ước lượng các trận lũ lớn xảy ra trước (ngoài phạm vi) chuỗi số liệu trạm đo (hình 4);
- Một trận lũ cực lớn và thông tin cho thấy một (hoặc nhiều) trận lũ trong chuỗi số liệu trạm đo thực tế là trận lớn nhất trong một khoảng thời gian dài hơn n so với độ dài của chuỗi trạm đo \(n_s\) (hình 5); và
- Thông tin cho thấy không có trận lũ nào vượt qua một giá trị nhất định \(T_h\) (thông tin không vượt ngưỡng) trong một khoảng thời gian dài hơn \(n_h\) (hình 6).
Một ví dụ được sử dụng để minh họa cho từng tình huống.
Trong trường hợp đầu tiên, có ba trận lũ lịch sử xảy ra trước khi chuỗi số liệu trạm đo được thiết lập. Biết rằng các trận lũ này đã vượt qua ngưỡng cảm nhận 18.000 ft³/s. Ba trận lũ này là lớn nhất được ghi nhận, mở rộng chuỗi quan trắc thêm 35 năm (1895–1929), và là quan trọng nhất cho việc ước lượng tần suất lũ (hình 4).
Trong trường hợp thứ hai, có một trận lũ cực lớn xảy ra vào tháng 6 năm 1965 (Matthai, 1969, tr. B39). Trận lũ này là lớn nhất trong chuỗi trạm đo kéo dài 48 năm (1948–1989), và có thông tin về lũ lịch sử và lũ cổ cho thấy trận lũ này có thể là lớn nhất trong hơn 900 năm (Osterkamp và Costa, 1987) (hình 5), chứ không chỉ lớn nhất trong 48 năm. Phân tích chi tiết hơn về tình huống trận lũ đặc biệt này được trình bày trong phần Extraordinary Floods.
Trong trường hợp thứ ba, có thông tin từ một đặc điểm vật lý, chẳng hạn như cầu hoặc thềm sông, nơi không có trận lũ nào vượt qua một ngưỡng cảm nhận. Từ các khảo sát chi tiết tại các thềm sông dọc theo sông North Platte gần đập Seminoe, cho thấy không có trận lũ nào vượt quá 45.000 ft³/s trong suốt 7.000 năm qua (Levish, 2002; Levish and others, 2003) (hình 6). Phân tích chi tiết về tình huống này được trình bày trong phần Paleoflood and Botanical Information .

Hình 3. Biểu đồ minh họa một chuỗi thời gian lưu lượng đỉnh với một giai đoạn lịch sử và một ngưỡng cảm nhận lưu lượng \(T_h\). Vùng tô xám biểu thị các trận lũ có độ lớn không xác định nhưng nhỏ hơn \(T_h\) trong giai đoạn lịch sử \(n_h\). Các thanh đen thẳng đứng trong giai đoạn lịch sử biểu thị các khoảng lưu lượng theo năm cho các quan sát không được ghi chép. Ngưỡng cảm nhận \(T_h\) được thể hiện bằng một đường màu xanh lá. Các trận lũ lịch sử vượt ngưỡng cảm nhận (3 năm) được biểu diễn bằng các tam giác đen. Các lưu lượng đỉnh của hệ thống (trạm đo) được biểu diễn bằng các vòng tròn đen.
USGS bao gồm một số thông tin về lũ lịch sử trong các báo cáo đã xuất bản và trên mạng. Thông tin bổ sung có thể được thu thập từ hồ sơ của các cơ quan khác, trích xuất từ các bài báo, hoặc thu thập thông qua điều tra và khảo sát chuyên sâu gần khu vực cần thông tin về tần suất lũ (Thomson and others, 1964). Các báo cáo do các cơ quan liên bang (chẳng hạn như Binh đoàn Công binh Hoa Kỳ và Cục Khai hoang) chuẩn bị để trình Quốc hội nhằm xin cấp vốn cho các dự án công trình dân dụng thường bao gồm thông tin lũ lịch sử nhằm chứng minh sự cần thiết của dự án.
Các báo cáo này có sẵn tại nhiều trường đại học và thư viện công cộng trên toàn quốc. Các nguồn dữ liệu có thể được sử dụng để xác định giai đoạn lịch sử \(n_h\), ngưỡng cảm nhận \(T_h\), và các trận lũ lớn nằm ngoài chuỗi số liệu trạm đo được trình bày trong phụ lục 3.

Hình 4. Biểu đồ minh họa một vị trí ví dụ có ba trận lũ lớn trong lịch sử xảy ra ngoài phạm vi chuỗi số liệu trạm đo, tại sông Big Sandy ở Bruceton, bang Tennessee, trạm đo số 03606500 USGS. Ba trận lũ lịch sử này được biết là đã vượt ngưỡng cảm nhận \(T_h\) là 18.000 (ft³/s).

Hình 5. Biểu đồ minh họa một vị trí ví dụ có đỉnh lũ đặc biệt đại diện cho một khoảng thời gian dài hơn, tại suối Plum gần Louviers, bang Colorado, trạm đo số 06709500 USGS. Một đoạn ngắt tỉ lệ được sử dụng để tách dữ liệu từ trạm đo khỏi giai đoạn lịch sử/lũ cổ kéo dài hơn. Các đường ngang biểu thị xấp xỉ giai đoạn lịch sử \(n_h\) và ngưỡng cảm nhận \(T_h\).

Hình 6. Biểu đồ minh họa một vị trí ví dụ với thông tin không vượt ngưỡng từ dữ liệu lịch sử/lũ cổ, tại sông North Platte gần hồ chứa Seminoe, bang Wyoming (Levish and others, 2003). Một đoạn ngắt tỉ lệ được sử dụng để tách dữ liệu trạm đo khỏi giai đoạn lịch sử/lũ cổ kéo dài hơn. Trong suốt 7.000 năm qua dọc theo dòng sông, không có trận lũ nào vượt quá ngưỡng cảm nhận ThT_h là 45.000 ft³/s; trong khi đó, các trận lũ lớn nhất trong chuỗi số liệu trạm đo chỉ đạt 20.000 ft³/s.
Trong vài thập kỷ qua, các dữ liệu và thông tin về lũ lịch sử đã được chứng minh là cực kỳ giá trị trong phân tích tần suất lũ (Leese, 1973; Condie và Lee, 1982; Stedinger và Cohn, 1986, 1987; Cohn and others, 1997; England and others, 2003a). Dalrymple (1960) ghi nhận như sau:
“Các trận lũ lịch sử có lẽ cung cấp nguồn dữ liệu hiệu quả nhất hiện có để làm cơ sở xác định tần suất lũ, và khi các dữ liệu này là đáng tin cậy, thì thông tin này cần được ưu tiên hàng đầu trong việc xây dựng biểu đồ tần suất lũ.”
Thông tin về lũ lịch sử nên được thu thập và ghi chép lại bất cứ khi nào có thể. Việc sử dụng dữ liệu lịch sử giúp đảm bảo rằng các ước lượng phù hợp với kinh nghiệm thực tế của cộng đồng và cải thiện độ chính xác của việc xác định tần suất. Thông tin này đặc biệt giá trị trong phân tích tần suất lũ vì nó trực tiếp đóng góp các dữ liệu về những trận lũ cực đoan có xác suất vượt hàng năm rất thấp.
I.2.3 Thông tin về lũ cổ và thực vật học (Paleoflood and Botanical Information)
Trong hơn 40 năm qua, đã có những bước tiến và phát triển đáng kể trong lĩnh vực thủy văn lũ cổ (paleoflood hydrology) (Costa, 1978, Costa 1987; Baker 1987; Jarrett, 1991; House and others, 2002a), cùng với việc gia tăng sử dụng dữ liệu lũ cổ trong các nghiên cứu tần suất lũ do các cơ quan liên bang và nhiều tổ chức khác thực hiện (Jarrett và Tomlinson, 2000; Levish and others, 2003; Sutley and others, 2008; Harden and others, 2011; O’Connor and others, 2014).
Thủy văn lũ cổ chủ yếu nghiên cứu các trận lũ xảy ra trước thời kỳ có ghi chép của con người. Lũ cổ khác với lũ lịch sử ở chỗ: chúng được xác định dựa trên bằng chứng địa chất và vật lý về các trận lũ trong quá khứ, thay vì dựa trên ký ức cộng đồng hoặc hồ sơ từ công trình xây dựng. Thủy văn lũ cổ tập trung vào bằng chứng trực tiếp của các trận lũ lớn, hiếm gặp — hoặc bằng chứng cho thấy không có lũ — tại một địa điểm nhất định. Đây là thông tin quan trọng cho việc ước lượng tần suất xuất hiện của các trận lũ như vậy (Baker, 1987; Baker and others, 2002).
Những trận lũ cực lớn thường tạo ra các thay đổi có ý nghĩa về mặt hình thái địa mạo đối với các vùng ngập lũ và thềm sông, đồng thời để lại dấu tích của các mực nước lũ trong hồ sơ địa chất tồn tại lâu dài theo thời gian.
Dữ liệu lũ cổ có liên quan đến phân tích tần suất lũ thường bao gồm các yếu tố sau:
- Dấu tích mức nước cổ (paleostage indicators – PSIs): là bằng chứng rời rạc về mực nước lũ lớn nhất;
- Thông tin về giới hạn không vượt ngưỡng (nonexceedance bound): là các khoảng thời gian mà lưu lượng không vượt qua một giá trị nhất định (Levish, 2002).
(nd: PSIs)
PSI (paleostage indicators) – các “dấu tích mực nước cổ” dùng để suy ra mực nước đỉnh (và từ đó là lưu lượng đỉnh) của các trận lũ trong quá khứ. Các loại PSI thường gặp và ý nghĩa:
- Slackwater deposits (SWDs) – trầm tích nước tĩnh: lớp bột–sét/limon mịn lắng đọng trong các hốc, ngách, mái đá, vùng xoáy sau vật cản… nơi dòng chảy rất yếu khi lũ lớn tràn qua. Cao độ đỉnh lớp SWD ≈ mực nước đỉnh của trận lũ tạo ra nó. Có thể định tuổi (C-14, OSL) để gắn với mốc thời gian.
- Cobble & gravel flood bars (FBs) – bãi lũ sỏi–cuội: gờ/bãi vật liệu thô bị đẩy lên cao khi lũ mạnh. Vị trí và cao độ bãi cho biết mức năng lượng và mực nước của lũ đã hình thành nó.
- Tree scars – sẹo cây: vết trầy/xước, va đập do gỗ trôi, đá… trên thân cây tại cao độ mực nước lũ. Có thể dùng niên đại vòng cây để xác định năm xảy ra lũ.
- Erosional scars & scour lines – vết xói, đường cào xói: rãnh, vệt mài/xước trên bờ, vách đá hoặc công trình do dòng nước và vật liệu cuốn trôi tạo ra ở gần mực nước đỉnh.
- Silt lines – vạch bùn mịn: đường bùn/limon mỏng bám trên đá, tường, công trình ở cao độ mực nước đỉnh.
- Geomorphic surfaces (terraces) – mặt địa mạo (chủ yếu là thềm sông): bề mặt tương đối ổn định nằm sát sông. Nếu bề mặt này còn nguyên vẹn từ khi hình thành, nó đặt ra giới hạn không vượt (nonexceedance bound): kể từ lúc bề mặt ổn định đến nay, lũ chưa từng cao đến mức phá hủy nó → mực nước/lưu lượng đỉnh tối đa trong giai đoạn đó nhỏ hơn giới hạn này.
Cách dùng thực tế: đo cao độ của các PSI, định tuổi chúng (nếu cần), rồi dùng quan hệ thủy lực (mô hình một/hai chiều hoặc đường chuẩn mực nước) để chuyển mực nước → lưu lượng. Tập hợp nhiều PSI cho phép xây dựng chuỗi lũ lịch sử/lũ cổ để phân tích tần suất.
Các đặc điểm lũ cổ thường được sử dụng làm PSI cho phân tích tần suất lũ được minh họa ở hình 7 (Jarrett và England, 2002) và bao gồm:
- Trầm tích vùng nước tĩnh (SWDs) (Kite and others, 2002; House and others, 2002b),
- Cồn sỏi/cát (FBs) (Jarrett và England, 2002),
- Vết xước cây (tree scars) (Yanosky và Jarrett, 2002),
- Vết xói và rãnh xói (erosional scars and scour lines) (Jarrett và Malde, 1987),
- Silt lines (O’Connor and others, 1986; Koenig and others, 2016).
(nd: Trầm tích vùng nước tĩnh – SWD)
“slackwater deposits (SWDs)” là một thuật ngữ trong thủy văn – địa chất:
- Slackwater deposits (SWDs): nghĩa là trầm tích vùng nước tĩnh / trầm tích nước lặng.
- Chúng hình thành khi có một trận lũ lớn: dòng chảy mạnh ở sông chính sẽ tràn vào các khu vực bên cạnh (ví dụ: vịnh hẹp, hốc, vùng khuất sau ghềnh đá, hang động hoặc bậc thềm sông). Trong các chỗ này, vận tốc nước rất nhỏ (nước “tĩnh” hay “nước lặng”), khiến cho các hạt mịn (bùn, sét, cát mịn) lắng đọng lại.
- Vì thế, SWDs được coi là bằng chứng địa chất quan trọng để xác định mực lũ tối đa trong quá khứ: mỗi lớp trầm tích slackwater thường ghi lại một trận lũ lớn đã xảy ra.
Tóm lại:
“Slackwater deposits (SWDs)” là trầm tích nước lặng do lũ để lại, được dùng như một chỉ thị địa chất để nhận diện mực nước lũ cổ và phục vụ phân tích tần suất lũ.

(nd: Silt lines)
“silt lines” là một chỉ thị địa chất – thủy văn, có thể hiểu như sau:
- Silt lines là các đường trầm tích bùn mịn để lại trên vách đá, bờ sông, cây cối hoặc các bề mặt tự nhiên sau khi lũ rút.
- Khi xảy ra một trận lũ, dòng nước dâng cao, mang theo nhiều hạt mịn (silt – bùn mịn). Khi nước lắng xuống, bùn mịn bám thành lớp mỏng và tạo thành một vạch ngang rõ rệt ở mức nước cao nhất mà lũ đã đạt đến.
- Những đường này giống như “dấu mực nước” tự nhiên, được các nhà thủy văn – địa chất sử dụng để xác định cao trình mực nước lũ cực đại trong quá khứ.
Tóm lại: “silt lines” là các vạch bùn mịn đánh dấu mức nước lũ tối đa, được dùng như bằng chứng địa chất (paleoflood indicators) để nghiên cứu tần suất lũ.
Các bề mặt địa hình (chủ yếu là thềm sông) nằm liền kề với sông thường được dùng để đặt giới hạn cho lưu lượng dòng chảy nhằm ước lượng các ngưỡng không vượt (Levish, 2002).
Phương pháp và ứng dụng thu thập dữ liệu lũ cổ, bao gồm các tổng quan đầy đủ và hiện trạng kiến thức, được mô tả trong Baker and others (1988) và House and others (2002a). Trong nhiều trường hợp, bằng chứng lũ cổ có thể tồn tại hàng trăm đến hàng nghìn năm. Điều này cho phép các nhà thủy văn lũ và địa chất học thu thập lượng lớn dữ liệu liên quan đến những trận lũ lớn đã xảy ra trong một khoảng thời gian kéo dài.
Các nghiên cứu ứng dụng về lũ cổ và tần suất lũ (England and others, 2006; Harden and others, 2011) đã chỉ ra rằng bằng chứng này có thể giúp tăng đáng kể độ chính xác của các ước lượng tần suất lũ với chi phí tương đối thấp. Ngoài ra, những dữ liệu này hiện đã có sẵn — không nhất thiết phải chờ hàng chục năm để có được chuỗi số liệu dài hơn một cách đáng kể.
Dữ liệu lũ cổ được xử lý tương tự như dữ liệu lũ lịch sử trong phân tích tần suất lưu lượng lũ theo các Hướng dẫn này. Các ngưỡng cảm nhận lưu lượng được áp dụng cho từng giá trị lũ cổ cụ thể cũng như các giới hạn không vượt ngưỡng, kết hợp với khoảng tuổi tương ứng cho từng giai đoạn lũ cổ khác nhau. Trong một số trường hợp, một ngưỡng cảm nhận duy nhất (như trong hình 3) được mở rộng thành nhiều ngưỡng để xử lý các tập dữ liệu lũ cổ phức tạp hơn (xem phần Data Representation Using Flow Intervals and Perception Thresholds).
Thông tin về lũ cổ nên được thu thập và ghi nhận bất cứ khi nào có thể, đặc biệt trong những trường hợp chuỗi số liệu hệ thống còn ngắn hoặc các giá trị AEP quan tâm là nhỏ (≤ 0.01). Một số nguồn dữ liệu lũ cổ, bao gồm cả cách tiếp cận theo vùng, được liệt kê trong phụ lục 3.
Thông tin thực vật học (botanical information) bao gồm các loài thực vật ghi nhận dấu hiệu của một hoặc nhiều trận lũ và/hoặc thể hiện mức độ ổn định của một bề mặt địa hình trong một khoảng thời gian nhất định. Các dạng bằng chứng thực vật được sử dụng trong nghiên cứu thủy văn lũ cổ chủ yếu liên quan đến khảo sát tuổi cây, vị trí, sự phân bố và mức độ tổn thương của cây. Bốn loại bằng chứng thực vật chính liên quan đến lũ (Hupp, 1987) bao gồm:
- Vết sẹo do xói mòn (corrosion scars),
- Mầm bất định (adventitious sprouts),
- Tuổi cây (tree age),
- Dị thường trong vòng sinh trưởng (tree ring anomalies).
Các vết sẹo là đặc điểm tổn thương dễ quan sát nhất, mặc dù dấu hiệu bề ngoài có thể biến mất sau vài năm.
Các mầm cây thường mọc từ thân cây bị gãy hoặc nghiêng, đôi khi được gọi là “clipper ships” (hình 8). Tuổi của cây có thể được dùng để xác định niên đại của một trận lũ cụ thể hoặc một bề mặt địa hình đã bị ngập bởi lũ, hoặc để đánh giá mức độ ổn định tương đối của bề mặt đó. Tuổi của thảm thực vật trong cả hai trường hợp đều thể hiện tuổi tối thiểu kể từ khi bề mặt được hình thành. Trong một số trường hợp, thân cây có thể bị chôn một phần dưới trầm tích do lũ vận chuyển; khi đó, tuổi cây lớn hơn tuổi của bề mặt địa hình.
Các mẫu vòng sinh trưởng khác nhau (chẳng hạn như lệch tâm, thay đổi cấu trúc, thay đổi mạch dẫn, v.v.) có thể xảy ra do lũ. Hiện nay, phương pháp tin cậy và chính xác nhất để xác định thời điểm lũ dựa trên vòng cây là phân tích các nhân lõi hoặc mặt cắt tại các vết sẹo (Hupp, 1988). Sự hình thành vòng sinh trưởng hàng năm cho phép xác định thời điểm lũ chính xác đến từng năm, và đôi khi đến từng tuần (Yanosky và Jarrett, 2002).
Mô tả chi tiết của từng loại bằng chứng được trình bày trong các nghiên cứu của Sigafoos (1964); Yanosky (1983); Hupp (1987, 1988); và Yanosky và Jarrett (2002). Hupp và Osterkamp (1996) tổng quan vai trò của thảm thực vật trong các quá trình địa hình sông ngòi, bao gồm cả lũ cực đoan.
Trong phân tích tần suất lũ, thông tin thực vật học thường được mô tả dưới dạng quan sát binomial-censored tương ứng với các trận lũ vượt hoặc không vượt một ngưỡng cảm nhận. Một số nguồn dữ liệu thực vật được liệt kê trong phụ lục 3.
(nd: biomial-censored)
“binomial-censored observations” = các quan sát thuộc dạng chỉ biết Có/Không vượt ngưỡng.
Dữ liệu thực vật (sẹo cây, vòng năm, vạch bùn bám trên thân cây, v.v.) thường chỉ cho biết trong năm đó lũ có vượt một “ngưỡng cảm nhận” hay không, chứ không biết trị số đỉnh lũ.
- binomial: mỗi năm là một phép thử chỉ có 2 khả năng: vượt ngưỡng (1) hoặc không vượt (0). Tổng số năm vượt ngưỡng trong n năm tuân theo phân bố nhị thức với xác suất p=P(Q>T).
- censored: trị số Q thật bị “ẩn”; ta chỉ biết quan hệ của Q so với ngưỡng T.
Cách dùng trong ước lượng: nếu biết năm Y vượt ngưỡng \(T_Y\) thì đóng góp vào hàm khả năng là \(1-F(T_Y)\); nếu không vượt, là \(F(T_Y)\), với F là CDF của đỉnh lũ năm.
Khác với interval-censored: interval-censored cho ta một khoảng a<Q<b; binomial-censored chỉ cho Có/Không so với một ngưỡng.


I.3. Các vấn đề thường gặp với dữ liệu tại một vị trí
Có một số vấn đề phổ biến liên quan đến các chuỗi dữ liệu từ các trạm đo mà người phân tích cần xem xét và xử lý. Các vấn đề này bao gồm việc xử lý các chuỗi số liệu không đầy đủ, các trận lũ cực đoan, và các trận lũ nhỏ có ảnh hưởng tiềm tàng (PILFs).
I.3.1 Hồ sơ bị ngắt quãng, không đầy đủ và ngừng đo
Các đỉnh lũ hằng năm trong một số năm nhất định có thể bị thiếu do các nguyên nhân không liên quan đến độ lớn của lũ, chẳng hạn như việc tháo dỡ trạm đo. Những chuỗi dữ liệu này được coi là “bị ngắt quãng”; một ví dụ minh họa được thể hiện trong hình 9. Trong trường hợp này, người phân tích cần xác định xem các chuỗi dữ liệu có tương đương nhau hay không, và liệu có thêm thông tin lịch sử hoặc lũ cổ nào có thể giúp đặt các trận lũ lớn nhất vào trong một bối cảnh thời gian dài hơn (Paretti and others, 2014a, hình 4).
Các đoạn dữ liệu riêng biệt có thể được phân tích như một chuỗi liên tục với độ dài bằng tổng số năm của cả hai đoạn, nếu trạm đo được thiết lập lại tại một vị trí gần đó — trừ khi có sự thay đổi vật lý trong lưu vực giữa các đoạn, điều này có thể khiến toàn bộ chuỗi số liệu không còn đồng nhất. Dữ liệu từ trạm đo ở thượng lưu hoặc hạ lưu có thể cung cấp thông tin bổ sung để ước lượng một ngưỡng cảm nhận về độ lớn của các trận lũ xảy ra trong thời kỳ bị thiếu hoặc bị ngắt quãng.
Một hồ sơ “không đầy đủ” là chuỗi số liệu dòng chảy trong đó một số lưu lượng đỉnh bị thiếu do giá trị quá thấp hoặc quá cao để ghi nhận, hoặc do trạm đo không hoạt động trong một thời gian ngắn. Việc thiếu dữ liệu ở mức cao và thấp đòi hỏi cách xử lý khác nhau. Khi một hoặc nhiều giá trị đỉnh lũ hằng năm trong chuỗi dữ liệu hệ thống không được ghi nhận, thường vẫn có sẵn thông tin có thể dùng để ước lượng lưu lượng đỉnh, hoặc có thể thực hiện ước tính theo khoảng lưu lượng.
Ngưỡng cảm nhận (perception threshold) được sử dụng để mô tả kiến thức rằng lũ không được đo vượt quá một mức nhất định. Ví dụ, hệ thống NWIS cung cấp mã “8” để chỉ rằng lưu lượng vượt quá một giá trị đã chỉ định. Mã này và các mã khác trong NWIS được mô tả trong Asquith and other (2017), phụ lục 1.

Hình 9. Biểu đồ minh họa một trạm đo có chuỗi số liệu bị ngắt quãng, trạm 01614000 USGS, tại suối Back Creek gần Jones Springs, bang West Virginia. Các vùng tô xám biểu thị các trận lũ có độ lớn không xác định nhưng nhỏ hơn một ngưỡng cảm nhận \(T_d\) ft³/s (được thể hiện bằng một đường màu xanh lá) trong suốt chuỗi dữ liệu hệ thống \(n_s\) trước khi trạm đo bị dừng hoạt động. Các thanh đen thẳng đứng trong chuỗi dữ liệu hệ thống biểu diễn khoảng lưu lượng theo từng năm đối với các quan sát không được ghi nhận, với ngưỡng cảm nhận \(T_d\) được xác định dựa trên trận lũ tháng 3 năm 1936.
Tại một số trạm đo đỉnh lũ, đáy của thiết bị đo có thể không bị ngập trong một số năm. Hệ thống NWIS cung cấp mã “4” để chỉ rằng lưu lượng nhỏ hơn một giá trị đã định. Trong trường hợp này, một ngưỡng cảm nhận được thiết lập nhằm đại diện đúng cho các quan sát không đầy đủ có giá trị nhỏ hơn một ngưỡng nhất định. Trong hầu hết các trường hợp, cơ quan thu thập dữ liệu sẽ cung cấp thông tin để ước tính lưu lượng đỉnh, khoảng lưu lượng hoặc ngưỡng cảm nhận. Các ước lượng được thực hiện như một phần của phân tích tần suất lũ cần được ghi chép đầy đủ.
Dữ liệu dòng chảy tại nhiều vị trí vẫn có sẵn dù việc thu thập số liệu tại đó đã ngừng. Các trạm và chuỗi dữ liệu như vậy được coi là “ngừng đo” (discontinued), vẫn rất có giá trị và nên được sử dụng trong phân tích tần suất. Tại nhiều lưu vực, việc ghi nhận dữ liệu dòng chảy đã bị ngừng do phát triển lưu vực, chẳng hạn như xây dựng đập hoặc hồ chứa. Những chuỗi dữ liệu đã ngừng này có thể được mở rộng bằng cách sử dụng hồ sơ từ hồ chứa (phụ lục 3) kết hợp với một ngưỡng cảm nhận (hình 10).

Hình 10. Biểu đồ minh họa một trạm đo dòng chảy có chuỗi số liệu đã ngừng đo, được mở rộng bằng một ngưỡng cảm nhận lấy từ hồ sơ hồ chứa, trạm USGS số 07099500, tại sông Arkansas gần Pueblo, bang Colorado. Trạm đo bị ngừng vào năm 1975; các trận lũ kể từ đó không vượt quá ngưỡng cảm nhận \(T_d\) là 20.000 ft³/s, được thể hiện bằng một đường màu xanh lá.
Các trận lũ lớn xảy ra vào các năm 1864, 1893, 1894 (Follansbee và Sawyer, 1948), và trận lũ đặc biệt vào tháng 6 năm 1921 được mô tả là các quan sát theo khoảng (interval observations), được biểu diễn bằng các thanh dọc có đầu mũ đại diện cho giới hạn trên và dưới của ước lượng lưu lượng. Ngưỡng cảm nhận \(T_h\) cho giai đoạn lịch sử được thể hiện bằng một đường màu tím (magenta).
I.3.2 Lũ đặc biệt (Extraordinary Floods)
Lũ đặc biệt là những trận lũ có biên độ lớn nhất tại một trạm đo hoặc vị trí khảo sát và vượt trội đáng kể so với các quan sát lũ khác. Chúng có thể được ghi nhận từ số liệu tại trạm đo, từ các phép đo gián tiếp ở các vị trí khác, hoặc từ dữ liệu lũ lịch sử, lũ cổ (paleoflood), hoặc thông tin thực vật học — như đã trình bày trong các phần về thông tin lũ lịch sử và lũ cổ – thực vật học.
Những trận lũ này thường lớn hơn trận lũ có biên độ lớn thứ hai tại cùng một trạm đo, với hệ số lớn gấp hai lần, và trong một số trường hợp, có thể lớn hơn tới 35 lần. Có rất nhiều ví dụ về lũ đặc biệt trên khắp Hoa Kỳ, như:
- Trận lũ tháng 6 năm 1921 trên sông Arkansas ở Colorado (Hazen, 1930),
- Trận lũ kỷ lục năm 1954 trên sông Pecos ở Texas (Kochel and others, 1982; Lane, 1987),
- Trận lũ năm 1976 trên sông Big Thompson ở Colorado (Costa, 1978; Jarrett và Costa, 1988),
- Và trận lũ tháng 6 năm 2008 trên sông Cedar, Iowa (Eash, 2010).
Costa và Baker (1981) đã mô tả một số trận lũ đặc biệt diễn ra trong những khoảng thời gian dài hơn đáng kể so với chiều dài chuỗi số liệu quan trắc tại từng trạm. Costa và Jarrett (2008) cũng thảo luận về nhận dạng quá trình vật lý và các phương pháp đo gián tiếp khi ước tính biên độ của lũ đặc biệt, đồng thời lưu ý rằng mức độ bất định trong các ước tính này là rất lớn.
Những trận lũ đặc biệt đóng vai trò cực kỳ quan trọng vì các ước tính của chúng có ảnh hưởng lớn và trực tiếp đến việc hiệu chỉnh phân phối tần suất lũ. Chúng chính là các sự kiện quan trọng trong việc ước tính biên độ và tần suất lũ. Việc nhận dạng các trận lũ đặc biệt nên được thực hiện bằng cách sử dụng:
- Tỷ số đỉnh lũ (flood-peak ratios),
- Biểu đồ chuỗi thời gian (time-series plots),
- Các đường bao đỉnh lũ khu vực (regional flood-peak envelope curves) (Crippen và Bue, 1977; Asquith và Slade, 1995; O’Connor và Costa, 2004).
Phương pháp dùng để ước tính biên độ lũ đặc biệt và các tài liệu liên quan cần được xem xét để phát hiện các sai số tiềm ẩn, thu thập thêm thông tin về trận lũ, và đánh giá mức độ bất định (Costa và Jarrett, 2008).
Tất cả các quan sát về lũ đặc biệt cần được lưu giữ và sử dụng trong phân tích tần suất. Các trận lũ được ghi nhận này phản ánh khoảng thời gian dài hơn nhiều so với chiều dài chuỗi số liệu quan trắc thông thường \(n_s\). Các thông tin về lũ lịch sử, lũ cổ (paleoflood), và dữ liệu thực vật học nên được thu thập trong lưu vực và khu vực liên quan để phục vụ việc ước tính ngưỡng nhận thức \(T_h\), từ đó mở rộng độ dài chuỗi số liệu \(n_h\) cho các trận lũ đặc biệt.
Các quy trình khuyến nghị được trình bày trong phần Xác định Đường Tần Suất Lũ là phù hợp để phân tích các trận lũ đặc biệt tại trạm đo. Việc sử dụng các phân bố tần suất khác, quy trình ước lượng khác, hoặc các mô hình phức tạp hơn cho lũ đặc biệt là không cần thiết, trừ khi có nhu cầu ước lượng của lũ cực trị với AEP nhỏ hơn 0.01 — như đã mô tả trong phần Ngoại suy Đường Tần Suất.
Khuyến nghị cần kiểm tra chặt chẽ độ khớp giữa đường tần suất lũ và các quan sát có biên độ lớn nhất, đồng thời hiểu rõ ảnh hưởng của các quan sát lũ đặc biệt đến đường tần suất này. Các khoảng tin cậy nên được sử dụng để ước lượng phạm vi AEP cho trận lũ. Ngoài ra, cần so sánh với thông tin tần suất lũ trong khu vực. Các đường bao đỉnh lũ khu vực (Vogel and others, 2007) có thể được sử dụng để đánh giá các ước lượng tần suất.
I.3.3 Lưu lượng bằng không và các trận lũ nhỏ có khả năng gây ảnh hưởng
Nhiều con sông và suối ở các vùng khô hạn và bán khô hạn thuộc miền Tây nước Mỹ, như ở California (Lamontagne and others, 2012) và Arizona (Paretti and others, 2014a), có lưu lượng bằng không hoặc rất nhỏ trong suốt cả năm. Chuỗi số liệu lũ hàng năm tại các con suối này thường có một hoặc nhiều giá trị lưu lượng bằng không hoặc rất nhỏ (xem hình 11). Những quan sát như vậy cần được quan tâm đặc biệt. Cụ thể, logarit của số không là âm vô cùng, và logarit của các giá trị nhỏ bất thường cũng có thể gây ra sự bất thường trong phân tích. Hơn nữa, các giá trị dòng chảy nhỏ có thể gây ảnh hưởng lớn đến việc hiệu chỉnh phân bố tần suất lũ cũng như ước lượng độ lớn của các trận lũ lớn. Các quan sát nhỏ này được gọi là các trận lũ nhỏ có khả năng gây ảnh hưởng (PILFs) (Cohn and others, 2013).
Ở các lưu vực này, các quá trình sinh ra những trận lũ rất lớn (tức là các trận lũ được quan tâm) có thể khác với các quá trình gây ra các đỉnh lũ hàng năm có giá trị thấp (hoặc bằng không). Nhiều giá trị nhỏ có thể xảy ra do ảnh hưởng từ đặc điểm lưu vực, như tổn thất thấm qua đáy kênh hoặc bốc thoát hơi vượt quá lượng mưa hàng năm (Paretti and others, 2014a). Kết quả là chuỗi số liệu các đỉnh lũ hàng năm có vẻ như được tạo thành từ một phân bố hỗn hợp. Ví dụ, tại suối Orestimba (xem hình 11), các lưu lượng đỉnh nằm trong khoảng từ 5.000 đến 15.000 ft³/s là đối tượng được quan tâm, trong khi phần lớn các đỉnh lũ có giá trị bằng không hoặc nhỏ hơn 1.000 ft³/s. Do đó, độ lớn của các đỉnh lũ hàng năm nhỏ thường không phản ánh được phần đuôi bên phải của đường phân bố, và do đó không nên đóng vai trò quan trọng trong việc ước lượng xác suất xảy ra của các trận lũ lớn (Cohn and others, 2013). Những giá trị nhỏ (hoặc bằng không) này vì vậy không phù hợp để ước lượng xác suất xảy ra của các trận lũ lớn nhất (Klemeš 1986, Klemeš 2000).
Các Hướng dẫn này khuyến nghị sử dụng phương pháp ước lượng chống nhiễu – robust estimation (Kuczera, 1982; Lamontagne and others, 2013) và tập trung vào các trận lũ lớn nhất — phần đuôi bên phải của phân bố tần suất lũ (National Research Council, 1988) — nhằm loại bỏ các trận lũ nhỏ nhưng có ảnh hưởng lớn tiềm năng (PILFs). Các phương pháp chống nhiễu có hiệu quả tương đối cao khi các giả định về đặc điểm phân phối lũ là đúng, đồng thời cũng không cho kết quả quá tệ ngay cả khi các giả định đó bị vi phạm (Stedinger and others, 1993; Cohn and others, 2013).
Việc tập trung vào các sự kiện cực đoan (phần đuôi trên) dựa trên quan sát rằng các quá trình khí tượng thủy văn và lưu vực xảy ra trong các sự kiện cực đoan thường khác biệt đáng kể so với các quá trình tương ứng trong các sự kiện phổ biến hơn (National Research Council, 1988, trang 7). Phương pháp thống kê được trình bày trong mục Zero Flows and Identifying Potentially Influential Low Floods được sử dụng để phát hiện các PILFs.

I.4. Biểu diễn dữ liệu theo khoảng lưu lượng và ngưỡng cảm nhận
Truyền thống, việc xác định tần suất lũ tập trung vào phân tích các quan sát lũ Q được ghi nhận hàng năm Y tại các trạm đo dòng chảy liên tục, có thể được biểu diễn dưới dạng giá trị điểm QY. Tuy nhiên, cách mô tả dữ liệu lũ và dòng chảy phục vụ cho phân tích tần suất, cũng như kiến thức về các đặc điểm thống kê của dữ liệu, đã thay đổi trong vòng 30 năm qua. Nhiều dữ liệu hữu ích nhưng không thể biểu diễn dưới dạng giá trị điểm, chẳng hạn như dữ liệu từ các trạm đo mực nước đỉnh lũ, thông tin lịch sử, dữ liệu lũ cổ hay thực vật học.
Một cách biểu diễn tổng quát hơn được sử dụng để ghi nhận khi nào có đỉnh lũ hàng năm trong một năm Y, hoặc trong một khoảng năm n. Cách biểu diễn này bao gồm cả thông tin về những trận lũ được biết là nằm trong một khoảng giá trị nào đó, hoặc vượt quá (hoặc không vượt quá) một ngưỡng cảm nhận nhất định. Ngoài ra, có thể có thông tin cho thấy trong một khoảng năm nào đó, không có trận lũ nào vượt quá một ngưỡng cảm nhận đã biết.
Tại một số vị trí, có thể cần nhiều ngưỡng cảm nhận khác nhau để đại diện cho các khoảng thời gian khác nhau của mẫu dữ liệu trong lịch sử.
Việc biểu diễn các quan sát lưu lượng đỉnh hiện nay đã được tổng quát hóa để bao gồm các khái niệm như khoảng giá trị lưu lượng, vượt ngưỡng, không vượt ngưỡng, và nhiều ngưỡng cảm nhận. Các khái niệm này được trình bày trong phần này nhằm cung cấp một hình thức biểu diễn dữ liệu tổng quát cho phân tích tần suất lũ. Các định nghĩa và ký hiệu được chọn lọc cho các khái niệm này được trình bày trong phần Thuật ngữ.
Các quy trình được khuyến nghị trong Hướng dẫn này, được mô tả trong mục Xác định đường tần suất lũ, có thể dễ dàng tích hợp những dạng thông tin mới này và sử dụng dữ liệu một cách hợp lý trong phân tích tần suất các trận lũ lớn. Việc này cho phép sử dụng tất cả các loại thông tin dưới nhiều tổ hợp khác nhau, nhằm tận dụng tối đa dữ liệu lũ hiện có tại một trạm.
Trong Hướng dẫn này, tất cả dữ liệu lũ đều được biểu diễn thông qua các khoảng giá trị lưu lượng và ngưỡng cảm nhận (xem hình 12).
+ Đối với mỗi năm Y, giá trị của \(Q_Y\) được đặc trưng bằng một khoảng lưu lượng (\(Q_{Y,\text{lower}}, Q_{Y,\text{upper}}\)).
+ Một giá trị ước lượng thấp \(Q_{Y,\text{lower}}\) và một giá trị ước lượng cao \(Q_{Y,\text{upper}}\) (một khoảng) được xác định dựa trên quan sát, ghi chép bằng văn bản hoặc bằng chứng vật lý.
+ Đối với phần lớn các trận lũ, chẳng hạn như từ các trạm đo, lưu lượng dòng chảy được xem là “chính xác”, và \(Q_{Y,\text{lower}} = Q_{Y,\text{upper}} = Q_Y\).
+ Các trận lũ được mô tả bằng khoảng (interval) hoặc bị chặn (censored) thường đề cập đến hai trường hợp sau (xem hình 12):
- Trận lũ được biết là đã vượt qua một mức nào đó, nhưng không biết giá trị tối đa là bao nhiêu (binomial-censored data);
- Trận lũ được biết là nằm trong một khoảng (dữ liệu khoảng – interval data).
+ Trong trường hợp dữ liệu chỉ biết vượt ngưỡng (không rõ giá trị cụ thể), người ta chỉ biết giá trị ước lượng thấp \(Q_{Y,\text{lower}}\); còn giá trị ước lượng cao \(Q_{Y,\text{upper}} \approx +\infty\) thì được biểu diễn bằng một đường gạch đứt (hình 12).
+ Các khoảng lưu lượng được sử dụng để mô tả các trận lũ lớn được ước lượng từ thông tin lịch sử, lũ cổ, từ các phép đo gián tiếp hoặc ước lượng hiện trường, trong một số trường hợp có độ bất định lớn (lớn hơn 25%).
+ Các khoảng lưu lượng \((Q_{Y,\text{lower}}, Q_{Y,\text{upper}})\) không được dùng để phản ánh sai số đo đạc tại trạm (có thể ở mức 5–25%).
+ Các quan sát khoảng được hiển thị trong hình 12 dưới dạng thanh đứng cho các giá trị ước lượng thấp và cao.
+ Đối với các trận lũ lịch sử không được quan sát trực tiếp, có lưu lượng chỉ được biết là nhỏ hơn một ngưỡng cảm nhận nào đó \(T_h\), thì giá trị ước lượng thấp \(Q_{Y,\text{lower}} = 0\), còn giá trị ước lượng cao \(Q_{Y,\text{upper}}\) sẽ tương ứng với ngưỡng cảm nhận trong năm đó, như \(T_{h1,\text{lower}}\) hoặc \(T_{h2,\text{lower}}\) (xem hình 12).
+ Đối với các trạm crest-stage, khoảng lưu lượng được xác định có xét đến giới hạn ghi nhận của thiết bị đo. Thông thường có một lưu lượng cơ sở (tối thiểu) \(Q_b\) được thiết lập; và giá trị này có thể thay đổi theo từng năm.
+ Ngưỡng cảm nhận ( \(T_{Y,\text{lower}}, T_{Y,\text{upper}}\)) được dùng để mô tả mức độ hiểu biết trong từng năm Y trong hồ sơ lũ, với giả định rằng nếu có giá trị lưu lượng đỉnh \(Q_Y\) xuất hiện trong năm đó, thì nó đã có thể được quan sát hoặc ghi lại. Cận dưới \(T_{Y,\text{lower}}\) biểu thị lưu lượng đỉnh nhỏ nhất có thể tạo ra một quan sát được ghi nhận, còn cận trên \(T_{Y,\text{upper}}\) biểu thị lưu lượng đỉnh lớn nhất mà vẫn có thể được quan sát hoặc ghi nhận. Khoảng \((T_{Y,\text{lower}}, T_{Y,\text{upper}})\) xác định “giá trị có thể nhận biết được” — tức là phạm vi các lưu lượng đỉnh có khả năng đo được.
+ Những ngưỡng cảm nhận này phản ánh phạm vi lưu lượng mà nếu xảy ra thì đã có thể được ghi nhận, và phụ thuộc vào loại dữ liệu được thu thập tại hoặc gần trạm đo, cũng như đặc điểm vật lý của con sông. Nói cách khác, ngưỡng cảm nhận đại diện cho “phạm vi có thể quan sát được” của các trận lũ. Điều quan trọng là cần lưu ý rằng các ngưỡng cảm nhận \(T_Y\) không phụ thuộc vào giá trị lưu lượng đỉnh \(Q_Y\) thực tế đã xảy ra.
+ Ngưỡng cảm nhận dưới \(T_{Y,\text{lower}}\) và trên \(T_{Y,\text{upper}}\) cần được ước lượng cho từng năm trong toàn bộ hồ sơ đo đạc. Cận dưới \(T_{Y,\text{lower}}\) biểu thị lưu lượng đỉnh nhỏ nhất trong năm có thể tạo ra một ghi nhận vĩnh viễn. Đối với các trạm đo, giá trị này thường là “lưu lượng cơ sở trạm” (gage-base discharge), thường bằng 0. Đối với trạm đo dạng crest-stage, giá trị cơ sở \(Q_b\) > 0 và có thể thay đổi.
+ Với các trận lũ trong hồ sơ lịch sử, \(T_{Y,\text{lower}}\) thường được ước lượng bằng một ngưỡng lũ lịch sử \(T_h\) (xem hình 12). Tại các trạm đo hiện đại, \(T_{Y,\text{upper}}\) thường được giả định là vô hạn, vì các trận lũ lớn thường sẽ được ghi nhận. Tuy nhiên, tại các trạm crest-stage hoặc trong giai đoạn lịch sử hay lũ cổ, \(T_{Y,\text{upper}}\) cần được ước lượng dựa trên phạm vi ghi nhận của thiết bị, thông tin lịch sử (như dấu vết trên cầu, cột mốc), hoặc bằng chứng địa chất hay thực vật học.
+ Trong những giai đoạn hồ sơ bị gián đoạn hoặc trạm ngừng hoạt động, nếu không còn thông tin nào như gage base hay dữ liệu lịch sử, thì cả \(T_{Y,\text{lower}}\)và \(T_{Y,\text{upper}}\) đều được đặt là ∞ — nghĩa là không có thông tin nào cho năm đó. Nếu có thông tin lịch sử được dùng để kéo dài hồ sơ lũ lớn trong giai đoạn bị gián đoạn, thì \(T_{Y,\text{lower}}\) có thể đặt bằng một ngưỡng lũ lịch sử \(T_h\). Một số ví dụ về khoảng lưu lượng và ngưỡng cảm nhận được nêu trong phụ lục 3.
+ Trong một số trường hợp, bộ dữ liệu lũ cần được biểu diễn bằng nhiều ngưỡng cảm nhận. Điều này nghĩa là cần hơn một ngưỡng cảm nhận để mô tả dữ liệu tại thời điểm đó. Ví dụ, trong hình 12, có hai ngưỡng cảm nhận được thể hiện trong lịch sử. Giai đoạn 1890–1909 ghi nhận rất ít quan sát do chưa có định cư lâu dài trong hẻm núi, nơi các trận lũ lớn và dấu mực nước cao (high-water marks – HWM) vượt \(T_{h\text{2,upper}}\) không được bảo tồn hoặc ghi chép lại.

Hình 12. Biểu đồ minh họa chuỗi thời gian lưu lượng đỉnh (peak-discharge) ví dụ, bao gồm các đỉnh lũ, các quan sát lũ dạng khoảng và lũ dạng binomial-censored, các khoảng lưu lượng và các ngưỡng cảm nhận.
Các lưu lượng đỉnh đo bằng thiết bị được biểu diễn bằng các vòng tròn đen, trong đó: \(Q_{Y,\text{lower}} = Q_{Y,\text{upper}}\)
Trong giai đoạn lịch sử, có ba trận lũ sau:
- một quan sát “binomial” vào năm 1914,
- một trận lũ có cường độ biết rõ vào năm 1925,
- và một quan sát dạng khoảng vào năm 1934.
Đỉnh lũ năm 1925 được biểu diễn bằng một tam giác đen, với giá trị cường độ xác định chính xác: \(Q_{1925,\text{lower}} = Q_{1925,\text{upper}}\)
Lũ năm 1914 được mô tả là một quan sát binomial, biểu diễn bằng đường đứt nét; biết rằng trận lũ này đã vượt qua: \(Q_{1914,\text{lower}}\)
Trận lũ năm 1934 được biết là nằm trong một khoảng nhất định: \(Q_{1934,\text{lower}} < Q_{1934,\text{upper}}\)
Các khoảng lũ được thể hiện bằng các thanh đứng màu đen có hai đầu ngang tượng trưng cho giá trị ước lượng dưới và trên của lưu lượng.
Các vùng xám biểu diễn các trận lũ có cường độ không xác định, nhỏ hơn các ngưỡng cảm nhận: \(T_{h1,\text{lower}} \quad \text{và} \quad T_{h2,\text{lower}}\) trong giai đoạn lịch sử đó.
Các đường màu xanh lá biểu diễn khoảng lưu lượng mà các trận lũ có thể được đo đạc hoặc ghi nhận trong giai đoạn 1910–1945, với các ngưỡng cảm nhận dưới và trên: \(T_{h1,\text{lower}} \quad \text{và} \quad T_{h1,\text{upper}}\)
Các đường màu tím biểu thị các ngưỡng cảm nhận: \(T_{h2,\text{lower}} \quad \text{và} \quad T_{h2,\text{upper}}\) cho giai đoạn 1891–1909.
Khoảng giá trị cảm nhận được cho giai đoạn có sự đo đạc hệ thống (gage) từ 1945–1965 là: \(T_{s,\text{lower}},\quad T_{s,\text{upper}} = (0, \infty)\)
Giai đoạn 1910–1944 phản ánh sự gia tăng trong việc quan sát và nhận thức về tất cả các mực nước sông cao vượt ngưỡng \(T_{h1,lower}\) (không có giới hạn trên), trước khi một trạm đo được thiết lập vào năm 1945.
Việc sử dụng nhiều ngưỡng cảm nhận là hợp lý, đặc biệt là với các chuỗi số liệu lịch sử dài hơn và dữ liệu lũ cổ (paleoflood), nhằm phản ánh chính xác dữ liệu và thông tin hiện có. Trong trường hợp này, hai ngưỡng cảm nhận được thể hiện trong hình 12 sẽ được mở rộng bằng các ngưỡng cảm nhận bổ sung có cường độ lớn hơn \(T_{h2,lower}\), và đại diện cho các khoảng thời gian dài hơn.
Việc thu thập dữ liệu lịch sử và xác định thời kỳ lịch sử \(n_h\) là rất quan trọng trong phân tích tần suất lũ. Mốc bắt đầu của thời kỳ lịch sử có thể được xác định, chẳng hạn, từ thời điểm định cư đầu tiên đã biết (như năm 1860) dọc theo một con sông (hình 10), từ thông tin khảo cổ học, hoặc từ dữ liệu lũ cổ và việc xác định niên đại của các bậc thềm sông cũng như các giới hạn không vượt (fig. 5 và fig. 6). Thời kỳ lịch sử không được bắt đầu từ trận lũ đầu tiên được quan sát, vì điều này tạo ra một ước lượng thiên lệch của \(n_h\), do đây là giới hạn dưới của thời kỳ lịch sử thực sự (Hirsch và Stedinger, 1987).
Việc ước lượng ngưỡng cảm nhận dưới \(T_{Y,lower}\) là đặc biệt quan trọng. Nó đại diện cho đánh giá tốt nhất của chúng ta, tại mỗi năm, về trận lũ nhỏ nhất mà có thể đã để lại dấu vết để các nhà nghiên cứu ngày nay có thể biết đến. Thông tin lịch sử hoặc lũ cổ cần được bảo tồn để các nhà thủy văn và địa chất có thể thu thập dữ liệu từ ghi chép viết tay, nghiên cứu lịch sử, hoặc khảo sát lũ cổ. Ví dụ, trong mỗi năm từ 1891–1909, không tìm thấy bằng chứng nào cho thấy lưu lượng đỉnh \(Q_Y\) vượt ngưỡng \(T_{h2,lower}\) (hình 12).
Nhà nghiên cứu cần nhận thức rằng giới hạn dưới của ngưỡng cảm nhận chỉ là một ước lượng gần đúng, và nó thường thay đổi (tăng dần về cường độ) khi ta lùi về quá khứ. Trong một số trường hợp, chỉ những sự kiện cực đoan nhất mới để lại dấu vết, và do đó ngưỡng cảm nhận sẽ rất cao (hình 5); đây là các sự kiện đáng quan tâm.
I.5. Thông tin vùng và các trạm lân cận
Thông tin lũ từ khu vực xung quanh trạm đo hoặc lưu vực quan tâm có thể giúp cải thiện việc ước lượng tần suất lũ, đặc biệt là khi chuỗi số liệu ngắn (ít hơn 30 năm) (Stedinger and others, 1993). Đối với các chuỗi số liệu vừa phải này, người ta biết rằng hệ số lệch tại trạm (station skew coefficient) rất nhạy với các sự kiện cực đoan (Griffis và Stedinger, 2007a, Griffis và Stedinger 2009). Từ Bulletin 17 (Beard, 1974), thông tin hệ số lệch vùng G đã được sử dụng để làm ổn định hệ số lệch tại trạm \(\hat{\gamma}\), đại diện cho hình dạng của phân phối tần suất thông qua việc sử dụng hệ số lệch có trọng số \(\tilde{G}\). Các kỹ thuật để ước lượng hệ số lệch vùng đã phát triển trong 30 năm qua (Tasker và Stedinger, 1986; Griffis và Stedinger, 2007c; Parrett and others, 2011), nhờ đó các ước lượng trở nên chính xác và đặc trưng thống kê được hiểu rõ hơn so với thời điểm Bulletin 17B được viết.
Khuyến nghị rằng thông tin lệch vùng G nên được xem xét và áp dụng trọng số phù hợp khi ước lượng các đường tần suất lũ. Một số nguồn cung cấp thông tin lệch vùng được liệt kê trong phụ lục 3. Các hướng dẫn bổ sung được trình bày trong các phần Ước lượng độ lệch vùng – Estimating Regional Skew và Ước lượng độ lệch có trọng số – Weighted Skew Coefficient Estimator.
Các loại thông tin khu vực khác có thể có giá trị đối với phân tích tần suất lũ cũng có thể được xem xét, bên cạnh thông tin về hệ số lệch vùng. Griffis và Stedinger (2007a) mô tả một số bộ ước lượng tần suất lũ và cho thấy rằng các ước lượng vùng về giá trị trung bình và độ lệch chuẩn có thể hữu ích. Ở các vùng khô hạn và bán khô hạn, các ước lượng trung bình và độ lệch chuẩn vùng từ các giá trị lưu lượng đỉnh có thể được sử dụng để cải thiện ước lượng tần suất lũ tại một trạm cụ thể — ví dụ như tại khu vực sa mạc ở California (Gotvald and others, 2012).
Các đặc điểm địa hình – thủy văn trong một lưu vực hay khu vực, như cao độ trung bình của lưu vực, diện tích lưu vực, lượng mưa trung bình năm và các yếu tố vật lý khác – rất hữu ích trong việc ước lượng các tham số khu vực và thực hiện các nghiên cứu tần suất lũ khu vực. Các nghiên cứu như vậy thường sử dụng kỹ thuật hồi quy bình phương tối thiểu tổng quát (Tasker và Stedinger, 1989) để cung cấp các ước lượng phân vị và phương sai phân vị. Các ước lượng này có sẵn cho nhiều bang (Gotvald and others, 2012; Eash and others, 2013) và có thể hữu ích trong việc kéo dài chuỗi số liệu và gán trọng số cho các ước lượng tần suất độc lập.
Các hướng dẫn bổ sung được trình bày trong các phần Kéo dài chuỗi số liệu từ các vị trí lân cận và Gán trọng số cho các ước lượng tần suất độc lập.
I.6. Ước lượng lũ từ mưa
Lưu lượng lũ được ước tính từ dữ liệu khí hậu (lượng mưa và/hoặc tuyết tan) có thể là một bổ sung hữu ích cho các số đo trực tiếp từ dòng chảy. Các ước lượng này có thể được đưa ra trong một số trường hợp, chẳng hạn như:
(1) ước lượng lũ từ các sự kiện cực đoan riêng lẻ dựa trên lượng mưa quan sát được;
(2) các sự kiện lũ tổng hợp và đường tần suất lũ được xây dựng từ các ước lượng tần suất dựa trên lượng mưa; và
(3) các ước lượng dòng chảy liên tục và đường tần suất từ lượng mưa và thông tin khí hậu.
Các ước lượng như vậy yêu cầu ít nhất phải có dữ liệu khí hậu đủ tốt và một mô hình lưu vực hợp lệ để chuyển đổi lượng mưa thành dòng chảy. Trong một số trường hợp, có thể đã có sẵn các mô hình lưu vực được hiệu chỉnh phù hợp với lưu vực quan tâm. Ví dụ, Cơ quan Thời tiết Quốc gia Hoa Kỳ (NWS) đã hiệu chỉnh các mô hình lưu vực để dự báo lũ cho các lưu vực sông lớn thông qua các Trung tâm Dự báo Sông (RFC). Các cơ quan liên bang khác (Quân đoàn Công binh Hoa Kỳ, Cục Khai hoang, và Cơ quan Bảo tồn Tài nguyên Thiên nhiên) có thể cũng đã hiệu chỉnh các mô hình lũ để phục vụ kiểm soát lũ, thiết kế đê điều và các dự án khác trong phạm vi quyền hạn của họ. Là một phần trong công tác quản lý vùng ngập lũ của Cơ quan Quản lý Khẩn cấp Liên bang (FEMA), các cơ quan bang, quận và các đơn vị bảo vệ địa phương có thể cũng đã hiệu chỉnh các mô hình lưu vực để phục vụ ước lượng lũ lớn, bổ sung cho các hồ sơ đo dòng chảy tại trạm.
Các trận lũ cực đoan riêng lẻ hoặc các đường tần suất lũ có thể được ước lượng từ các mô hình mưa-dòng chảy dạng sự kiện hoặc liên tục, sử dụng lượng mưa quan sát tại các trạm trong cùng một vùng khí tượng đồng nhất hoặc từ lượng mưa được tạo ngẫu nhiên. Mô hình mưa-dòng chảy cần được hiệu chỉnh theo các quan sát lũ cực đoan, bằng các phương pháp như của Duan and others (2003), để sử dụng hiệu quả trong việc ước lượng và dự báo tần suất lũ.
Khuyến nghị rằng nên tiến hành phân tích độ không chắc chắn (Kjeldsen and others, 2014), bao gồm cả độ không chắc chắn trong dự báo (Beven, 2001, chương 7), nhằm phản ánh phạm vi biến thiên liên quan đến đường tần suất lũ được ước lượng từ mô hình mưa-dòng chảy. Phương sai của các ước lượng các phân vị lũ từ mô hình mưa-dòng chảy cũng cần được xem xét để phục vụ việc gán trọng số phù hợp cho các ước lượng, như đã được trình bày trong phần Gán trọng số cho các ước lượng tần suất độc lập.
Ước lượng tần suất lũ từ mô hình mưa – dòng chảy có thể bị sai lệch thấp (Thomas, 1982) hoặc cao và thể hiện sự mất phương sai (Lichty và Liscum, 1978; Thomas, 1987) khi mô hình và các sai số khác không được tính đến đúng mức trong phân tích bất định. Việc đưa vào biến động của lượng mưa và nhiệt độ (Clark and others, 2004) giúp ích trong tình huống này. Trong một số trường hợp, các mô hình mưa – dòng chảy được hiệu chỉnh hoặc các tham số được điều chỉnh để phù hợp hơn với các đường tần suất lũ dựa trên số liệu đỉnh lũ (Reed, 1999; Swain and others, 2006; MGS Engineering Consultants, 2009). Các đường tần suất từ mô hình mưa – dòng chảy cần độc lập với các đường tần suất được ước tính theo quy trình khuyến nghị trong các Hướng dẫn này nếu các đường đó được gán trọng số và tổng hợp lại.
Các nhà phân tích sử dụng các quy trình như vậy cần phải ghi chép rõ ràng phương pháp mô hình mưa – dòng chảy được dùng để tính toán lũ và đánh giá hiệu suất của nó dựa trên kinh nghiệm từ các sự kiện lũ và mưa bão trong một khu vực đồng nhất về mặt thủy văn và khí tượng, bao gồm cả hiệu chỉnh và phân tích bất định. Việc các nghiên cứu này có hữu ích hay không phụ thuộc vào tính sẵn có và đầy đủ của thông tin, độ tin cậy của hồ sơ số liệu lũ hiện có, và mục đích mà mô hình lưu vực được xây dựng và hiệu chỉnh. Độ lớn và AEP của sự kiện mưa hoặc lũ là các yếu tố quan trọng nhất cần xem xét khi đưa các ước lượng này vào. Các trận lũ lớn nhất hoặc cực đoan nhất, với AEP < 0.02, rất hữu ích, đặc biệt là cho các trạm không có đo đạc (ungaged sites) hoặc trong các tình huống mà trạm đo đã bị phá hủy.
Bên cạnh các ước lượng lũ từ mưa, thông tin khí hậu thủy văn (hydroclimatological) (Maddox and others, 1980; Hirschboeck, 1991) cũng rất hữu ích và cung cấp một góc nhìn rộng hơn về dữ liệu và quá trình gây lũ phục vụ phân tích tần suất. Các mô hình tuần hoàn khí quyển (Hirschboeck, 1987a) và các chỉ số khí hậu như Dao động El Niño – Nam (ENSO) (Webb và Betancourt, 1992) có thể được kết hợp với dữ liệu lưu lượng để hiểu rõ hơn về các cơ chế gây mưa và sự biến động lũ lụt (National Research Council, 1999). Redmond and others (2002) mô tả các mối liên hệ quan trọng giữa các cơ chế khí hậu, dữ liệu lũ cổ và sự biến động lũ. Một số nguồn dữ liệu về lượng mưa và khí hậu được liệt kê ở phụ lục 3.
Hỗ trợ duy trì trang:
Tôi xây dựng trang này để chia sẻ các tài liệu kỹ thuật cốt lõi trong thiết kế hạ tầng giao thông.
Nếu bạn thấy nội dung hữu ích và muốn góp phần duy trì trang hoạt động bền vững, tôi rất trân trọng mọi sự ủng hộ.