View Categories

II. Các giả định dữ liệu và Những vấn đề cần quan tâm

Các giả định thông thường đối với một phân tích thống kê là chuỗi thông tin về lũ là đáng tin cậy và đại diện cho một mẫu thời gian của các sự kiện ngẫu nhiênđồng nhất. Việc đánh giá mức độ đầy đủ và khả năng áp dụng của các hồ sơ lũ vì vậy là bước cần thiết đầu tiên trong phân tích tần suất lũ. Phần này thảo luận về các sai số đo đạc, tính ngẫu nhiên của các sự kiện, tổng thể hỗn hợp, thay đổi lưu vực, và những cân nhắc về biến đổi khí hậu cũng như thay đổi khí hậu trong phân tích tần suất lũ.

II.1. Sai số đo đạc

Sai số đo lưu lượng đỉnh tồn tại trong các bản ghi lưu lượng, cũng như trong tất cả các giá trị đo khác. Sauer và Meyer (1992) đã mô tả các nguồn sai số trong đo đạc lưu lượng. Sai số tuyệt đối trong các ước tính lưu lượng thường lớn nhất trong các trận lũ cực đại. Ước lượng lưu lượng đỉnh của các trận lũ lớn nhất từ các bản ghi có hệ thống (gaging), lũ lịch sử, lũ cổ (paleofloods), hoặc các nguồn khác có thể chứa sai số đáng kể do không chắc chắn ở cả mối quan hệ giữa mực nước và lưu lượng (stage–discharge relationship), và do các lưu lượng này thường được ước lượng từ phần mở rộng của đường quan hệ mực nước–lưu lượng (rating-curve) hoặc các phương pháp gián tiếp, thay vì được đo đạc trực tiếp.

Nhiều cải tiến đã được thực hiện trong việc đo đạc lưu lượng trực tiếp bởi USGS trong vài thập kỷ qua (Turnipseed và Sauer, 2010), với độ chính xác “tốt” (sai số 5%) cho hầu hết các phép đo lưu lượng. Tuy nhiên, các trận lũ lớn nhất thường không được đo đạc trực tiếp vì các vấn đề như vật cản, vị trí khó tiếp cận, và các yếu tố an toàn (Costa và Jarrett, 2008). Các nguồn sai số tiềm năng khác trong lưu lượng lớn bao gồm dòng tràn chưa được ghi nhận từ các nhánh chính của sông và ảnh hưởng của băng (Rantz and others, 1982b).

Các trận lũ lớn nhất thường được ước lượng bằng cách mở rộng rating-curve hoặc các phương pháp gián tiếp, với sai số ước lượng có thể vượt quá 25% trong nhiều trường hợp, thậm chí hơn 100% trong các suối có độ dốc lớn (Jarrett, 1987). Sai số đo đạc có thể làm suy giảm nghiêm trọng các ước lượng của phân vị lũ trong một số tình huống (Potter và Walker, 1985); do đó, cần điều tra các sai số ước lượng trong các trận lũ lớn nhất.

Trong nhiều trường hợp, lưu lượng đỉnh hàng năm được ước tính từ phần kéo dài của rating-curve. Sai số đáng kể trong việc ước tính lưu lượng có thể phát sinh từ phần kéo dài này (Cook, 1987; Kuczera, 1996), đặc biệt nếu giá trị lưu lượng lớn hơn gấp đôi giá trị đo lớn nhất bằng lưu tốc kế. Thật không may, các giá trị đỉnh lũ lớn hoặc dị thường thường không được đo trực tiếp và thường lớn hơn nhiều lần so với giá trị đã được đo (Klemeš, 1987). Kuczera (1996) cho rằng phần kéo dài rating-curve, khi có sai số tương quan, có thể ảnh hưởng đáng kể đến các ước lượng của phân vị.

Các phương pháp gián tiếp được sử dụng để đo lưu lượng đỉnh sau khi lũ xảy ra (Benson và Dalrymple, 1967; Rantz and others, 1982a), sử dụng các dấu vết mực nước cao (HWMs) hoặc chỉ số PSI (Koenig and others, 2016). Phương pháp độ dốc – diện tích mặt cắt (slope-area method) của Dalrymple và Benson (1967) được USGS sử dụng phổ biến nhất; các phương pháp gián tiếp khác được trình bày trong Cook (1987) Webb và Jarrett (2002). Phương pháp độ dốc – diện tích đã ghi nhận nhiều nguồn sai số (Bathurst 1986; Jarrett 1987; Kirby 1987; McCuen và Knight, 2006). Sai số đáng kể trong ước tính lưu lượng bằng phương pháp gián tiếp đã được ghi nhận ở các vùng núi; các giá trị đo thường bị ước lượng cao hơn thực tế (Jarrett, 1987). Việc bỏ qua hiện tượng xói hoặc bồi đáy là yếu tố quan trọng nhất có thể gây sai số lớn trong các ước tính gián tiếp (Kirby, 1987). Quick (1991) đã trình bày các nguồn sai số trong phương pháp độ dốc – diện tích và chỉ ra rằng phương pháp này thường có xu hướng đưa ra giá trị cao. Webb và Jarrett (2002) mô tả các giả định trong việc ước tính lưu lượng đỉnh từ dữ liệu lịch sử và lũ cổ; họ cũng nêu rõ những thông tin cần có để hỗ trợ cho các ước tính lưu lượng.

Trong nhiều trường hợp, sai số có thể được nhận ra hoặc nghi ngờ. Cần nỗ lực đáng kể để hiểu rõ các nguồn sai số trong đo đạc lưu lượng và định lượng mức độ bất định liên quan đến các sai số đó. Nếu sai số lớn, nên báo cáo với cơ quan thu thập dữ liệu kèm theo bằng chứng hỗ trợ và đề nghị hiệu chỉnh giá trị đo.

II.2. Tính ngẫu nhiên của các sự kiện

Nói chung, chuỗi số liệu lưu lượng đỉnh hàng năm có thể được xem là một mẫu ngẫu nhiên của các biến ngẫu nhiên độc lập và cùng phân phối. Chuỗi số liệu này được giả định là một mẫu ngẫu nhiên đại diện cho tổng thể các trận lũ trong tương lai. Giả định này phụ thuộc vào việc thực hiện phân tích sơ bộ dữ liệu (exploratory data analysis) (phụ lục 4) và hiểu biết vật lý sâu hơn về hệ thống.

Về bản chất, quá trình ngẫu nhiên sinh ra lũ được giả định là dừng (stationary) hay bất biến theo thời gian. Tính dừng là một thuộc tính của quá trình ngẫu nhiên tiềm ẩn, chứ không phải của dữ liệu quan sát được. Các chuỗi phát sinh từ quá trình dừng vẫn có thể biểu hiện các đợt lệch xa (excursions) xu thế kéo dài (trends that persis) hàng thập kỷ hoặc thế kỷ (Cohn và Lins, 2005). Các quá trình không dừng (nonstationary) khó phát hiện trong chuỗi lưu lượng đỉnh (Villarini and others, 2009a) và có thể khó xác định (Koutsoyiannis, 2011).

Trong một số tình huống, có thể cân nhắc các khái niệm long-term persistence (Lins và Cohn, 2011) hoặc shifting-mean models (Salas và Boes, 1980; Svensson and others, 2003).

Trước khi tiến hành phân tích tần suất lũ, Hướng dẫn này khuyến nghị các nhà phân tích nên thực hiện một phân tích sơ bộ về dữ liệu. Helsel và Hirsch (2002)Hirsch and others (1993) cung cấp cái nhìn tổng quan và chi tiết về việc thực hiện phân tích sơ bộ dữ liệu. Các thủ tục khuyến nghị cho việc phân tích dữ liệu ban đầu bao gồm vẽ chuỗi số liệu, kiểm tra serial correlation (tương quan giữa các quan sát theo thời gian), xem xét xu thế và sự thay đổi đột ngột (changepoints), được trình bày trong phụ lục 4.

Tại một số khu vực, số liệu lũ có thể cho thấy dấu hiệu không ngẫu nhiên rõ rệt và biểu hiện xu hướng nhiều thập kỷ hoặc chu kỳ khô – ẩm mạnh mẽ mà không thể giải thích được bằng các yếu tố như thay đổi sử dụng đất, quản lý nguồn nước hoặc biến đổi khí hậu. Những bộ số liệu như vậy đặc biệt gây khó khăn và là một trong những vấn đề nan giải nhất trong phân tích tần suất lũ. Nhóm công tác đã không đánh giá các phương pháp xử lý vấn đề không ngẫu nhiên và/hoặc xu hướng nhiều thập kỷ trong tần suất lũ. Cần có thêm các nghiên cứu trong lĩnh vực này vì đây là một vấn đề chưa được giải quyết một cách nghiêm túc. Nếu các xu hướng nhiều thập kỷ kiểu này được phát hiện thông qua các kiểm định thống kê thích hợp và phân tích dữ liệu, nên điều tra các cơ chế vật lý tiềm ẩn nhằm hiểu rõ hơn về thủy văn (Lins và Cohn, 2011). Cách điều chỉnh một bộ số liệu như vậy để phục vụ phân tích tần suất lũ vẫn là một vấn đề chưa có lời giải.

Ngay cả khi các kiểm định thống kê về hệ số serial correlation cho thấy sự sai khác đáng kể so với giả định độc lập, thì số liệu đỉnh lũ hàng năm vẫn có thể cung cấp một ước lượng không sai lệch về hoạt động lũ trong tương lai nếu các giả định khác được đảm bảo. Tuy nhiên, tính không ngẫu nhiên của chuỗi số liệu đỉnh lũ sẽ dẫn đến sai số trong việc ước lượng bất định liên quan đến đường tần suất được lắp vào. Các khái niệm về độ dài chuỗi số liệu hiệu dụng (Tasker, 1983; Vogel và Kroll, 1991) nên được sử dụng để hiệu chỉnh việc ước lượng bất định trong trường hợp có tồn tại serial correlation.

II.3. Tổng thể hỗn hợp (Mixed Populations)

Lũ lụt ở một số lưu vực sông xảy ra do các loại hiện tượng khí tượng khác nhau, gắn liền với các quá trình vật lý riêng biệt. Ví dụ, lũ có thể bắt nguồn từ tuyết tan, mưa giông, hoặc sự kết hợp của cả hai yếu tố này (Jarrett và Costa, 1988). Một bộ số liệu như vậy có thể không đồng nhất và có thể cần xử lý đặc biệt. Tổng thể hỗn hợp này dẫn đến các đường tần suất lũ có hệ số lệch rất lớn, được phản ánh qua sự thay đổi độ dốc bất thường khi vẽ trên giấy xác suất chuẩn theo thang logarit.

Trong một số trường hợp, đường tần suất của các trận lũ hàng năm có thể được mô tả tốt nhất bằng cách tính riêng đường cong cho từng loại sự kiện, rồi sau đó kết hợp các kết quả lại.

Một ví dụ về tổng thể hỗn hợp là sự kết hợp giữa dòng chảy do mưa và do tuyết tan. Tại vùng Sierra Nevada ở California, các yếu tố và mối quan hệ thủy văn trong các trận lũ mùa đông thông thường thường rất khác so với các trận lũ do tuyết tan mùa xuân hoặc lũ cục bộ do mưa dông mùa hè. Tại đây, đỉnh lũ ở vùng thấp chủ yếu do mưa mùa đông, còn ở vùng cao thì đỉnh lũ thường do tuyết tan mùa xuân hoặc mưa trên nền tuyết. Các nghiên cứu tần suất ở vùng Sierra Nevada đã được thực hiện riêng cho lũ do mưa (chủ yếu từ tháng 11 đến tháng 3) và lũ do tuyết tan (từ tháng 4 đến tháng 7). Các đỉnh lũ được phân loại theo nguyên nhân – chủ yếu do tuyết tan và chủ yếu do mưa. Tương tự, tại dãy Colorado Front Range, đỉnh lũ xảy ra trong mùa xuân và hè là kết quả của cả mưa và tuyết tan, đặc biệt ở vùng chân núi thấp.

Lũ lụt ở miền Đông Hoa Kỳ là kết quả từ sự pha trộn của nhiều cơ chế gây lũ khác nhau, trong đó các xoáy thuận nhiệt đới và hệ thống ngoài vùng nhiệt đới đóng vai trò trung tâm. Dọc theo bờ biển Đại Tây Dương và Vịnh Mexico, trong một số trường hợp, lũ do bão và không do bão đã được tách biệt, từ đó cải thiện độ chính xác trong ước lượng tần suất lũ. Một ví dụ khác về tổng thể hỗn hợp là lũ do tắc nghẽn băng xảy ra ở các vùng phía Bắc.

Dữ liệu khí hậu thủy văn (hydroclimatological), bao gồm việc sử dụng các mô hình thời tiết đồng thời (synoptic weather patterns), đặc biệt hữu ích trong việc cung cấp thông tin độc lập, có cơ sở vật lý về các quá trình gây lũ liên quan đến khí hậu, và để phân loại chuỗi số liệu lũ theo từng loại. Ngoài ra, các dữ liệu khác như dữ liệu cổ về thủy văn (paleohydrologic) và dữ liệu cổ về khí hậu (paleoclimate) cũng có thể được xem xét. Các kiểu lũ và cơ chế nguyên nhân cụ thể cũng có thể được nghiên cứu dưới góc nhìn lưu vực, bằng cách xem xét các biến số như lượng mưa và thời lượng mưa, tính mùa vụ của lũ, thời gian xuất hiện và phản ứng dòng chảy.

Khi có thể chứng minh rằng có hai hay nhiều nguyên nhân khác nhau và nhìn chung là độc lập gây ra lũ, thì việc phân tách dữ liệu lũ theo nguyên nhân, phân tích và tính toán các đường tần suất riêng cho từng loại sự kiện và sau đó gộp các đường này lại để phân tích tổng thể về tần suất lũ tại vị trí nghiên cứu sẽ là cách làm đáng tin cậy hơn. Có thể tham khảo các quy trình như được mô tả trong Crippen (1978), U.S. Army Corps of Engineers (1982), Jarrett và Costa (1988), và Murphy (2001). Đối với các tình huống lũ do băng trôi, có thể áp dụng cách tiếp cận phân phối hỗn hợp tương tự (Murphy, 2001), hoặc sử dụng một phương pháp tập trung vào cao độ cực đại (Vogel và Stedinger, 1984).

Một ví dụ về việc kết hợp các đường tần suất đã được thực hiện tại khu vực Black Hills như một phần trong ước lượng tần suất lưu lượng đỉnh lũ cho South Dakota (Sando và cộng sự, 2008). Alila và Mtiraoui (2002) mô tả thêm các ví dụ khác. Trong một số tình huống, có thể không có đủ dữ liệu để thực hiện phân tích phân phối hỗn hợp, hoặc kết quả có thể không đáng tin cậy như mong muốn (Gotvald và cộng sự, 2012). Nhóm công tác đã không tiến hành đánh giá các quy trình này. Cần có thêm nỗ lực để cung cấp hướng dẫn về việc nhận diện và xử lý các phân phối hỗn hợp.

Phân tách theo các khoảng thời gian trên lịch thay vì theo sự kiện không được xem là hợp lý về mặt thủy văn, trừ khi các sự kiện trong các khoảng thời gian khác nhau đó rõ ràng do các điều kiện thủy khí tượng khác nhau gây ra. Các quy trình hiệu chỉnh trong Hướng dẫn này có thể được sử dụng để hiệu chỉnh riêng từng chuỗi số liệu lũ, với ngoại lệ rằng hệ số lệch vùng không được sử dụng trừ khi nó được phát triển dành riêng cho các loại sự kiện đang được xem xét. Nếu các sự kiện lũ được cho là bao gồm hai hoặc nhiều tổng thể nhưng không thể xác định và phân tách chúng dựa trên một tiêu chí khách quan và có ý nghĩa thủy văn, thì chuỗi số liệu đó sẽ được xử lý như là thuộc về một tổng thể duy nhất.

II.4. Biến đổi lưu vực

Ngày càng trở nên khó khăn hơn để tìm được các lưu vực mà chế độ dòng chảy chưa bị thay đổi do những biến đổi đối với lòng sông, vùng ngập lũ, việc xây dựng hoặc phá hủy các hồ chứa và đê điều, hoặc các thay đổi đối với đặc điểm tổng thể của lưu vực (ví dụ: đô thị hóa, cháy rừng, thay đổi phương thức canh tác, kiểm soát xói mòn, thoát nước, hoặc phá rừng). Các hoạt động phát triển có thể làm thay đổi điều kiện dòng chảy bao gồm: đô thị hóa, nắn dòng, thoát nước nông nghiệp, đê điều và việc xây dựng các hồ chứa, công trình chuyển hướng dòng chảy, và thay đổi điều kiện thảm phủ mặt đất (Sauer và cộng sự, 1983). Các khu vực không thấm nước trong lưu vực và ảnh hưởng của chúng đến dòng chảy cũng là những yếu tố quan trọng cần xem xét (Moglen, 2009).

Lịch sử lưu vực và các hồ sơ lũ nên được xem xét cẩn thận để đảm bảo rằng không có thay đổi lớn nào trong lưu vực đã xảy ra trong suốt thời gian ghi nhận dữ liệu. Các tài liệu đi kèm với hồ sơ lũ thường liệt kê những thay đổi đã xảy ra vào các thời điểm riêng biệt. Tuy nhiên, những ảnh hưởng do đô thị hóa hoặc việc xây dựng hàng loạt hồ chứa nhỏ trong nhiều năm có thể sẽ không được ghi chép lại. Những thay đổi dần dần như vậy có thể không làm thay đổi rõ rệt chế độ dòng chảy từ năm này sang năm khác, nhưng ảnh hưởng tích lũy lại có thể rất đáng kể.

Cần có nỗ lực đặc biệt để xác định các chuỗi số liệu không đồng nhất. Các công cụ phân tích dữ liệu được mô tả trong phụ lục 4 có thể được sử dụng để đánh giá các hồ sơ về các xu thế dần dần hoặc sự thay đổi có thể liên quan đến sự thay đổi lưu vực. Các ước lượng không gian và thời gian về sử dụng đất bên trong lưu vực nên được thu thập khi có thể. Những dữ liệu này đặc biệt hữu ích trong việc định lượng tác động của đô thị hóa đến tần suất lũ (Moglen và Beighley, 2002; McCuen, 2003).

Chỉ nên sử dụng những chuỗi số liệu đại diện cho điều kiện lưu vực tương đối ổn định để phân tích tần suất (Konrad, 2003; Moglen và Shivers, 2006). Trong một số trường hợp, các hồ sơ dòng chảy có thể được điều chỉnh để phản ánh điều kiện lưu vực hiện tại, khi có bằng chứng vật lý về sự thay đổi lưu vực xảy ra trong một phần đáng kể của lưu vực (McCuen, 2003). Nhóm công tác không đánh giá các phương pháp để xử lý sự thay đổi lưu vực và không đưa ra khuyến nghị cụ thể nào, vì cần có thêm nghiên cứu trong lĩnh vực này.

II.5. Biến đổi khí hậu

Hiện nay có nhiều lo ngại về thay đổi rủi ro lũ lụt liên quan đến biến động khí hậu và biến đổi khí hậu dài hạn. Tính bất biến theo thời gian đã được giả định trong quá trình xây dựng các Hướng dẫn này. Tuy nhiên, trong những trường hợp có đủ bằng chứng khoa học để định lượng rõ ràng tác động của biến đổi khí hậu hoặc thay đổi rủi ro lũ lụt, thì kiến thức này cần được đưa vào phân tích tần suất lũ bằng cách sử dụng các tham số thay đổi theo thời gian hoặc các kỹ thuật thích hợp khác. Tất cả các phương pháp áp dụng đều cần được ghi chép và chứng minh rõ ràng.

Nhóm công tác không thực hiện đánh giá các phương pháp xử lý biến đổi khí hậu trong phân tích tần suất lũ. Do đó, cần có thêm nhiều nghiên cứu trong lĩnh vực này. Một số thông tin và kiến thức nền về tính không ổn định theo thời gian đã được trình bày trong các tài liệu của Olsen và cộng sự (2010)Kiang và cộng sự (2011). Trong thời gian chờ đợi, các nhà phân tích có thể cân nhắc các nguồn dữ liệu và phương pháp sau: