Khi thực hiện phân tích tần suất lũ, bước đầu tiên là tiến hành phân tích cơ bản chuỗi thời gian lưu lượng đỉnh để kiểm tra các lỗi rõ ràng và để đảm bảo dữ liệu tuân theo các giả định được sử dụng trong phân tích tần suất. Một trong những giả định chính trong phân tích tần suất lũ là dữ liệu trong chuỗi thời gian lưu lượng đỉnh phải độc lập và phân phối giống nhau. Một số kiểm định có thể xác minh giả định này đối với chuỗi thời gian cụ thể bao gồm các phép kiểm tra tự tương quan–autocorrelation và tính biến đổi theo thời gian–nonstationarity. Việc quan sát trực quan chuỗi cũng có thể phát hiện các vấn đề cần được xử lý.
Quan sát trực quan – Vẽ dữ liệu
Trước khi thực hiện bất kỳ kiểm định thống kê chính thức nào, việc quan sát trực quan đồ thị chuỗi lưu lượng đỉnh theo thời gian có thể giúp xác định sớm các lỗi tiềm ẩn của dữ liệu. Ví dụ, các giá trị đỉnh có độ lớn khác biệt hẳn so với các giá trị khác cần được kiểm tra. Việc quan sát trực quan cũng có thể cho thấy những thay đổi rõ rệt về trung bình hoặc độ lệch chuẩn của dữ liệu lưu lượng đỉnh theo thời gian. Ví dụ, việc xây dựng một đập và hồ chứa có thể làm thay đổi đáng kể chuỗi lưu lượng đỉnh, và toàn bộ chuỗi trước và sau khi xây đập không nên được dùng chung cho một phân tích tần suất lũ.
Tự tương quan (autocorrelation)
Khuyến nghị rằng chuỗi lũ hàng năm nên được kiểm tra hiện tượng tự tương quan bằng biểu đồ tương quan (correlogram) (Salas, 1993). Trong một chuỗi có tự tương quan, giá trị ở một thời điểm sẽ có tương quan với giá trị ở các thời điểm trước (và sau) đó. Chuỗi có tự tương quan còn được gọi là có tính bền (persistence). Chuỗi dữ liệu thủy văn thường thể hiện tính bền lâu dài. Cần lưu ý rằng tính bền này có thể ảnh hưởng đến việc kiểm định xu thế, như sẽ được trình bày ở phần tiếp theo.
Xu thế và biến đổi đột ngột
Các phương pháp phân tích tần suất lưu lượng đỉnh được trình bày trong tài liệu này chỉ áp dụng khi dữ liệu lưu lượng đỉnh được cho là thuộc cùng một tổng thể cơ sở. Thay đổi trong các quá trình tạo lưu lượng đỉnh có thể dẫn đến các xu thế tăng/giảm dần hoặc sự thay đổi đột ngột trong chuỗi dữ liệu lưu lượng đỉnh. Các phép kiểm định thống kê về xu thế và biến đổi đột ngột có thể hữu ích để phát hiện những thay đổi này. Tùy theo nguyên nhân và mức độ của các thay đổi, có thể cần áp dụng các phương pháp khác nhau ngoài các phương pháp của Bulletin 17C.
Một tình huống đặc biệt khó xử lý là khi không biết xu thế rõ ràng sẽ tiếp tục, ổn định, hay đảo chiều trong tương lai. Các hướng tiếp cận khả thi để xử lý đã được bàn luận trong tài liệu nghiên cứu, nhưng chưa có sự đồng thuận về thực hành tốt nhất. Do đó, cần có sự đánh giá thận trọng khi phát hiện xu thế.
Sự thay đổi có thể diễn ra từ từ hoặc đột ngột, và các phép kiểm định khác nhau thường được sử dụng để phát hiện cả hai dạng này. Việc quan sát trực quan đồ thị chuỗi lưu lượng đỉnh hàng năm nên là bước đầu tiên khi đánh giá xu thế trong chuỗi dữ liệu. Nên tiếp theo đó là các kiểm định xu thế để đánh giá liệu có sự thay đổi theo thời gian hay không. Tiếp đến có thể áp dụng các phép kiểm định điểm thay đổi (change point test) để xác định sự thay đổi đột ngột, nếu cần. Các phép kiểm định được mô tả dưới đây đã được sử dụng thường xuyên, nhưng cũng có thể cân nhắc các phương pháp khác.
Các kiểm định xu thế (trend tests) và phân tích điểm thay đổi (change point analysis) thường được thực hiện dựa trên các giá trị trung bình của một chuỗi dữ liệu, nhưng cũng có thể xem xét các kiểm định về sự thay đổi phương sai của chuỗi dữ liệu. Cần lưu ý rằng các kiểm định này có thể nhạy cảm với các điểm bắt đầu và kết thúc được dùng trong phân tích. Ví dụ, nếu khoảng thời gian ghi nhận dữ liệu tình cờ bắt đầu hoặc kết thúc với một đỉnh lớn, có thể xuất hiện xu thế rõ rệt trong dữ liệu. Tuy nhiên, xu thế này có thể chỉ là kết quả của mẫu dữ liệu cụ thể được sử dụng. Một chuỗi dữ liệu dài hơn hoặc ngắn hơn một chút có thể sẽ không cho thấy cùng một xu thế rõ rệt.
Trong các trường hợp khác, khoảng thời gian ghi nhận dữ liệu có thể chỉ bao gồm giai đoạn khô hạn hoặc ẩm ướt của một dao động có chu kỳ dài. Xu thế rõ rệt khi đó là kết quả của độ dài ghi nhận hữu hạn, nhưng trong tình huống này, cần một khoảng thời gian ghi nhận dài hơn nhiều để hiểu đầy đủ về dữ liệu.
Kiểm định thống kê
Một phép kiểm định phổ biến cho xu thế trong chuỗi thời gian là kiểm định Mann–Kendall. Kiểm định này dùng Kendall’s τ làm thống kê kiểm định để đo mức độ mạnh của mối quan hệ đơn điệu giữa lưu lượng đỉnh năm và năm mà nó xảy ra. Kiểm định Mann–Kendall là phi tham số, không yêu cầu dữ liệu phải tuân theo một phân phối thống kê cụ thể. Thống kê được tính từ chênh lệch giữa số cặp dữ liệu đồng biến và nghịch biến của các lưu lượng đỉnh quan trắc theo thời gian, chứ không dựa vào độ lớn tuyệt đối của các giá trị dữ liệu (Helsel and Hirsch, 2002). Giá trị τ dương cho thấy lưu lượng đỉnh năm có xu thế tăng theo thời gian trong giai đoạn có số liệu; ngược lại, τ âm cho thấy lưu lượng đỉnh năm giảm theo thời gian trong giai đoạn đó.
Tương tự các phép kiểm định thống kê khác, có thể tính giá trị p (p-value) cho kiểm định này. Lưu ý rằng các giá trị p chỉ đúng/đáng tin khi chuỗi năm không có tự tương quan (serial correlation). Yêu cầu này có thể gây khó khăn với các chuỗi thời gian thủy văn, vốn có thể biểu hiện tính dai dẳng (persistence) ngắn hạn và dài hạn (Cohn and Lins, 2005).
Ngoài ý nghĩa thống kê của xu thế, cũng cần xem xét độ lớn thực tế của xu thế. Độ dốc Theil (Helsel and Hirsch, 2002, tr. 266) có thể được tính kết hợp với Kendall’s τ cho mục đích này. Nó được tính như trung vị của tất cả các độ dốc thu được khi xét mọi cặp có thể giữa giá trị lưu lượng đỉnh và năm, và là một ước lượng phi tham số của độ dốc.
Trong một số tình huống, có thể xảy ra sự thay đổi đột ngột (McCabe và Wolock, 2002) hay biến đổi trong chuỗi thời gian thay vì một xu thế dần dần. Ví dụ, có thể tồn tại các giai đoạn rõ rệt với các đặc trưng lũ khác nhau trước và sau khi lắp đặt các công trình kiểm soát lũ. Ở những trường hợp khác, nguyên nhân của bước nhảy có thể không rõ ràng, nhưng vẫn có thể phát hiện các thay đổi đột ngột. Chẳng hạn, Villarini and others (2009a) tìm thấy các bước nhảy dường như trùng với thay đổi vị trí trạm đo dòng chảy.
Để làm tinh phân tích, sau khi kiểm định xu thế đơn điệu có thể thực hiện thêm kiểm định bước nhảy. Kiểm định tổng hạng Wilcoxon (còn gọi là kiểm định Mann–Whitney) hoặc kiểm định Kolmogorov–Smirnov đều là các kiểm định phi tham số có thể dùng để kiểm tra sự khác biệt giữa hai mẫu, khi có giả thuyết phù hợp để chia chuỗi thời gian thành hai hay nhiều đoạn (Helsel và Hirsch, 2002). Không nên xác định bước nhảy tiềm năng chỉ dựa trên quan sát trực quan dữ liệu, vì làm vậy sẽ gây thiên lệch cho kiểm định.
Kiểm định Pettitt (Pettitt, 1979; Mallakpour và Villarini, 2016) và Mô hình thay đổi trơn của Lombard (Lombard, 1987; Nayak và Villarini, 2016) đều đã được đề xuất như các kiểm định thay thế cho thay đổi đột ngột mà không yêu cầu nhà phân tích phải chỉ định trước nơi có khả năng xảy ra thay đổi (Villarini and others, 2009a; Quessy and others, 2011). Thông tin bổ sung về các kiểm định này có thể tìm thấy trong Helsel và Hirsch (2002) và các giáo trình thống kê khác. Một số thông tin về kiểm định điểm thay đổi (changepoint) có trong phần tài liệu bổ sung trên trang Bulletin 17C tại: https://acwi.gov/hydrology/Frequency/b17c/.
Ví dụ—Sông Skokie gần Highland Park, Illinois
Ví dụ này sử dụng dữ liệu từ trạm đo của USGS số 05535070, sông Skokie gần Highland Park, Illinois. Hình 4–1 cho thấy đồ thị chuỗi dữ liệu của sông Skokie. Lưu vực này có diện tích 21,1 dặm vuông (mi²) và đã ngày càng đô thị hóa theo thời gian.
Tỷ lệ diện tích đô thị hóa vào đầu giai đoạn ghi nhận năm 1967 là khoảng 0,60 và tăng lên khoảng 0,90 vào năm 2014 (Over and others, 2016). Quan sát trực quan chuỗi dữ liệu cho thấy xu thế tăng theo thời gian.
Xu thế quan sát được này được xác nhận bằng kiểm định Mann–Kendall. Kết quả kiểm định như sau:
τ = 0,321, p-value = 0,00156, và hệ số dốc Theil = 8,4 ft³/s mỗi năm.
Lưu lượng đỉnh hàng năm tại trạm này không có tự tương quan đáng kể, như thể hiện ở hình 4–2. Điều này cho thấy p-value ước lượng là phù hợp và không bị ảnh hưởng bởi tính tự tương quan.

Hình 4–1.
Biểu đồ chuỗi dữ liệu tại trạm đo USGS số 05535070 trên sông Skokie gần Highland Park, Illinois. Lưu lượng đỉnh hàng năm tại trạm này đã tăng do quá trình đô thị hóa. Đường kẻ trong hình là đường Theil được hiệu chỉnh, với độ dốc 8,4 ft³/s mỗi năm.

Hình 4–2.
Biểu đồ tự tương quan tại trạm đo USGS số 05535070 trên sông Skokie gần Highland Park, Illinois. Các giá trị đỉnh hàng năm không thể hiện bất kỳ tự tương quan có ý nghĩa thống kê nào đối với các độ trễ thời gian từ 1 đến 15 năm. Các đường nét đứt biểu thị các ngưỡng cho tự tương quan có ý nghĩa thống kê.
Hỗ trợ duy trì trang:
Tôi xây dựng trang này để chia sẻ các tài liệu kỹ thuật cốt lõi trong thiết kế hạ tầng giao thông.
Nếu bạn thấy nội dung hữu ích và muốn góp phần duy trì trang hoạt động bền vững, tôi rất trân trọng mọi sự ủng hộ.