Tôi đã chứng kiến một tiền đạo bỏ lỡ sáu cơ hội trong một trận đấu và mọi người đều cho rằng anh ta đã hết thời. Số bàn thắng kỳ vọng (xG) của anh ta lại cho thấy một câu chuyện khác: anh ta sút tốt hơn bất kỳ ai khác trong giải đấu. Hai tuần sau, anh ta ghi năm bàn sau ba trận.
Đó là lúc tôi nhận ra khoảng cách giữa những gì người hâm mộ thấy và những gì các con số thực sự thể hiện. Sau đây là cách những người hâm mộ thông minh sử dụng toán học để dự đoán hiệu suất trước khi nó hiển thị trên bảng điểm, và tại sao bài kiểm tra thị lực truyền thống lại bỏ sót nhiều hơn là bắt được.
Những con số quan trọng
Ngày nay, số liệu thống kê cầu thủ còn sâu sắc hơn nhiều so với số bàn thắng và kiến tạo. Bàn thắng kỳ vọng (xG) đo lường chất lượng cú sút bằng cách kiểm tra xem cú sút đến từ đâu và chịu áp lực nào. Điều đó có nghĩa là một tiền đạo có xG cao nhưng số bàn thắng thực tế thấp có thể là do kém may mắn chứ không phải do kém.
Các đội sử dụng phân tích nâng cao đã giảm khoảng 30% các chấn thương nghiêm trọng như rách gân kheo và tổn thương dây chằng chéo trước (ACL). Khoản đầu tư 5 triệu bảng Anh vào phân tích của Liverpool FC trùng khớp với mức tăng trưởng doanh thu 200 triệu bảng Anh từ năm 2015 đến năm 2022, cho thấy chi tiêu cho dữ liệu có thể phù hợp với kết quả kinh doanh như thế nào.
Các số liệu thống kê quan trọng mà người hâm mộ nghiêm túc theo dõi bao gồm:
- Tỷ lệ đỗ thành công ở các khu vực khác nhau
- Sức mạnh ép được đo bằng khoảng cách di chuyển ở tốc độ cao
- Sự phục hồi phòng ngự cho thấy các đội nhanh chóng lấy lại phong độ như thế nào
- Cách tính điểm cố định được chia nhỏ theo kiểu giao bóng
Liên quan: Aguero: Người hâm mộ Atletico Madrid phải học cách trân trọng Alvarez
Tìm kiếm lợi thế thông qua toán học
Máy tính chênh lệch giá Hãy để những người cá cược thông minh chốt lời chắc chắn từ nhiều nhà cái khác nhau khi tỷ lệ cược không khớp. Nguyên lý toán học này hiệu quả vì các nhà cái đôi khi định giá cùng một trận đấu khác nhau. Điều này tạo ra những khoảng trống nhỏ, nơi việc đặt cược tất cả các kết quả vẫn mang lại lợi nhuận.
Đó là lý do tại sao việc hiểu cách tính tỷ lệ cược bóng đá sẽ giúp bạn phát hiện ra khi nào nhà cái đưa ra mức giá sai. Đôi khi tỷ lệ cược không khớp với dữ liệu hiển thị, và đó chính là lúc giá trị được đặt lên hàng đầu.
Các mô hình dự đoán tiến xa hơn nữa bằng cách sử dụng máy học để xử lý các tập dữ liệu khổng lồ nhanh hơn con người rất nhiều. Các mô hình này phân tích hiệu suất trong quá khứ, báo cáo chấn thương, dữ liệu thời tiết và thậm chí cả các cuộc trò chuyện trên mạng xã hội để dự đoán kết quả. Giải đấu Big Data Bowl của NFL đã thúc đẩy mạnh mẽ việc dự đoán chuyển động. Các số liệu trước đây tập trung vào các kết quả như số yard đạt được và tỷ lệ hoàn thành, nhưng việc mô hình hóa đường đi thực tế của cầu thủ đã mở ra một hướng đi hoàn toàn mới.
Nơi mà hầu hết người hâm mộ đều sai
Tôi đã thấy nhiều người xây dựng những mô hình cầu kỳ nhưng lại bỏ qua bối cảnh cơ bản. Thành tích phòng ngự của một đội chẳng có ý nghĩa gì nếu ba cầu thủ chính bị chấn thương tuần trước, vậy mà các mô hình lại xử lý dữ liệu lịch sử đó như thể nó vẫn còn quan trọng.
Cần phải đọc số liệu một cách thông minh, chứ không phải tin tưởng mù quáng. Red Sox tụt hạng từ nhà vô địch World Series xuống vị trí cuối bảng mặc dù có thành tích ấn tượng trên lý thuyết. Các mô hình không thể hiện được sự ăn ý, động lực hay cách các cầu thủ xử lý áp lực khi cần thiết.
Dự đoán thông minh cần ba bước kiểm tra: so sánh với dữ liệu lịch sử, thử nghiệm các kịch bản và tham khảo ý kiến chuyên gia. Một mô hình bóng rổ của NCAA từng đánh giá thấp các chuyên gia phòng ngự đến 21% vì nó đánh giá quá cao các chỉ số tấn công từ các trận đấu kết hợp. Điều này cho thấy tại sao tính xác thực lại quan trọng hơn tính phức tạp trong bất kỳ mô hình nào bạn xây dựng.
Putting It All Together
Những nhà dự đoán giỏi nhất kết hợp các mô hình thống kê với nhận thức thực tế. Họ biết khi nào nên tin tưởng vào số liệu và khi nào bối cảnh hoàn toàn lấn át dữ liệu. Một đội bóng có thể có số liệu thống kê sân khách tệ hại, nhưng nếu họ sa thải huấn luyện viên, những con số cũ đó sẽ kể những câu chuyện không đầy đủ. Đây là lý do tại sao việc mù quáng chạy theo mô hình mà không hiểu rõ tình hình đằng sau dữ liệu sẽ dẫn đến những dự đoán sai lầm.
Các công cụ hiện đại như bản đồ nhiệt thời gian thực và biểu đồ chuyển động giúp dễ dàng xử lý dữ liệu phức tạp để đưa ra quyết định nhanh chóng. Hệ thống của Miami Heat sử dụng các thay đổi màu sắc để hiển thị hiệu suất của cầu thủ theo cách mà các huấn luyện viên có thể nắm bắt ngay lập tức trong trận đấu. Tốc độ này rất quan trọng vì bạn không thể dừng trận đấu để tính toán, vì vậy hình ảnh hóa sẽ biến những con số thô thành những thông tin chi tiết tức thời, thực sự ảnh hưởng đến quyết định.


