Yaşam
FUTBOL Veriye Dayalı Bir Evrim
Son yirmi yılda veri analitiğinin etkisi her türden işletmede olduğu kadar; sağlık, medya ve spor gibi alanlarda da günden güne büyüyor. Birkaç yıl öncesine kadar futbolun bu eğilimden muaf olduğu düşünülüyordu. Günümüzde ise büyük futbol liglerindeki takımlar, veri analitiğine yapılan yatırımların sağlamaya başladığı rekabet avantajı sayesinde gelişiyor. Liverpool, AZ Alkmaar ve Brentford hızla büyüyen başarılı vaka çalışmaları listesinde bu örneklerden sadece birkaçını oluşturuyor.
FUTBOL ANALİTİĞİNİN KISA BİR TARİHİ
Futbol analitiği aslında düşündüğünüz kadar genç bir disiplin değil. Analitiği kullanan ilk kişi, İkinci Dünya Savaşı'ndan sonra bir kalem ve kâğıt kullanarak futbol maçları hakkında veri toplamaya ve analiz etmeye başlayan Charles Reep adlı İngiliz Kraliyet Hava Kuvvetleri'ndeki bir muhasebeciydi.
Reep, çoğu golün üçten az pasla atıldığı ve bu nedenle topu sahada mümkün olan en kısa sürede ileriye taşımanın önemli olduğu sonucuna vardı. Teorisi “long-ball” olarak tanındı ve özellikle 80'lerde İngiliz futbolu üzerinde uzun yıllar büyük etkisi oldu. Charles Reep, Brentford, Wolverhampton ve Sheffield Wednesday’de çalıştı. Ayrıca Wimbledon, Watford ve Norveç Milli Takımı ile de iş birliği yaptı ve bu süre boyunca her zaman doğrudan hücum tarzını savundu. Ancak Reep'in vardığı sonuçların yanlış olduğu daha sonra ortaya çıktı. Jonathan Wilson (“Inverting the Pyramid” kitabının yazarı), Reep'in analizlerinde incelediği oyunlardaki hamlelerin %91,5'inin üç veya daha az pasa sahip olduğuna dikkat çekti; bu da haliyle, tüm gollerin büyük oranda bu hamlelerden gelmesi gerektiği anlamına geliyordu.
Charles Reep’in büyük bir tutkuyla bir araya getirdiği veri tabanını analiz ettikten sonra vardığı sonuçları yanlış olsa da günün sonunda o bir veri bilimcisi değil, bir muhasebeciydi ve veri analizinin futbolda kullanımı büyük ölçüde Reep sayesinde başlamış oldu.
Charles Reep’in bu hikayesi, rekabet avantajı elde etmek için verinin tek başına yeterli olmadığının açık bir örneğidir; çünkü daha önemli olan verileri yorumlama yeteneğidir. Veri tabanları büyümeye devam ettikçe ve veri bilimcilerinin rolü giderek arttıkça, bu durum da giderek daha belirgin hâle geliyor.
Verileri yorumlayabilmenin ne kadar önemli olduğunu belki şu şekilde açıklayabiliriz. Örneğin; futbol kulüpleri çok büyük verilerle dolup taşsa da bu verileri yorumlayıp, eyleme geçirilebilir bilgileri ayırt edecek dahili bilgi birikimine sahip değilse veriler neredeyse anlamsız hâle gelir. Bu, finansal piyasalar hakkında bir fikri olmayan bir kişiye hisse senetleri, para birimleri ve emtialarla ilgili tüm fiyatları, oranları ve göstergeleri vermeye benzer çünkü verilerin kendisi o kişiyi güvenilir bir borsa simsarı yapmaz. Futbol takımlarının elbette iyi kararlar almak için verilere ihtiyacı var ama aynı zamanda tüm bunları anlamlandırabilmek için analizlere de ihtiyaçları var.
MONEYBALL'DAN SONRA SPOR ANALİTİĞİNİN YÜKSELİŞİ
Michael Lewis tarafından 2003'te yayınlanan Moneyball: The Art of Winning an Unfair Game isimli kitap, spor analitiğinin daha geniş bir kitleye gerçek tanıtımı olarak kabul edilir. Kitap, Oakland Athletics beyzbol takımı ve genel müdürü Billy Beane'e odaklanır. Kitaptan sekiz yıl sonra seyirciye sunulan, Brad Pitt ve Jonah Hill'in başrollerinde olduğu Moneyball filmi ise, sabermetrics (beyzbol veri ve olgularının istatistiksel analizi) ve spor analitiği kavramlarının popülerleşmesinde oldukça etkili olmuştur.
Kitaba göre; veri ve istatistik analizleri beyzbolla tanışmadan önce, takımlar oyuncuları bulmak ve değerlendirmek için scoutlarının becerilerine bağımlıydı. Michael Lewis kitabında, Oakland A'nın ön ofisinin, oyuncuları bulmak ve Major League Baseball'daki daha zengin rakiplere karşı daha zeki ve daha iyi rekabet edebilecek bir takım oluşturmak için analitik oyuncu performansı göstergelerinden yararlandığını savunuyor. Takım geçmişte, 13 Ağustos ve 4 Eylül 2002 tarihleri arasında art arda 20 maç kazanmasıyla ünlendi. Oakland Athletics’in bu trende öncülük etmeye başlamasından kısa süre sonra, diğer tüm MLB takımları da sonra onları takip etti. Birkaç yıl içinde basketbol ve Amerikan futbolu gibi diğer ABD sporları giderek daha fazla veriye dayalı olmaya başladı.
Futbol menajerleri başlangıçta şüpheci davrandılar. Çoğu insan, Amerikan sporlarından farklı olarak, futbolun veriler kullanarak analiz edilmesinin imkânsız olacağını düşündü. Ancak birkaç inatçı insan onlarla aynı fikirde değildi ve bir veri devrimi başlatmaya karar verildi. Bu kişilerden biri de, futbolla derinden ilgilenen Billy Beane'in kendisiydi. Liverpool, AZ Alkmaar, FC Midtjylland ve Brentford'un başarılı vaka çalışmaları, futbolda veri analizini doğru yapanların çok önemli bir rekabet avantajı kazandığını gösteriyor.
FUTBOLDA VERİ ANALİTİĞİ UYGULAMALARI
Son birkaç yılda verilerin toplanmasını, depolanmasını ve analizini destekleyen teknolojilerin katlanarak artan hızı, spor analitiğine yapılan yatırımların artışıyla el ele gitti. Veri kümeleri hem nicelik hem kalite açısından inanılmaz derecede gelişti. Ancak bize göre, sektörde son beş yılda gördüğümüz gelişmeler, önümüzdeki beş yılda olacakların gölgesinde kalacak. Veri kümeleri büyüdükçe ve geliştikçe, veri analitiğinin oyundaki potansiyel uygulamalarının sayısı çoğaldı ve futbol analitiğini oldukça genel bir kavram haline getirdi. Aşağıda, ana uygulama alanlarını özetlemeye çalıştık.
SCOUTING
- Tasarruf: Oyuncuları geniş ve ayrıntılı veri tabanlarında aramak, kulüplerin inanılmaz miktarda zaman ve para tasarrufu yapmalarına olanak tanır. Scout, istenen filtreleri uyguladıktan sonra, seçimlerini istediği sayıda oyuncuyla sınırlayabilir ve bu grubun videolarını izlemeye başlayabilir. Elbette veri tabanları scoutların yerini alamaz, ancak yetenek belirleme becerilerini tamamlayabilir.
- Hafıza: Desteklediğiniz takımın geçen sezonlardaki tüm hareketlerini, tüm şutlarını, tüm ortalarını ve driplinglerini hatırlıyor musunuz? Tabii ki hayır. Bu soruyu favori oyuncunuzla sınırlasak bile aynı şey muhtemelen geçerli olacaktır. Fakat, sizin aksinize bir bilgisayarın favori bir takımı veya oyuncusu olmasa da geçmiş sezonlarda olan “her şeyi” hatırlayabilir. Bu avantaj, özellikle scoutlar için şüphesiz paha biçilmez olacaktır.
- Ön yargıları sıfırlamak: Veri tabanlarına göz gezdirmek çoğu zaman sezgisel olmayan sonuçlara yol açar. Bazı durumlarda, bunlar “yanlış pozitifler” olabilir. Diğer durumlarda ise, gözleri belirli oyuncudan istenen beceriyi yakalamayan scoutlara, oyuncuyu bir sonraki izleyişinde doğru gözlem yapabilme fırsatı tanır.
AKILLI KEŞİFLER: LIVERPOOL
2010'da Liverpool, 2002'den beri Boston Red Sox beyzbol takımının sahibi olan Amerikan şirketi Fenway Sports Group tarafından satın alındı. Ampirik analizlere çok düşkün olan Red Sox, Billy Beane'i işe almaya çalıştı fakat kendisi, teklifi geri çevirerek Oakland Athletics'te kalmayı tercih etti. Bunun yerine Red Sox, kulübün Özel Danışmanı olarak ampirik analizin öncülerinden biri olan Bill James'e döndü. "Sabermetrics" terimi, 1971'de kurulan "Amerikan Beyzbol Araştırmaları Derneği" anlamına gelen SABR kısaltmasından türetilen Bill James tarafından türetildi.
Red Sox, 84 yıldır World Series'i (ABD beyzbol ligi final maçları serisine verilen isim) kazanamamıştı ve lanetlendiği konusunda ciddi şüpheler bile bulunuyordu. 2004'te, Red Sox laneti kırmayı başardı ve 2007, 2013 ve 2018'de tekrar World Series'i kazanarak gelmiş geçmiş en iyi beyzbol takımlarından biri oldu.
Fenway Sports Group tüm bu başarılardan sonra, Liverpool'da, veri analitiğine para yatırarak planını tekrarlamaya karar verdi. Kısa süre sonra Damien Comolli'yi Futbol Stratejisi Direktörü olarak işe aldı. Comolli, Tottenham'da Luka Modric ve Dimitar Berbatov ile sözleşme imzaladığı sıralarda, veriler aracılığıyla gizli mücevherleri ortaya çıkarma konusunda bir üne sahipti.
Liverpool'da, Luis Suarez ve Jordan Henderson ile sözleşme imzalanmasına rağmen 2012 baharında kulüpten ayrılan Comolli için işler plana göre gitmedi. Yine de Liverpool'dan ayrılmadan önce önemli son bir transfer yaptı ve bu hamle kulübün başarıları için çok önemli hale geldi. Ve bu transfer bir oyuncu değil, Michael Edwards isimli bir veri analistiydi.
Comolli tarafından performans ve analiz başkanı olarak atanan Michael Edwards, Kasım 2016'da Liverpool'un ilk spor direktörü olarak atandı. Edwards, fizik alanında doktorası bulunan Cambridge mezunu Ian Graham tarafından yönetilen dört kişilik bir araştırma ekibiyle çalışmaya başladı. Araştırma ekibinde, astronomi doktorası bulunan Tim Waskett, istatistik araştırmacısı Dafydd Steele ve eski CERN çalışanı, fizikçi William Spearman bulunuyordu. Görünüşe göre bu grup futbol analitiğinin rüya takımıydı. Veri analizine meraklı futbol takımlarında bu kadar güçlü geçmişlere sahip en fazla bir kişi bulunurken, aynı anda dördüne sahip olmak eşi görülmemiş bir örnekti.
Performans verilerini anlama ve anlamlandırma yeteneği, Liverpool'un Jürgen Klopp'un stiline en uygun oyuncuları bulmasını sağladı. Liverpool'un düzeninin bir diğer önemli özelliği de Klopp başkanlığındaki teknik koçlar ile veri bilimcileri arasında karşılıklı güven ve saygıyla beslenen bir ilişki olan muhteşem uyumun sağlanmış olmasıdır. Verilerinin artan kalitesi ve miktarı, Liverpool'un transfer piyasasında emsallerine göre daha bilinçli teklifler vermesine izin verdi, çünkü kulüp, rakiplerinin aksine oyuncular hakkında çok daha fazla bilgiye sahipti ve bu nedenle değerlemelerinde daha düşük bir risk indirimi uygulayabildi.
Mohamed Salah, Alisson ve Virgil van Dijk'in satın alımları o zamanlar çok pahalı görünüyordu. Fakat, Liverpool onları satın aldığından beri oyuncuların değerleri önemli ölçüde arttı. Aşağıdaki tabloda 2016/17 sezonundan (Edwards’ın Spor Direktörü olarak ilk tam sezonu) bu yana Liverpool'un en önemli transferleri (10 milyon Euro'nun üzerindeki satın almaları) belirtilmiş ve satın alma ücretleri mevcut değerleme (COVID sonrası) veya satış ücretleriyle karşılaştırılmıştır. (Joel Matip gibi ücretsiz transferler veya Andrew Robertson gibi 10 milyon Euro'nun altındaki transferler dahil edilmemiştir.)
PERFORMANS ANALİZİ
Futbol kulüpleri, medya ve hatta taraftarlar, verilerin desteğiyle bir takım veya oyuncunun bir maç veya sezon boyunca nasıl performans gösterdiğini kolayca anlayabilir. Şut sayısı, hedefe yapılan şut sayısı ve topa sahip olma gibi en temel istatistikler bile bizlere, iki takımın nasıl performans gösterdiği ve performanslarının maçın sonucuyla uyumlu olup olmadığı konusunda eksik de olsa bir rehber sunabilir. İstatistiklerin ayrıntı düzeyini iyileştirip seçilen performans göstergelerini de bu gözlemlere dahil edersek, veri seti yavaş yavaş sahada olup bitenlerin daha tanımlı ve eksiksiz bir resmini vermeye başlar ve bu da oyunun ayrıntılı bir analizini sağlar. Böyle bir ayrıntı düzeyi, bir antrenöre takımın nasıl performans gösterdiği ve hatta maç öncesi talimatlara uyup uymadığı hakkında daha fazla bilgi sunabilir.
Performans analizleri normalde video ve verileri içerir. Günümüzde, maç sonrası oyuncularına video ve istatistikler yardımıyla, neyi yanlış yapıldığını, hangi hareketlerin iyileştirilebileceğini açıklayan koçlar giderek daha yaygın hale geliyor. Ayrıca, büyük veri analizi, üzerine yenilikçi ve kazanan bir strateji oluşturabileceğimiz futbolla ilgili sezgisel olmayan gerçekleri keşfetmemize de yardımcı olur. Örneğin, eski usul orta-uzun mesafeli pasların çok da etkili bir strateji olmadığı giderek daha çok savunulur hale gelmiştir.
GOL BEKLENTİSİ (EXPECTED GOALS - XG)
Gol beklentisi terimi, futboldaki en devrimci ve aynı zamanda basit, gelişmiş ölçütlerden biridir. Bir "xG", bir şuttan beklenen değeri, yani o şutun gol olma olasılığını temsil eder. Böyle bir olasılığın hesaplanması, hedefe olan mesafe, şut açısı, şutun yapıldığı vücut kısmı (kafa, güçlü veya zayıf ayak), oyun durumu (açık oyun, kontra atak) gibi bir dizi faktöre bağlıdır.
Gol beklentisi değeri normalde "sıklıkçı" bir yaklaşım kullanılarak hesaplanır. Birkaç bin atıştan oluşan bir veri seti, yukarıda belirtilen değişkenlere göre (uzaklık, açı, vücut kısmı vb.) sınıflandırılır. Örneğin, veri kümesinde 10.000 kez gerçekleşen bir atış türü 200 kez puanlanırsa, bu tür atışın xG'si 0.02 (%2 olasılık) olarak "beklenir". Bu metodolojiyi kullanarak, bir cezanın 0,76 beklenen gol değerinde olduğunu belirleyebiliriz. Bir diğer deyişle, bir penaltının %76'lık bir gol olma olasılığı vardır.
ASİST BEKLENTİSİ (EXPECTED ASSİSTS - XA)
"Asist beklentisi" değerleri, "gol beklentisi" değerlerinden türetilir. Bu değerler, belirli bir pasın gol asistine dönüşme olasılığını ölçer. xG değeri bir gol şansının kalitesini ifade ederken, xA değeri bir pasın kalitesini ifade eder. Basitçe söylemek gerekirse, xA değeri, o pasın gerçekten bir şuta ve nihayetinde bir gole dönüştürülüp dönüştürülmediğine bakılmaksızın, bir pasın ne kadar asiste dönüştürülebileceğine çok önemli bir vurgu yapar. Genellikle, bir oyuncu tarafından yapılan her pasa bir xA değeri atanır, ancak çoğu zaman düşük olsa da bir oyuncu tarafından yapılan tüm paslar şans yaratamaz. Örneğin, bir oyuncu tarafından kale sahası içinde yapılan bir pasın, ceza sahası dışında yapılan bir pasın aksine, gol olma olasılığı daha yüksektir ve daha yüksek bir xA değerine sahip olacaktır.
SAKATLANMAYI ÖNLEME VE REHABİLİTASYON
2000'li yılların başından bu yana, antrenman yüklerinin (sakatlanma/yaralanma riskini azaltma ve spor performansını artırma fırsatları sağlayabilen değiştirilebilir bir risk faktörü) nasıl izlendiğine ilişkin araştırmalarda üstel bir artış oldu ve bu da spor bilimcilerinin analizlerini güçlü temellere dayandırmasına olanak sağladı. Günümüzde herhangi bir üst düzey kulüp, oyuncuların pozisyonunu sürekli olarak izlerken, GPS ile hız takibi, oyuncuların harici yükünü, yani sahada yapılan iş miktarını nesnel olarak ölçmelerine olanak tanır. Antrenman ve maçlar sırasında harici yükü ölçmek için en sık kullanılan değişkenler şunlardır: farklı hız bölgelerinde kat edilen mesafe (yavaş tempo koşu, normal tempo koşu, sprint), ivme, kalp atış hızıyla ilgili değişkenler ve ivmeölçer ölçümleri (oyuncu yükü, yoğunluk).
GPS aracılığıyla harici yük takibi, profesyonel oyuncuların yaralanma riskini tahmin etmek için de kullanılabilir. Son araştırmalar, futbolcuların sakatlıklarının genellikle antrenman ve maçlar sırasında oyuncuların iş yüklerine bakılarak tahmin edilebileceğini göstermiştir. Araştırmacılar, en büyük yaralanma riskinin, oyuncuların üç haftalık bir süre boyunca antrenman sırasında çok yüksek sayıda kısa süreli hız patlamaları yaptığı zaman oluştuğunu keşfetti. Oyuncular, bir yaralanmadan önceki haftalarda, mevsimsel ortalamalarına kıyasla önemli ölçüde daha yüksek “dakika başına metre” kaydettiler ve bu, yaralanmalara yol açan antrenman ve oyun yoğunluğunda bir artış olduğunu gösteriyor.
Kaynaklar:
- Jess Middleton, How analysts are changing football, https://www.dataiq.co.uk/articles/articles/how-analysts-are-changing-football ( 12 Mart 2022)
- Soccerment Research, The Growing Importance of Football Analytics, https://soccerment.com/the-importance-of-football-analytics/ (12 Mart 2022)
- Nathan Luzum, Michael Model Metrics, https://sites.duke.edu/socceranalyticsrevolution/metrics/ (12 Mart 2022)
- Manja Bogicevic, Football: A Data-Driven Evolution, https://blog.cambridgespark.com/how-data-science-is-changing-the-world-of-football-64df28f36996 (12 Mart 2022)
· https://bilimfili.com/futbol-veriye-dayali-bir-evrim / Zeynep Senis