Кой (или какво е) най -добре при прогнозиране на победителите в мартската лудост?

Що се отнася до прогнозирането на победителите в March Marchness, кой знае най -добре: експерти, алгоритми или тълпата?

Кой (или какво е) най -добре при прогнозиране на победителите в мартската лудост?

Приблизително 45% от американците ще попълни турнирна категория на NCAA тази година. Това е повече от броя на гласувалите в Междинните избори през 2010 г. . И докато часовникът удари 12:15 часа. на 15 март и действителните топки започват да се хвърлят върху действителните кошници, всеки от нас може да се преструва, че е най -умният човек или момиче в стаята, когато става въпрос за прогнози за лутната лудост.



Но кой (или какво) наистина знае най -добре? Миналия месец разгледахме алгоритмичните, социалните и експертните подходи за прогнозиране на носителите на Оскар и установихме, че комбинация от експертно мнение и алгоритмичен анализ е най -успешната тактика. Сега, в навечерието на любимата предсказваща оргия на Америка, March Madness, задаваме отново въпроса: роботите, писателите или тълпата като цяло са най-добрите предсказатели?

Със сигурност хората, на които им се плаща да гледат баскетбол в колежа, си знаят какво правят, нали? Но докато всички експерти -анализатори на CBS Sports, с изключение на един очаква Кентъки да спечели всичко , прогнозите силно се различават извън мача на шампионата. Освен това експертите може да са по -склонни да изберат разстройства, защото, хей, им се плаща, за да знаят нещо, което останалият свят не знае. И какъв по -добър начин да докажеш това, отколкото да хвърляш чудовищни ​​смущения по стената и да видиш какви клечки?
Проблемът е, че макар да се случват смущения, те обикновено не са тези, които предвиждаме. Според проучване, проведено от Университет на Индиана (четвъртият семена в Южния регион , между другото), ще имате равен или по -добър процент на успех, като се доверите на засяването на комисията за подбор и изберете нулеви нарушения, независимо от вашия спортен опит. Но тъй като това не е забавно, нека разгледаме няколко други подхода.

Вторият вариант е да се доверите на мъдростта на тълпата. Блогърите в Хупизъм са събрали данни от информационната услуга за залагания Sports Insights за показване на процента на реални залози, направени за или срещу всеки отбор. Но тъй като данните се основават на реални залози, сайтът съдържа само прогнози за ранните игри, в които отборите вече са взели решение.



Това ни оставя с алгоритмичния подход и малцина са виждали повече компютърно базирани модели за прогнозиране от Дани Тарлоу и Ли-Минг Дзен. Подобно на много други, Тарлоу и Дзен управляват ежегоден пул от турнири на NCAA. Но това, което ги прави уникални, е, че всеки запис трябва да се компилира от машина без да се съобразява с човешката преценка.

Преди три години имах предвид две неща, каза Тарлоу, докторант по компютърни науки в Университета в Торонто. Първо, работих върху изграждането на препоръчителна система, подобна на използваната в предизвикателството Netflix. Второ, тази година не бях обърнал внимание на колежанския баскетбол, но трябваше да попълня скобата си за басейн с няколко приятели. В един момент ми направи впечатление, че мога да използвам точно същия алгоритъм за препоръки, който кодирах, за да направя моите скоби.

какво търсят вербувачите

Тарлоу продължи да обяснява как компютрите се справят с човешките си колеги в миналогодишното състезание. Включихме три човешки изходни линии: винаги избираме по-високото семе, скобата, предвидена от Нейт Силвър, и личната скоба на Лий. Срещу това поле машините спечелиха. (За непосветените, Ню Йорк Таймс Нейт Силвър създава скоба всяка година, съчетавайки човешки и компютърни системи.)



Тарлоу и Дзен са съгласни, че макар успеваемостта на всеки алгоритмичен подход да варира значително, компютрите се подобряват всяка година. Подходите и настройките определено стават по -сложни, каза Дзен. Но дори и тогава само надраскваме повърхността.

Тарлоу се съгласи, че тепърва им предстои дълъг път. Просто ще кажа, че още не съм взел банковата си сметка и съм тръгнал към Вегас, каза той.

Не е нужно да създавате свой собствен алгоритъм, за да получите малко роботизирана помощ за вашата скоба. Има много безплатни компютърно базирани модели за предсказване, от номерFire да се Мощност ранг (която показва своите прогнози в атрактивна визуализация). Но ако има едно нещо, с което повечето от предсказателите са съгласни, човешко или друго, то е, че интелигентните пари са на първо място като цяло Кентъки, за да приберат шампионския трофей. От друга страна, ESPN бърза да отбележи, че номер 1 като цяло има спечели само веднъж откакто комисията започна да раздава това отличие преди осем години.



Всичко това разкрива онова, което вече тайно знаехме, дори ако егото ни преди турнира се опитва да ни каже друго: Няма надежден метод за предвиждане на спорта, без значение колко добре познат е човекът или колко напреднал е алгоритъмът. Така че, Америка, престани да агонизираш над скобата си и се върни на работа.

[ Изображение: Потребител на Flickr Ерик Чарлтън ]