Decaptcha зламала популярні аудіо-капчі

admin Новини технологій та техніки

Decaptcha зламала популярні аудіо-капчіГрупа дослідників зі Стенфордського університету, Університету Тулейн і французького інституту INRIA розробила систему Decaptcha, що без особливих проблем справляється з більшістю сучасних аудіо-капч.

У ході дослідження (PDF) були вивчені аудіо-капчі сервісів eBay, Yahoo, Digg, Authorize.net, Live.com і reCAPTCHA. Всі ці капчі використовують один або кілька голосів, які вимовляють послідовність фіксованої кількості цифр або ж цифр з літерами. На деякі з них накладається звуковий шум того чи іншого характеру.

Дослідники зуміли розробити алгоритм, який, після процесу навчання (підстроювання під кожну з систем аудіо-капч), здатний самостійно зламувати їх з великою часткою ймовірності. Вони вважають, що, оскільки у зловмисників часто є під рукою ботнети, навіть одна успішна спроба зі ста вважалася б хорошим результатом. Однак рубіж в 1% в багатьох випадках вони подолали з лишком.

Зокрема, найменш стійкою до злому виявилася аудіо-капча Authorize, що складається з 5 цифр або букв, які чітко вимовляються жіночим голосом: точність автоматичного розпізнавання такий капчі склала 89%. Потім йдуть eBay c 82%, майкрософтовські Live (48,9%), Yahoo! (45,45%) і Digg (41%).

Окремо стоїть гугловський reCAPTCHA. Decaptcha справляється з цією системою лише в 1,5% випадків, завдяки використанню в ній особливого "шуму". Крім ідучого фоном голосового спілкування, тут присутній звуковий сигнал, який для алгоритму виглядає як зайві цифри (у формі хвилі). На семантичному ж рівні ці сигнали вдається відсіяти (хоча в дослідженні і зазначається, що reCAPTCHA найгірше розпізнається людьми, ми не зазнали з нею особливих труднощів).

Дослідники рекомендують розробникам аудіо-капч вивчити можливості додавання до них такого роду "семантичних шумів". Втім, самі вони теж збираються щільніше зайнятися цими шумами, так що, можливо, в майбутньому і такий захист їм вдасться обійти. Крім того, вони планують вивчати і капчі, що містять цілі слова, а не окремі букви.