🔣 Фредерік Єлінек, дослідник природної мови, який керував розробками з розпізнавання мовлення в IBM, відомий своєю суперечливою фразою:
Лінгвістів ця фраза дратує: вони бачать у ній зневагу до себе і своєї професії. Насправді фраза зовсім про інше.
Думка Єлінека полягала в тому, що розвиток ШІ за рахунок вбудовування в нього мовних правил — і взагалі будь-яких правил, за якими, як нам здається, працює людський мозок, — дає лише короткостроковий ефект; у довгостроковій перспективі це глухий кут. Іншими словами, методи, які спираються на масштабування обчислень, набагато ефективніші за всі інші, зокрема ті, які спираються на вбудовування в модель якихось правил. Це так званий гіркий урок щодо ШІ.
Саме тому у сфері машинного перекладу проривом став не класичний машинний переклад на основі правил (RBMT), ефективність якого зумовлена закладеними в модель закономірностями мови, а нейронний машинний переклад (NMT), ефективний насамперед за рахунок астрономічної кількості вхідних даних.
RBMT вимагав лінгвістів, які мали виявляти й формалізувати мовні правила; NMT потрібні не лінгвісти, а дані.
#історіяперекладу #ші #текстімовлення #машиннийпереклад
Щоразу, коли я звільняю лінгвіста, продуктивність нашої системи розпізнавання мови зростає.
Лінгвістів ця фраза дратує: вони бачать у ній зневагу до себе і своєї професії. Насправді фраза зовсім про інше.
Думка Єлінека полягала в тому, що розвиток ШІ за рахунок вбудовування в нього мовних правил — і взагалі будь-яких правил, за якими, як нам здається, працює людський мозок, — дає лише короткостроковий ефект; у довгостроковій перспективі це глухий кут. Іншими словами, методи, які спираються на масштабування обчислень, набагато ефективніші за всі інші, зокрема ті, які спираються на вбудовування в модель якихось правил. Це так званий гіркий урок щодо ШІ.
Саме тому у сфері машинного перекладу проривом став не класичний машинний переклад на основі правил (RBMT), ефективність якого зумовлена закладеними в модель закономірностями мови, а нейронний машинний переклад (NMT), ефективний насамперед за рахунок астрономічної кількості вхідних даних.
RBMT вимагав лінгвістів, які мали виявляти й формалізувати мовні правила; NMT потрібні не лінгвісти, а дані.
#історіяперекладу #ші #текстімовлення #машиннийпереклад