Forward from: Telegram Info
Классификатор языков программирования от Telegram
Сегодня Telegram объявил о начале нового конкурса, участники которого должны разработать библиотеку для определения языка программирования с помощью алгоритмов машинного обучения. Почти одновременно с этим событием в репозитории Telegram Desktop появилось упоминание поддержки подсветки кода языков программирования. Редакция @tginfo связывает эти события и считает, что Telegram, вероятно, работает над автоматической подсветкой кода в сообщениях.
Существуют готовые библиотеки для автоматического определения языка программирования, однако все они нередко определяют языки неправильно.
Далеко не во всех случаях такая подсветка нужна, а попытки автоматической разметки сообщения уже после его отправки будут вносить элемент случайности, которому будут рады не все пользователи: «А не решит ли Telegram ошибочно подсветить этот участок моноширинного текста?» или «А правильно ли определится язык программирования?»
Редакция надеется на добавление мессенджером возможности выбирать, использовать ли автоматическое определение языка программирования или нет. Кроме того, вызывает интерес качество решений, которые будут разработаны ML-инженерами за отведённые конкурсом 10 дней.
В API Telegram задать язык программирования для блока кода можно ещё с первых версий мессенджера, но в интерфейсе такую возможность ни один из официальных клиентов, кроме Telegram WebA, не предоставляет.
В Telegram WebA блок кода с заданным языком программирования можно создать следующим образом:
```js
console.log(123 + "Text");
```
К примеру, в неофициальном приложении Nekogram моноширинный текст можно создать либо с помощью опции форматирования «Mono», либо с помощью «Code». Опция «Code» позволяет вручную указать нужный язык программирования либо вовсе отказаться от подсветки кода.
Подсветка кода работает только в WebA и некоторых неофициальных клиентах.
Нужно ли вам автоматическое определение языка программирования в Telegram, или вы бы предпочли указывать его вручную?
Сегодня Telegram объявил о начале нового конкурса, участники которого должны разработать библиотеку для определения языка программирования с помощью алгоритмов машинного обучения. Почти одновременно с этим событием в репозитории Telegram Desktop появилось упоминание поддержки подсветки кода языков программирования. Редакция @tginfo связывает эти события и считает, что Telegram, вероятно, работает над автоматической подсветкой кода в сообщениях.
Существуют готовые библиотеки для автоматического определения языка программирования, однако все они нередко определяют языки неправильно.
Далеко не во всех случаях такая подсветка нужна, а попытки автоматической разметки сообщения уже после его отправки будут вносить элемент случайности, которому будут рады не все пользователи: «А не решит ли Telegram ошибочно подсветить этот участок моноширинного текста?» или «А правильно ли определится язык программирования?»
Редакция надеется на добавление мессенджером возможности выбирать, использовать ли автоматическое определение языка программирования или нет. Кроме того, вызывает интерес качество решений, которые будут разработаны ML-инженерами за отведённые конкурсом 10 дней.
В API Telegram задать язык программирования для блока кода можно ещё с первых версий мессенджера, но в интерфейсе такую возможность ни один из официальных клиентов, кроме Telegram WebA, не предоставляет.
В Telegram WebA блок кода с заданным языком программирования можно создать следующим образом:
```js
console.log(123 + "Text");
```
К примеру, в неофициальном приложении Nekogram моноширинный текст можно создать либо с помощью опции форматирования «Mono», либо с помощью «Code». Опция «Code» позволяет вручную указать нужный язык программирования либо вовсе отказаться от подсветки кода.
Подсветка кода работает только в WebA и некоторых неофициальных клиентах.
Нужно ли вам автоматическое определение языка программирования в Telegram, или вы бы предпочли указывать его вручную?