R4marketing, канал Алексея Селезнёва

@R4marketing Нравится 0 2 500 + ВП

Автор канала Алексей Селезнёв, руководитель отдела аналитики в Netpeak, автор пакетов для языка R: ryandexdirect, rfacebookstat и других.
В канале публикуются статьи, доклады, новости и прочие материалы по языку R.
Для связи: @AlexeySeleznev
Гео и язык канала
Украина, Русский
Категория
Технологии


Написать автору
Гео канала
Украина
Язык канала
Русский
Категория
Технологии
Добавлен в индекс
20.11.2018 22:48
реклама
SearcheeBot
Ваш гид в мире Telegram-каналов
TGStat Bot
Бот для получения статистики каналов не выходя из Telegram
TGAlertsBot
Мониторинг упоминаний ключевых слов в каналах и чатах.
1 479
подписчиков
~750
охват 1 публикации
~645
дневной охват
~6
постов / нед.
50.7%
ERR %
3.3
индекс цитирования
Репосты и упоминания канала
13 упоминаний канала
0 упоминаний публикаций
13 репостов
Блог Шмакова
Диджитал ХА
Новые каналы
Реклама
Интернет-аналитика
Интернет-аналитика
Интернет-аналитика
Интернет-аналитика
BigQuery Insights
WebAnalytics
Каналы, которые цитирует @R4marketing
Последние публикации
Удалённые
С упоминаниями
Репосты
​​Несколько раз меня спрашивали о том зачем нужны пайпланы, т.е. оператор %>%.

Вот мем который поможет разобраться.

Хорошего пятничного вечера!
👍 25
👎
Сегодня многие IDE стремятся к мультиязычности, особенно это касается IDE заточенные под языки для работы с данными, т.е. например R и Python.

RStudio давно умеет выполнять Python скрипты. Теперь и одна из наиболее популярных IDE для Python, PyCharm, имеет бесплатный плагин для запуска R скриптов.

Сейчас плагин в режиме активной разработки, все ваши замечания и пожелания можно направлять в личку https://t.me/vkkoshelev или на почту vladimir.koshelev@jetbrains.com .

Ниже подробное описание плагина от его разработчиков:

Начиная с версии 2019.3, в наших IDE поддерживается язык R. Если большинство плагинов для анализа данных можно устанавливать только на коммерческие версии PyCharm или IDEA, то R Plugin это свободное программное обеспечение, доступное для работы и в Community версиях.

В R Plugin мы стараемся совместить удобство работы с данными RStudio с удобством написания кода в соответствии со стандартами качества IDE от JetBrains.

В данный момент мы поддерживаем интерактивную работу в R Console, включая отображение графиков, таблиц, HTML страниц и документации на лету, так же, как и в RStudio. При этом особое внимание отводится удобству разработки. Например, в R Plugin при отладке можно изменять точки остановки без перезапуска отлаживаемого кода. Наш плагин способен автоматически находить ошибки в коде и предлагать возможные варианты исправления. Также плагин поддерживает рефакторинги, подстветку синтаксиса и способен осуществлять навигацию, в том числе, учитывая незагруженные в данный момент пакеты.

Кроме работы с R скриптами, мы также поддерживаем генерацию отчетов с использованием R Markdown. Все возможности по работе с кодом, доступные для языка R, также работают и для чанков в R Markdown. Результаты выполнения чанков отображаются под ними, также, как это сделано в R Studio.

Ну и наконец, вы также получите прекрасную поддержку версионного контроля, доступную в PyCharm и IDEA.

В данный момент R Plugin доступен в IntelliJ IDEA, PyCharm и DataGrip. Установить R Plugin можно в настройках во вкладке Plugins, написав в строке поиска ”R Language”:

Или же просто открыть R скрипт или R Markdown файл в PyCharm. В этом случае IDE предложит установить плагин автоматически.

Наш плагин сейчас находится в стадии активной разработки и нам очень необходима обратная связь и конструктивная критика. Нашли проблему, не хватает функционала? Пожалуйста, сообщите нам об этом.
Читать полностью
Сегодня многие IDE стремятся к мультиязычности, особенно это касается IDE заточенные под языки для работы с данными, т.е. например R и Python.

RStudio давно умеет выполнять Python скрипты. Теперь и одна из наиболее популярных IDE для Python, PyCharm, имеет бесплатный плагин для запуска R скриптов.

Сейчас плагин в режиме активной разработки, все ваши замечания и пожелания можно направлять в личку https://t.me/vkkoshelev или на почту vladimir.koshelev@jetbrains.com .

Ниже подробное описание плагина от его разработчиков:

Начиная с версии 2019.3, в наших IDE поддерживается язык R. Если большинство плагинов для анализа данных можно устанавливать только на коммерческие версии PyCharm или IDEA, то R Plugin это свободное программное обеспечение, доступное для работы и в Community версиях.

В R Plugin мы стараемся совместить удобство работы с данными RStudio с удобством написания кода в соответствии со стандартами качества IDE от JetBrains.

В данный момент мы поддерживаем интерактивную работу в R Console, включая отображение графиков, таблиц, HTML страниц и документации на лету, так же, как и в RStudio. При этом особое внимание отводится удобству разработки. Например, в R Plugin при отладке можно изменять точки остановки без перезапуска отлаживаемого кода. Наш плагин способен автоматически находить ошибки в коде и предлагать возможные варианты исправления. Также плагин поддерживает рефакторинги, подстветку синтаксиса и способен осуществлять навигацию, в том числе, учитывая незагруженные в данный момент пакеты.

Кроме работы с R скриптами, мы также поддерживаем генерацию отчетов с использованием R Markdown. Все возможности по работе с кодом, доступные для языка R, также работают и для чанков в R Markdown. Результаты выполнения чанков отображаются под ними, также, как это сделано в R Studio.

Ну и наконец, вы также получите прекрасную поддержку версионного контроля, доступную в PyCharm и IDEA.

В данный момент R Plugin доступен в IntelliJ IDEA, PyCharm и DataGrip. Установить R Plugin можно в настройках во вкладке Plugins, написав в строке поиска ”R Language”:

Или же просто открыть R скрипт или R Markdown файл в PyCharm. В этом случае IDE предложит установить плагин автоматически.

Наш плагин сейчас находится в стадии активной разработки и нам очень необходима обратная связь и конструктивная критика. Нашли проблему, не хватает функционала? Пожалуйста, сообщите нам об этом.
👍 1
👎
Читать полностью
​​ggweekly - пакет который позволяет вам визуализировать календари в R.

Установка: devtools::install_github("gadenbuie/ggweekly")

Простой пример создания календаря:

library(ggweekly)
ggweek_planner(
start_day = "2019-04-01",
end_day = "2019-06-30",
)

Пример планирования проекта:


project_days
Опубликовал видео запись доклада "Как работать с Facebook Marketing API на языке R" с конференции Analyze Lviv 2019.

В докладе я по шагам описал процесс работы с Facebook Marketing API с помощью пакета rfacebookstat. От авторизации до использования полученных данных.

Тезисы:
- В чём преимущества языка R
- Как начать работу с Facebook Marketing API
- Пакет rfacebookstat и его основные возможности
- Авторизация в Facebook API
- Загрузка основных объектов рекламного кабинета
- Загрузка статистики рекламного аккаунта
- Загрузка данных из Facebook в Google Analytics
- Запись полученных данных в СУБД
- Полезные ссылки

Материалы:
- Презентация
- Видео доклада
Читать полностью
Эдуард Горх, старший продуктовый аналитик Zoon, написал пакет для работы с API AmoCRM.

Реализован весь доступный функционал за исключением пары совсем уж ненужных фичей.

Пакет: https://github.com/grkhr/amocrm
Документация: https://github.com/grkhr/amocrm#docs

Приветствуется помощь в тестировании и распространении, репортить можно в issues на гитхабе, либо в личку автору @grkhr .

Установка:
devtools::installgithub("grkhr/amocrm")_

Пример использования.

library(amocrm)

# авторизационные данные
authlist
Читать полностью
​​Уже в декабре ожидается выход новой книги по R - "R. КНИГА РЕЦЕПТОВ". Оригинальное название:
"R Cookbook".

АННОТАЦИЯ
Выполняйте анализ данных с помощью R быстро и эффективно, используя свыше 275 практических рецептов, представленных в этом расширенном издании. Язык R предоставляет все, что вам нужно для работы со статистикой, но его структуру может быть сложно освоить. Эти ориентированные на задачи рецепты помогут вам сразу же приступить к работе. Решения варьируются от базовых задач до ввода и вывода, общей статистики, графики и линейной регрессии.
Каждый рецепт посвящен определенной задаче и включает в себя обсуждение, которое объясняет решение и дает представление о том, как оно работает. Если вы новичок, эта книга поможет вам сориентироваться. Если вы промежуточный пользователь, она расшевелит вашу память и расширит ваши горизонты. Ваша работа будет сделана быстрее, и вы узнаете больше о R в процессе прочтения.
Читать полностью
​​Небольшой пятничный R мем.
👍 27
👎
Видео запись доклада "Shiny приложения в R".
Спикер: Филипп Управителев
​​Ребята из DataYoga создали библиотеку визуализаций, которая состоит из 47 карточек. Все карточки кликабельны.

Задавайте вопросы к данным и подбирайте визуализации под ваши задачи. Определитесь с типом сравнения данных, изучите плюсы и минусы каждой визуализации и прислушайтесь к тщательно подобранным советам.

Думаю многим будет полезно.
Читать полностью
​​Последние несколько недель при работе с Google BigQuery через пакет bigrquery, при записи данных в новую таблицу вы могли столкнутся с ошибкой:


Error: Invalid JSON payload received. Unknown name "autodetect" at 'job.configuration.load': Proto field is not repeating, cannot start list. [invalid]

Ещё раз обращу ваше внимание, это касается только процесса создания и записи в таблицы которых нет в вашем наборе данных.

Решить эту проблему добавив в функцию bq_table_upload аргумент fields. И в этот аргумент необходимо передать результат выполнения функции as_bq_fields(data_frame), где вместо data\_frame подставьте название дата фрейма данные из которого вы плариуете передать в новую таблицу в Google BigQuery.

Пример.
%
bq_table_upload res, fields = as_bq_fields(data_to_load) )

Более подробное описание решения данной проблемы можно найти на GitHub.

Кстати, раз уж речь зашла о работе с Google BigQuery, то расскажу об ещё одном пакете который упростит вам процесс создания новых таблиц. Дело в том, что Google BigQuery достаточно строго относится к именам полей в создаваемых вами таблицах, допускается использование только латинских букв, цифр и нижнего подчёркивания. А большинство рекламных платформ при работе с API могут возвращать вам названия столбцов с точками, процентами и прочими спец символами.

Для того что бы не заниматься корректировкой имён столбцов можно использовать пакет snakecase, и с его помощью перевести имена столбцов перед отправкой в BigQuery в так называемый змеиный регист:

Пример:

Вот в таком виде я получил имена столбцов при загрузке данных из API Google Ads:

[1] "Day" "Campaign" "Impressions" "Clicks" "Interactions" "Cost" "Conversions"
[8] "ConversionValue" "View-throughconv." "Cross-deviceconv." "SearchImpr.share" "Searchabs.topIS" "ContentImpr.share" "Videoplayedto100%"
[15] "Videoplayedto25%" "Videoplayedto50%" "Videoplayedto75%" "Viewrate"

Как видите тут и проценты, и тире и точки, символы которые не пропустит в имена столбцов Google BigQuery.

Допустим что эти данные мы получили в дата фрейм mydata, тогда для их преоразования в змеиный регистр можно использовать следующий пример:


names(mydata)
👍 5
👎
Читать полностью
​​Друзья, Чёрная пятница наступила и в NeedForData.

Скидка 50% распространяется на все без исключения онлайн-курсы:

- Язык R для интернет-маркетинга
- Power BI для интернет-маркетинга
- Excel для интернет-маркетинга

Предложение действует до 29 ноября 23:59 по Москве. Не упустите шанс!

Подробности акции по ссылке.
Читать полностью
Только вчера заметил, что автор пакета RAdwords внёс ряд довольно значимых:

1. Наконец функция getData() стала векторизированной, теперь вы можете передавать в аргумент clientCustomerId вектор содержащий идентификаторы аккаунтов Google Ads из которых вам надо получить статистику, важно что бы при этом ко всем аккаунтам был доступ у пользователя под которым вы прошли авторизацию.

Пример:

account
👍 8
👎
Читать полностью
Опубликовал новую статью на Хабре. На этот раз рассказал о том как работать с датами в R.

1. Работа с датами в базовом синтаксисе R
1.1. Преобразование текста в дату
1.2. Извлечение компонентов даты в базовом R

2. Работа с датами с помощью пакета lubridate
2.1. Преобразование текста в дату с помощью lubridate
2.2. Извлечение компонентов дат с помощью пакета lubridate
2.3. Арифметические операции с датами

3. Упрощённая работа с периодами, пакет timeperiodsR
3.1. Временные интервалы в timeperiodsR
3.2. Фильтрация вектора дат с помощью timeperiodsR

4. Заключение
Читать полностью
Новая статья Сергея Мастицкого.

Практически любая промышленная система сегодня снабжена совокупностью сенсоров, датчиков и других измерительных устройств, позволяющих вести учет ее состояния (часто в реальном времени). Количество таких измерительных устройств и учитываемых с их помощью показателей может быть очень большим, что требует автоматизации процесса мониторинга и своевременного оповещения о нестандартных ситуациях. Новое сообщение блога "R: Анализ и визуализация данных" посвящено одному из наиболее эффективных методов, предназначенных для обнаружения подобных ситуаций, и о реализации этого метода в пакете BreakoutDetection.
Читать полностью
Отличная новость, Артём Клевцов и Филипп Управителев опубликовали новый пакет uchardet.

Описание:

uchardet предназначен для автоматического определения кодировок. Пакет является обёрткой для C++ либы, разработанной Mozilla.

В качестве ввода может использоваться:
- строковый вектор (загруженный в память)
- строковый вектор с путями к файлам (функция будет пробегать по файлам без полной загнрузки файла в память)
- raw-вектор (загруженный в память)

Оригинальная либа поддерживает множество языков и кодировок. Подробности тут: https://www.freedesktop.org/wiki/Software/uchardet/

Основные юз-кейсы:
- определение кодировки текстовых файлов
- определение кодировка HTML-страниц
- исправление кодировки строковых векторов и последовательности байт

Сам пакет доступен в CRAN: https://cran.r-project.org/package=uchardet
Баги и реквесты можно постить сюда: https://gitlab.com/artemklevtsov/uchardet/issues
Вопросы можно задавать здесь.

Примечания.
1. Не гарантируется работа на Windows x86 (валится ряд тестов).
2. Есть проблемы при определении кодировок японского языка и некоторых других (upstream-баги).


Установка:
repos = "https://cloud.r-project.org/")

Несколько примеров:


# load packages
library(uchardet)

# detect string encoding
ascii [1] "Hello, useR!"
detect_str_enc(ascii)
#> [1] "ASCII"
utf8 [1] "下午好"
detect_str_enc(utf8)
#> [1] "UTF-8"

# detect raw vector encoding
detect_raw_enc(charToRaw(ascii))
#> [1] "ASCII"
detect_raw_enc(charToRaw(utf8))
#> [1] "UTF-8"

# detect file encoding
ascii_file /tmp/RtmpWlvbrE/file4c0437ce292c
#> "ASCII"
utf8_file /tmp/RtmpWlvbrE/file4c0460446f96
#> "UTF-8"
👍 15
👎
Читать полностью
Если вы работаете из R с Google Таблицами, то наиболее вероятно, что используете пакет googlesheets.

Проблема в том, что внутри этот пакет написан на основе Google Sheets API v3, поддержка которой будет прекращена 3 марта 2020 года. О чём я писал вот тут.

Из хороших новостей, есть более свежий пакет googlesheets4, который написан на основе работы с Google Sheets API v4. На данный момент в пакете есть несколько проблем.

1. Пока он умеет только читать доксы, но не умеет ничего в них записывать, и тем более дописывать строки.

2. Имеет проблемы с кодировкой кириллицы.

Т.е. по умолчанию доксы с русским текстом он читает примерно вот так:

A tibble: 3 x 2
col_1 col_2

1 Раз Алексей
2 Два Олег
3 Три Пётр

Но эта проблема решаема, для чего достаточно просто установить дев версию пакета gargle.

devtools::install_github("r-lib/gargle")

Более подробно об этой проблеме написано тут.

Поэтому очень рекомендую для чтения Google таблиц переходить именно на googlesheets4. К тому же разработчики обещают значительно расширить функционал пакета к моменту прекращения поддержки Google Sheets API v3.
👍 12
👎 1
Читать полностью
​​Хедли Викхем - Автор наиболее популярных пакетов на R, составляющих ядро библитеки tidyverse, а так же автор множества книг о языке R. В этом году он получил нобелевскую премию в области статистики.

В статье с поздравлениями говорится, что в прошлые годы эту премию по большей части получали теоретики, а Хедли первый практик который был её удостоен.

Поздравляем Хедли!
👍 50
👎 1
Читать полностью
Python и R — наиболее популярные и удобные языки программирования в области анализа данных. В этой статье рассмотрим различия между R и Python и расскажем, какое они занимают место в анализе данных и статистике.

https://tproger.ru/sponsored/python-vs-r-data-science/amp/