Публикация #143 — SEOporn (@seoporn)

TGStat

Введите текст для поиска

Расширенный поиск каналов

Russian

Язык сайта

Russian English Uzbek
Вход на сайт

Каталог

Каталог каналов и чатов Поиск каналов
Добавить канал/чат
Рейтинги

Рейтинг каналов Рейтинг чатов Рейтинг публикаций
Рейтинги брендов и персон
Аналитика
Поиск по публикациям
Мониторинг Telegram

SEOporn

21 Nov 2024, 13:07

Открыть в Telegram Поделиться Пожаловаться

Є ще один варіант повної заборони, який я не вважаю сильно раціональним у даному випадку.
Це блокування для робота в файлі robots.txt записом:

User-Agent: bingbot
Disallow: /

Ця директива, на відміну від серверного блокування роботу, повністю залежить від налаштувань, власне, самого робота та його алгоритмів.
Тому блокування роботів з чітко визначеним юзерагентом на рівні серверу - залізобетонний варіант.
Цим способом можна закривати й інші надокучливі боти, наприклад:

# Фейсбук бот (предпоказ посилань в ФБ, Інста). Скаженіє дуже часто на досить великих сайтах. Використовувати за необхідністю.
# Справка ФБ про їхні краулери:
#https://developers.facebook.com/docs/sharing/webmasters/web-crawlers
RewriteCond %{HTTP_USER_AGENT} ^.*facebookexternalhit.* [NC]
RewriteRule .* - [F,L]

# Turnitin (Онлайн-сервіс - чекер плагіату)
RewriteCond %{HTTP_USER_AGENT} ^.*turnitin.* [NC]
RewriteRule .* - [F,L]

# Timpi (Якась чергова нова пошукова система, якою не можна маніпулювати. Серйозно. У них так написано. Я посміявся)
RewriteCond %{HTTP_USER_AGENT} ^.*timpibot.* [NC]
RewriteRule .* - [F,L]

Періодично моніторте логи доступу сайту, навантаження і т.д. Ловіть небажані краулери.

196 0 0 3

Каталог

Каталог каналов и чатов Подборки каналов Поиск каналов Добавить канал/чат

Рейтинги

Рейтинг каналов Telegram Рейтинг чатов Telegram Рейтинг публикаций Рейтинги брендов и персон

API

API статистики API поиска публикаций API Callback

Наши каналы

@TGStat @TGStat_Chat @telepulse @TGStatAPI

Почитать

Наш блог Исследование Telegram 2019 Исследование Telegram 2021 Исследование Telegram 2023

Контакты

Поддержка Почта Вакансии

Всякая всячина

Пользовательское соглашение Политика конфиденциальности Публичная оферта

Наши боты

@TGStat_Bot @SearcheeBot @TGAlertsBot @tg_analytics_bot @TGStatChatBot

Язык сайта