2017 © Pedro Peláez
 

library robotstxt

Parse robots.txt

image

andronof/robotstxt

Parse robots.txt

  • Wednesday, January 31, 2018
  • by andronof
  • Repository
  • 1 Watchers
  • 1 Stars
  • 29 Installations
  • PHP
  • 0 Dependents
  • 0 Suggesters
  • 0 Forks
  • 0 Open issues
  • 6 Versions
  • 0 % Grown

The README.md

Parse (разбор) robots.txt

Библиотека для разбора файла robots.txt. Написаная на языке php. Основная задча библиотеки проверить любую ссылку, закрыта она от индексации или нет. Правила разбора используются из описания в справочнике Яндекс., (*1)

Правила разбора

  1. Разбирается все данные по ботам.
  2. Для каждого бота сортируются по длине ссылки. Если у нескольких правил длина одинаковая то предпочтение отдается разрешающему(allow) правилу.
  3. Правила содержащие пустые значения изменяются на противоположные.

Установка

Через composer:, (*2)

{
    "require": {
        "andronof/robotstxt": "dev-master"
    }
}

и запустить команду, (*3)

composer update

установится последний версия, но не обязательно стабильная или, (*4)

composer require andronof/robotstxt

установится последняя стабильная версия, (*5)

Использование

$robotstxt = new \Robotstxt(file_get_contents('http://yandex.ru/robots.txt'));

или, (*6)

$robotstxt = new \Robotstxt();
$robotstxt->init(file_get_contents('http://yandex.ru/robots.txt'));

Проверка запрещена ли ссылка в robots.txt, (*7)

if ($robotstxt->isAllowed('/msearch') ) {
    echo('Доступ разрешен');
} else {
    echo('Доступ запрещен');
}

Данная функция может принимать вторым параметром имя бота. Если не указан, то берутся правила для всех (*). Ссылку для проверки указывайте с начинающегося слеша (/)., (*8)

Остальные функции

  • isUserAgent($user_agent) — Проверяет есть ли правила для конкретного бота
  • setUserAgent($user_agent = null) — Устанавливает правила какого бота использовать. Имеет больший приоритет чем если указывать бота в функции isAllowed. Если необходимо сбросить глобального бота передайте в эту функцию null.

Используется в проектах

The Versions

31/01 2018

dev-master

9999999-dev

Parse robots.txt

  Sources   Download

MIT

The Requires

  • php >=5.4.0

 

by Andronov Konstantin

31/01 2018

1.1.3

1.1.3.0

Parse robots.txt

  Sources   Download

MIT

The Requires

  • php >=5.4.0

 

by Andronov Konstantin

27/07 2017

1.1.2

1.1.2.0

Parse robots.txt

  Sources   Download

MIT

The Requires

  • php >=5.4.0

 

by Andronov Konstantin

27/06 2017

1.1.1

1.1.1.0

Parse robots.txt

  Sources   Download

MIT

The Requires

  • php >=5.4.0

 

by Andronov Konstantin

14/05 2016

1.1.0

1.1.0.0

Parse robots.txt

  Sources   Download

MIT

The Requires

  • php >=5.4.0

 

by Andronov Konstantin

02/05 2016

1.0.0

1.0.0.0

Parse robots.txt

  Sources   Download

MIT

The Requires

  • php >=5.4.0

 

by Andronov Konstantin