Введение
Мета-теги располагаются в заголовке HTML-документа, между тегами <HEAD> и </HEAD>, а потому они остаются невидимы для читателя страницы. Предназначены они для включения информации о документе, которая используется разными агентами (сервером, броузерами, поисковыми роботами) в различных целях. Элементы META предоставляют дополнительные сведения о способе обработки документа броузером, позволяют поисковым роботам обрабатывать документ без его загрузки. В документе может находиться любое количество мета тегов, но многие из них не несут никакой полезной информации с точки зрения агентов и игнорируются ими. Необходимыми, на мой взгляд, тегами являются только Keywords и Description. Однако, следует приглядеться и к остальным представителям семейства META.
Синтаксис
В meta-тегах используются два атрибута — NAME и HTTP-EQUIV. Это разделение связано с синтаксисом <META NAME=»имя» CONTENT=»значение«> и, соответственно, <META HTTP-EQUIV=»имя» CONTENT=»значение«> (названия тегов, имена и значения атрибутов нечувствительны к регистру). В обоих случаях необходим также атрибут CONTENT, задающий значение именованного свойства. Закрывающий тег для meta не используется. Теперь подробнее.
Каждый МЕТА тег определяет пару свойство/величина. Атрибуы NAME и HTTP-EQUIV идентифицируют свойство, а атрибут CONTENT определяет значение этого свойства.
Атрибут NAME — это информационно-управляющая часть, используется приложением-клиентом, т.е. броузером или поисковым роботом. Данный атрибут содержит скрытую информацию, не входящую в заголовок HTTP, и идентифицирует имя свойства. Значение данного атрибута может быть практически любым, однако существует несколько стандартных общепризнанных значений, которые будут рассмотрены ниже.
Атрибут HTTP-EQUIV — это эквивалент заголовка HTTP-сервера (однако, имеющий более низкий приоритет перед заголовком, генерируемым самим сервером). Информация, содержащаяся в нём, добавляется в заголовок отклика HTTP и отсылается клиенту перед самой передачей HTML-документа. Полученная информация используется клиентским приложением для работы с документом (например, указывает броузеру, в какой кодировке нужно отобразить документ). Данный атрибут может использоваться на месте атрибута NAME.
Примеры
Далее следует описание наиболее часто встречающихся мета тегов. Их синтаксис будет понятен из приведённых примеров.
Итак, сначала HTTP-EQUIV:
- Refresh (перезагрузка документа):
<META HTTP-EQUIV=»Refresh» CONTENT=»N;URL=https://statievsky.ru/«>,
где N — время в секундах (целое число), URL — адрес документа (можно не указывать). Используется для автоматической перезагрузки указанной страницы через заданное время. Если URL не указан, броузер перезагрузет текущий документ [как если бы пользователь нажал кнопку «Reload» («Перезагрузка») на панели броузера]. Это свойство полезно, например, если информация на странице часто меняется, как на лентах новостей. Так же этот тег может использоваться для автоматической переадресации посетителя с одной страницы на другую (указывается нужный URL).
Небольшой фокус: можно создать эффект анимации (или показа слайдов), если создать несколько страниц (1,2,3,4,5), каждая из которых перадресует посетителя на следующую в списке (например, 1 показвает своё содержимое и через какое-то время отсылает посетителя на страницу 2, аналогично 2 — на 3, а в конце: 5 — на 1, создавая замкнутый цикл). - Expires (дата устаревания документа):
<META HTTP-EQUIV=»Expires» CONTENT=»Wed, 10 Jul 2002 00:20:00 GMT«>
Дата, обозначающая «срок годности» документа. Этот тег управляет кэшированием в HTTP/1.0. При истечении «срока годности» документ будет считаться «просроченным» и броузер будет заново обращаться к источнику, чтобы обновить документ. Если дата годности запрашиваемого документа истекла, он не будет кэшироваться броузером. При значении «0» атрибута CONTENT, броузер каждый раз при запросе будет проверять — изменялся ли документ (брать его с сервера, а не из кэша). Поисковые роботы могут либо совсем не индексировать такой документ («думая», что устаревший документ не заслуживает внимания), либо постоянно проверять его. Поэтому при использовании этого тега надо проявить осторожность. - Content-Type (тип и характеристики документа):
<META HTTP-EQUIV=»Content-Type» CONTENT=»text/html; charset=windows-1251«>
Основное назначение — сообщение броузеру об используемой кодировке. Однако, если Ваш сервер поддерживает автоматическую перекодировку (например, Russian Apache), это тег может привести к путанице. При использовании данного тега необходима осторожность. - Content-language (язык документа):
<META HTTP-EQUIV=»Content-language» CONTENT=»ru«>
Указание для поисковых роботов о языке документа (для категоризации по языку). Формат записи: язык-диалект, например: EN-GB (English — Great Britain). Диалект можно и не указывать (см. пример). - Cache-Control (контроль кэширования документа):
<META HTTP-EQUIV=»Cache-Control» CONTENT=»no-cache«>
Возможные значения: no-store (кэшируется, но не архивируется), no-cache (не кэшируется вообще), Public (кэшируется в общедоступных кэшах), Private (кэшируется только в частных кэшах). - Window-target (способ открытия новых окон броузера):
<META HTTP-EQUIV=»Window-target» CONTENT=»_top«>
Определяет окно текущей страницы. Действует не во всех броузерах. - Pragma (управление кэшированием документа для протокола HTTP/1.0):
<META HTTP-EQUIV=»Pragma» CONTENT=»no-cache«>
Возможно только одно значение: no-cache, т.е. кэширование запрещено. - Set-Cookie (установка cookie для броузера):
<META HTTP-EQUIV=»Set-Cookie» CONTENT=»name=имя;expires=дата; domain=имя домена;path=путь;secure«>, где:- имя — любая строка данных без знаков препинания, пробелов и переходов на следующую строку. Это обязательный параметр;
- дата — дата истечения срока хранения файла cookie в формате: Sun, 14-Jul-02 3:00:00 GMT , если дата не задана, то cookie не сохраняется (необязательный параметр);
- имя домена — домен для которого действительно значения cookie, если не указан, то считается, что это тот сервер, где лежит сайт (необязательный параметр);
- путь — путь к документам домена, для которого действительно значения cookie, если не задан, тогда тот каталог, где лежит сайт (необязательный параметр);
- secure — указывается только если применяется защищенный режим SSL, если нет, то информация передается в обычном режиме (необязательный параметр).
Установка Cookie для броузера в том случае, когда надо сохранить информацию в компьютере посетителя и при необходимости к ней обратиться (чаще всего используется онлайновыми магазинами). Работает так:
Броузер, встретив такую строку, записывает данные в текстовый файл (вида: имя/значение) и хранит в кэше, в следующий раз он сверяет все свои cookie на предмет полного совпадения, и если находит, то отсылает серверу как HTTP заголовок.
В настройках броузера cookie должны быть разрешены, каждый файл не может превышать 4 kB (иначе начальные записи удаляются, освобождая место новым) всего их может храниться до 300, и причем, не больше 20 с одного сервера (иначе более старые файлы удаляются). - Ext-cache (альтернативный кэш):
<META HTTP-EQUIV=»Ext-cache» CONTENT=»NAME=/some/path/index.db; istructions=User Instructions«>
Определяет имя и адрес альтернативного кэша (только для Netscape Navigator). - Location (локация):
<META HTTP-EQUIV=»Location» CONTENT=»https://statievsky.ru/kak-zarabotat-v-internete/«>
Указывает местоположение документа в Интернете (полный адрес).
Теперь NAME:
- Author (имя автора документа):
<META NAME=»Author» CONTENT=»Василий Пупкин«>
Сообщает всем, «чьих кистей» данный документ. Некоторые поисковые системы позволяют искать документы по имени автора. - Keywords (ключевые слова, разделённые запятыми, до 800 символов):
<META NAME=»Keywords» CONTENT=»слово1 слово2 слово3 …«>
Слова и выражения, характеризующие документ. На сегодняшний день большинство поисковых роботов не учитывают этот тег. Однако отказываться от этого тега пока рано. Совет: пишите в него только те слова, которые действительно относятся к тексту документа (и присутствуют в нём, повторяясь несколько раз!). Нельзя повторять слова в теге более 2-3 раз — робот это расценит как накрутку и может вообще исключить сайт из своей базы данных (а значит, лишить его посетителей). - Rating (возрастной рейтинг):
<META NAME=»Rating» CONTENT=»General«>
Сообщает, для какой возрастной категории предназначен данный документ. Возможные варианты: General (общая категория), Restricted (ограниченная), Mature (для взрослых), 14 years (14 летняя аудитория). - Robots (управление роботами):
<META NAME=»Robots» CONTENT=»index, nofollow«>
Управление поведением поисковых роботов на странице (альтернатива созданию файла robots.txt). Возможные варианты: INDEX (документ разрешено индексировать) или NOINDEX (индексирование документа запрещено); FOLLOW (разрешено индексировать все ссылки в данном документе) или NOFOLLOW (запрещена индексация ссылок в данном документе). ALL — одновременное выполнение условий INDEX и FOLLOW (полная свобода действия для робота). NONE — одновременное выполнение условий NOINDEX и NOFOLLOW (любая деятельность поисковиков запрещена). Обритите внимание на форму записи данного тега: чере запятую пишется два атрибута. Первый — index или noindex. Второй — follow или nofollow. Либо вместо них один атрибут: all или none. Нельзя дублировать значения, либо писать противоречивые инструкции (т.е. значение CONTENT не может, например, иметь вид: «none, nofollow»). Значение тега Robots по умолчанию (пусто): ALL. Если возможно, рекомендуется вместо этого тега использовать файл robots.txt. - Description (краткая аннотация содержимого страницы, до 150 символов):
<META NAME=»Description» CONTENT=»Фотки Васи Пупкина на даче, в Интернет-кафе и на хоккейной коробке. Школьные сочинения Васи. Общение в чате с самим Васей.«>
Является важнейшим тегом. В нём кратко описывается содержание страницы и содержимое этого тега выводится в результатах поиска, выдаваемых поисковыми сервисами на запрос пользователя. Поэтому старайтесь сделать это описание интригующим, зазывающим. Старайтесь использовать больше ключевых слов, реально присутствующих в документе. Если этот тег отсутствует, то посетителю поисковика показывается кусок текста страницы. Некоторые поисковые машины не учитываеют данный тег. - Document-state (статус документа):
<META NAME=»Document-state» CONTENT=»Dynamic«>Определяет частоту индексации документа и может принимать значения: Static (статический, т.е. не меняющийся документ, следовательно, индексироваться будет только один раз) и Dynamic (для изменяющихся документов, которые нуждаются в переиндексации). - Revisit-after или Revisit (повторное посещение):
<META NAME=»revisit-after» CONTENT=»4 days«> или:
<META NAME=»revisit» CONTENT=»4 days«>
Идентичные теги. Имеют смысл только тогда, когда значение тега Document-state=»Dynamic«. Указывают через какой промежуток времени поисковому роботу производить переиндексирование документа. Не все поисковики следуют указаниям этих тегов (как, например, Яндекс). Некоторые роботы сами расчитывают частоту переиндексации документа. - Distribution (читательская аудитория документа):
<META NAME=»Distribution» CONTENT=»Global«>
Возможные варианты: global (публичный документ); local (страница не предназначается для широкой аудитории). - URL (расположение основного сайта):
<META NAME=»URL» CONTENT=»https://statievsky.ru/«>
Базовый URL (не путать с BASE!) определяет какой документ надо индексировать, чтобы не обрабатывать «зеркала». - Copyright (авторские права и условия использования материалов):
<META NAME=»Copyright» CONTENT=»(c) Statievsky Danila, никакая часть данного документа не может быть воспроизведена в какой-то бы ни было форме без разрешения владельца авторских прав.«>
Некоторые поисковые машины учитывают и эту информацию (полезно бывает указать название фирмы и имя автора). - Resource-type (тип ресурса):
<META NAME=»RESOURCE-TYPE» CONTENT=»DOCUMENT«>
Обычно значение этого мета тэга устанавливается равным «DOCUMENT». Используется поисковыми роботами (если определён Document, то робот начинает индексирование). - Generator (название приложения, в котором создавался документ):
<META NAME=»Generator» CONTENT=»Блокнот«>
Вставляется в документ приложением, в котором был создан (например, Microsoft Word 9). Бесполезный тег, используемый лишь производителями программного обеспечения для оценки доли занимаемого рынка. - Progld (идентификатор программы):
<META NAME=»ProgId» CONTENT=»FrontPage.Editor.Document«>
Указывает тип и структуру документа, относительно создавшей его программы. Вставляется программами MS Word, MS FronPage и т.д. Беполезный тег.
Допустимо добавлять в мета тэги атрибут LANG, указывающий язык данных в атрибуте CONTENT (например, <META NAME=»Keywords» LANG=»RU» CONTENT=»теги мета мета-теги описание название»>), но это не обязательно.
Как уже говорилось выше, все мета теги должны помещаться в заголовок документа между тегами <HEAD> и </HEAD>, рекомендуется после <TITLE> и </TITLE>.
Заключение
Кроме перечисленных тегов существует еще множество других. Вообще, в атрибут NAME мета тегов можно включать все что угодно (например, NAME=»Sponsored by» CONTENT=»Мама Васи Пупкина»), но пользы от этого не будет. Используя мета тэги, нужно прежде всего учитывать целесообразность их применения. Совет: используйте для каждой страницы сайта свои мета-теги, составленные именно с учётом содержимого данной конкретной страницы. Это позволит повысить её рейтинг в поисковых системах.
Итак, присутствие мета тегов способствует повышению рейтинга сайта в поисковых системах, позволяет управлять кэшированием в броузере и поведением поисковых роботов на странице. Однако, только Вам решать какие из них нужно использовать в том или ином случае, чтобы добиться максимальной полезности их применения и излишне не увеличивать размер документа.