======Заметка simple test lexer======
Просто привожу быстрый пример, пока экспериментирую с Simple Tests Lexer. Если вам нужен инструмент для разбора какого-нибудь мини-языка в PHP , это хорошее место для поиска.
Одним из побочных продуктов [[wiki:devel:parser:test:simple_test|Simple Test]] является лексер на основе регулярных выражений, который можно найти в CVS [[http://web.archive.org/web/20070814083008/http://cvs.sourceforge.net/viewcvs.py/simpletest/simpletest/parser.php?rev=1.58&view=auto|здесь]]. Маркус использует его для построения HTML- парсера для Simple Test, но его можно применять практически к чему угодно. Обратите внимание, что есть отдельная версия лексера, доступная на Marcus SourceForge «code dump» - http://sf.net/projects/lamplib .
Сейчас я вынужден исследовать его из-за необходимости. [[http://web.archive.org/web/20070814083008/http://wact.sourceforge.net/|WACT]] разрабатывает шаблонное выражение/язык привязки данных, использование которого описано в [[http://web.archive.org/web/20070814083008/http://wact.sourceforge.net/index.php/TemplateAuthorsGuide|Руководстве для авторов шаблонов]]. К сожалению, есть ошибка (эффекты [[http://web.archive.org/web/20070814083008/http://sourceforge.net/tracker/index.php?func=detail&aid=983454&group_id=85372&atid=575984|описаны здесь]]), которая, похоже, предполагает, что синтаксис PCRE в PHP изменился где-то между PHP 4.1.2 и 4.3.2.
Рассматриваемое регулярное выражение:
$regex = '/^((?Us).*)'. preg_quote('{$', '/') .
'(([^"\'}]+|(\'|")(?U).*\4)+)' .
preg_quote('}', '/') . '((?s).*)$/';
Я не нашел никаких очевидных указаний на изменения в синтаксисе в руководстве PHP / CVS (любой вклад будет очень признателен). Это регулярное выражение также заставляет меня ломать голову (Джефф тоже ломает голову над этим), поэтому изучаю возможности более управляемого подхода к разбору языка выражений шаблонов.
В любом случае, если говорить коротко, вот очень простой пример использования Simple Tests lexer в качестве шаблонизатора, который может помочь кому-то начать. Дополнительные примеры лучше всего искать, изучая [[http://web.archive.org/web/20070814083008/http://cvs.sourceforge.net/viewcvs.py/simpletest/simpletest/test/parser_test.php?rev=1.46&view=auto|тестовые случаи парсера]].
Если у меня есть такой шаблон;
Начальное сообщение — {$Greeting}
Последнее слово по теме — {$Closing}
где ''{$Greeting}'' и ''{$Closing}'' — ссылки на переменные шаблона, которые я хочу заменить некоторыми значениями, назначенными мной шаблонизатору, синтаксический анализатор, использующий лексический анализатор Simple Tests, может выглядеть так:
phpVars [ $name ] = $value ;
}
// Отображение страницы
function display ( ) {
echo $this -> output ;
}
/**
* Функция обратного вызова (или режим/состояние), вызываемая Lexer. Эта
* имеет дело с текстом за пределами ссылки на переменную.
* @param string совпадающий текст
* @param int состояние лексера (здесь игнорируется)
*/
function writePlainText ( $match , $state ) {
$this -> output .= $match ;
return TRUE ;
}
/**
* Обратный вызов для ссылок на переменные шаблона.
* @param string совпадающий текст
* @param int состояние лексера
*/
function writeVariable ( $match , $state ) {
switch ( $state ) {
// Ввод ссылки на переменную
case LEXER_ENTER:
// Начало ссылки на переменную — пока ничего не нужно делать
break ;
// Содержимое переменной reference
case LEXER_UNMATCHED:
if ( isset ( $this -> phpVars [ $match ] ) ) {
$this -> output .= $this -> phpVars [ $match ] ;
}
break ;
// Выход из ссылки на переменную
case LEXER_EXIT:
// Конец ссылки на переменную - ничего не нужно делать - завершено
break ;
}
return TRUE ;
}
}
// Создаем парсер шаблона
$Parser = & new YetAnotherTemplateParser ( ) ;
// Регистрируем некоторые переменные шаблона для замены
$Parser -> registerVariable ( 'Greeting' , 'Hello World!' ) ;
$Parser -> registerVariable ( 'Closing' , 'Goodbye World!' ) ;
//Создаем лексический анализатор
// Второй аргумент: начальное "состояние" или функция обратного вызова
// Третий аргумент: чувствительность к регистру ВКЛ - не имеет значения для этого примера,
// так как шаблоны регулярных выражений не являются буквами, но, чтобы вы знали,
$Lexer = &new SimpleLexer ( $Parser , 'writePlainText' , TRUE ) ;
// Добавить ссылку на переменную, начинающую шаблон регулярного выражения
// Второй аргумент: текущее состояние, к которому применяется этот шаблон - предотвращает
// синтаксис шаблона, подобный {$my{$var, вызывающий два
// перехода
// Третий аргумент: состояние (функция обратного вызова) для отправки дальнейших вызовов
// после того, как шаблон будет найден
$Lexer -> addEntryPattern ( ' \{ \$ ' , 'writePlainText' , 'writeVariable' ) ;
// Добавляем шаблон выхода для ссылок на переменные, возвращая лексер в
// его предыдущее состояние (использует стек состояний)
// Второй аргумент: состояние, в котором применяется этот шаблон
$Lexer -> addExitPattern ( ' \} ' , 'writeVariable' ) ;
$template = 'Вступительное сообщение — {$Greeting}
Последнее слово по теме — {$Closing}' ;
$Lexer -> разбор ( $template ) ;
$Parser -> дисплей ( ) ;
?>
Надеюсь, комментарии объяснят, что происходит.
Конечно, это очень нетребовательный язык, но, судя по опыту, Simple Tests Lexer может прекрасно масштабироваться до довольно сложного языка ( HTML, для которого Маркус его использует, не так уж и прост в анализе).
Примечание: это не для того, чтобы побудить вас писать еще больше шаблонизаторов! [[http://web.archive.org/web/20070814083008/http://www.sitepoint.com/forums/showthread.php?threadid=123769|Их более чем достаточно]]. Например, разбор CSS , Javascript, VBScript (подталкивание подталкивание) или SQL может быть стоящей миссией или для мини-языков, таких как язык выражений шаблонов WACT.
=====Дополнения и Файлы=====
[[http://web.archive.org/web/20070814083008/http://www.phppatterns.com/docs/develop/simple_test_lexer_notes|Ссылка на оригинальную статью]]