part341

Пред.Страница След.Страница Раздел Содержание

3.5. Функции ПЕРВ, СЛЕД и ВЫБОР.

Множество ВЫБОР строится для каждого правила и включает те терминальные символы, при появлении которых под читающей головкой распознаватель должен применять это правило.

Для определения множества ВЫБОР используются функции ПЕРВ и СЛЕД . Аргументом функции ПЕРВ может быть любая цепочка полного словаря µ, а значением функции ПЕРВ(µ) является множество терминальных символов, которые могут стоять на
первом месте в цепочках, выводимых из цепочки µ.

Построение функции ПЕРВ(µ)

Значение функции ПЕРВ(m) можно определить пользуясь следующими правилами:
1) Если цепочка µ начинается терминальным символом и имеет вид bµ', то функция

ПЕРВ(µ) = {b},

2) Если цепочка µ является пустой цепочкой, µ = $, то функция

ПЕРВ(µ) = $,

3) Если цепочка µ начинается нетерминальным символом  и имеет вид µ', а в схеме грамматики имеется n правил, в любой части которых находится символ :

 ® a₁ | a₂ | ... | a_n ,

и, если не существует вывода  ==>* $, то функция ПЕРВ(µ') представляет собой объединение множеств:

ПЕРВ(µ') = ПЕРВ(a₁) È ПЕРВ (a₂) È...ÈПЕРВ(a_n),

4) Если цепочка µ начинается нетерминальным символом и имеет вид µ', в схему грамматики входят n правил вида

 ® a₁ | a₂ | ... | a_n,

и  является аннулирующим нетерминалом, т.е. существует  ==> *$, то функция

ПЕРВ(µ')=ПЕРВ(µ') È ПЕРВ(a ₁)È ПЕРВ(a ₂) È...È ПЕРВ(a _n).

В качестве примера выполним вычисление функции ПЕРВ для правил следующей грамматики:

Г_3.6 : R = { (1) <A> ® <C>c,

(2) <A> ® g<D>,
(3) ® $,
(4) ® b<C><D><E>,
(5) <C> ® <D>a,
(6) <C> ® ca,
(7) <D> ® $,
(8) <D> ® d<D>,
(9) <E> ® g<A>f,
(10) <E> ® c }.

Вначале найдем значения функции для правых частей правил (2), (4), (6), (8), (9) , (10) , начинающихся терминальными символами:

ПЕРВ(g,<D>,) = {g}
ПЕРВ(b<C><D><E>) = {b}
ПЕРВ(ca) = {c}
ПЕРВ(d<D>) = {d}
ПЕРВ(g<A>f) {g}
ПЕРВ(c) = {c}

Затем вычислим функцию для правил (5) и (6) :

ПЕРВ (<C>) = ПЕРВ (<D>a) È ПЕРВ (ca).

Учитывая, что <D> является аннулирующим нетерминалом, получаем:

ПЕРВ(<C>) = ПЕРВ(a) ÈПЕРВ(<D>) È{c} = {a}È{d}È{c}={a,d,c}.

При вычислении функции для правил (1) и (2) также необходимо иметь в виду то, что является аннулирующим терминалом, поэтому имеем:

ПЕРВ(<A>) = ПЕРВ(<C>c) È ПЕРВ(g<D>) =
ПЕРВ(<C>c) È ПЕРВ() È ПЕРВ(g<D>) =

{a,d,c} È {b} È{g} = {a,b,c,d,g}.

Построение функции СЛЕД()

Аргументом функции СЛЕД является нетерминальный символ, например , а значение функции СЛЕД() представляет собой множество терминалов, которые могут следовать непосредственно за нетерминалом в цепочках, выводимых из начального символа грамматики.
Вычисление значения функции СЛЕД() должно выполняться по следующим правилам:
1) Если в схеме грамматики имеются правила вида

<X₁> ® µ₁a₁, <X₂> ® µ₂a₂, ... , <X_n> ® µ_na_n,

и все цепочки a _i =/= $ , то

СЛЕД() = ПЕРВ(a ₁) È ПЕРВ(a ₂) È ... È ПЕРВ(a _n).

2) Если же среди приведенных выше правил имеется хотя бы одна цепочка a_i = $, например пусть a₁ = $, то функция вычисляется так:

СЛЕД() = СЛЕД(<X₁>) È ПЕРВ(a ₂) È ... È ПЕРВ(a _n).

Выполним вычисление функции СЛЕД для нетерминалов грамматики Г_3.6 . Вначале определим функцию для нетерминала <A>, который встречается в правой части правила (9).
СЛЕД(<A>) = ПЕРВ(f) = {f}.
Нетерминал <C> входит в правые части правил (1) и (4), учитывая также, что нетерминал <D> являетя анулирующим, получаем:

СЛЕД(<C>) = ПЕРВ(<D>) È ПЕРВ(<E>) ÈПЕРВ(c) = {c,d,g}.

Нетерминал входит в правые части правил (1), (2), (5), поэтому имеем:

СЛЕД() =ПЕРВ(<C>c) È СЛЕД(<A>) È СЛЕД(<C>),

подставляя в полученное выражение значения функций, входящих в правую часть, получаем:

СЛЕД() = { a, c, d, }È { f } È U { c, d, g, } = { a, c, d, g, f }.

Для нетерминала <D> , который входит в правила (2), (4) , (5) и (8), с учетом того, что нетерминал является аннулирующим, получаем:

СЛЕД(<D>) =ПЕРВ() È СЛЕД(<A>) È ПЕРВ(<E>) È ПЕРВ(a),

учитывая, что , для нетерминала <E>, входящего в правило (4)
СЛЕД(<E>) = СЛЕД() = {a,d,c,g,f},
окончательно имеем:
СЛЕД(<D>) = ПЕРВ()È СЛЕД(<A>) ÈПЕРВ(<E>) È {a} =

= {b}È {f} È {c,g} È {a} = {a,b,c,g,f}.

Построение функции ВЫБОР.

Функция ВЫБОР, которая потребуется нам для построения переходов магазинных автоматов,можно определить с помощью функций ПЕРВ и СЛЕД следующим образом:

1) Если правило грамматики имеет вид  - > a и a не является аннулирующей цепочкой, другими словами не существует вывод a ==>*$, то

ВЫБОР( ® a ) = ПЕРВ( a ).

2) Для аннулирующих правил грамматики вида  ®$, мно-
жество выбора определяется так

ВЫБОР( ® $) = СЛЕД().

3) Если правило грамматики имеет вид  ® µ и µ яв-
ляется аннулирующей цепочкой, то

ВЫБОР( ® µ) = ПЕРВ(µ) È СЛЕД().

Для рассматриваемой грамматики Г_3.6 множества ВЫБОР для каждого из правил, построенные описанным выше способом, имеют вид:

ВЫБОР(<A> ® <C>c) = ПЕРВ(<C>c) = {a,b,c,d},
ВЫБОР(<A> ® g<D>) = ПЕРВ(g<D>) = {g},
ВЫБОР( ® $) = ПЕРВ($) È СЛЕД() = {a,c,d,g,f},
ВЫБОР( ® b<C><D><E>) = ПЕРВ(b<C><D><E>) = {b},
ВЫБОР(<C> ® <D>a) = ПЕРВ(<D>a) = {a,d},
ВЫБОР(<C> ® ca) = ПЕРВ(ca) = {a},
ВЫБОР(<D> ® $) = ПЕРВ($) È СЛЕД(<D>) = {a,b,c,g,f},
ВЫБОР(<D> ® d<D>) = ПЕРВ(d<D>) = {d},
ВЫБОР(<E> ® g<A>f) = ПЕРВ(g<A>f) = {g},
ВЫБОР(<E> ® c) = ПЕРВ(c) = {c}.