Конструирование Компиляторов, Определения

Материал из eSyr's wiki.

(Различия между версиями)

Перейти к: навигация, поиск

Версия 19:25, 4 сентября 2008

Авторы рукописной версии: Синдеев Михаил (оригинал), Комаров Сергей (обработка)
Обработанная рукописная версия: http://www.komserg.ru/botva/konstr.rar

Содержание

1 Язык
2 Грамматика
3 Сентенциальная форма
4 Язык, порождённый грамматикой
5 Иерархия по Хомскому
6 Машина Тьюринга
7 Универсальная машина Тьюринга
8 Рекурсивно-перечислимый язык
9 Линейно-ограниченный автомат
10 Лемма о разрастании
11 Неоднозначная грамматика
12 Левосторонний вывод
13 Магазинный автомат
14 Расширенный магазинный автомат
15 Грамматика в нормальной форме Хомского
16 Лемма о разрастании (для контекстно-свободного языка)
17 Недостижимый символ
18 Непорождающий символ
19 Бесполезный символ
20 Приведённая грамматика
21 Регулярное множество
22 Регулярное выражение
23 Длина пути от листа к корню
24 Высота дерева
25 Множество FIRST(u)
26 Множество FOLLOW(A)
27 Множество FIRST₁
28 Основа сентенциальной формы
29 Множество FIRST(A)
30 Множество FOLLOW(A)
31 Леворекурсивная грамматика
32 LL(1) грамматика
33 LR грамматика
34 Конфигурация LR анализатора
35 Атрибутная грамматика
36 Основа сентенциальной формы
37 Пролог подпрограммы
38 Дисплей
39 Статическая цепочка
40 Динамическая цепочка

Язык

Язык — множество цепочек.

Грамматика

Грамматика — G = (N, T, P, S)

N — множество нетерминальных символов (напр. A, B, C...)
T (иногда E) — алфавит терминальных символов (N ∪ T = ∅)
P — конечное множество правил вывода
- P = {α → β | α ∈ (N ∪ T)⁺; β ∈ (N ∪ T)*}
S ∈ N — аксиома (или начальный символ) грамматики

Сентенциальная форма

Сентенциальная форма — последовательность символов (терминалов и нетерминалов), выводимых из аксиомы

Язык, порождённый грамматикой

Язык, порождённый грамматикой — L(G) = {W | W ∈ T*, S ⇒⁺ W}

Язык, порождённый грамматикой — множество всех терминальных цепочек, выводимых из аксиомы грамматики

Иерархия по Хомскому

0: произвольные грамматики
1: неукорачивающие (контекстно-зависимые) грамматики
- α → β, |α| ≤ |β|
- допускается S → ε, если S не входит ни в какую правую часть
2: контекстно-свободные
- A → α, α ∈ (N ∪ T)*
3: праволинейные (A → w, A → wB, w ∈ T*), леволинейные (A → w, A → Bw, w ∈ T*),

Из определения следует, что Z₀ ⊇ Z₁ ⊇ Z₂ ⊇ Z₃.

Существует теорема, которая доказывает, что Z₀ ⊃ Z₁ ⊃ Z₂ ⊃ Z₃.

Машина Тьюринга

Машина Тьюринга — T_m = (Q, Г, Σ, D, q₀, F)

Q — конечное множество состояний
Г — конечное множество символов (конечный алфавит)
Σ — входной алфавит - подмножество Г, не включающее пустой символ
D — правила перехода
- D: (Q\F) × Г → Q × Г × {L, R} — для детерминированной машины Тьюринга
- D: (Q\F) × Г → 2^{Q × Г × {L, R}} — для недетерминированной машины Тьюринга
q₀ ∈ Q — начальное состояние
F ⊆ Q — множество конечных состояний

Универсальная машина Тьюринга

Универсальная машина Тьюринга — такая машина Тьюринга, которая моделирует любую машину Тьюринга.

Рекурсивно-перечислимый язык

Язык является рекурсивно-перечислимым, если он может быть распознан машиной Тьюринга.

Линейно-ограниченный автомат

Линейно-ограниченный автомат — это машина Тьюринга, которая не может выходить за область входной строки.

Лемма о разрастании

Если язык L — регулярный, то ∃ k: ∀ w ∈ L, |w| ≥ k | w = xyz, 0 < |y| ≤ k, xyⁱz ∈ L, ∀ i ≥ 0

Неоднозначная грамматика

Грамматика называется неоднозначной, если для некоторой цепочки существует хотя бы два дерева вывода.

Левосторонний вывод

Левосторонний вывод — такой вывод, на каждом шаге которого заменяется самый левый нетерминал.

Магазинный автомат

Магазинный автомат — M = (Q, T, Г, D, q₀, z₀, F)

Q — конечное множество состояний
T — конечный входной алфавит
Г — конечный алфавит магазинных символов
D — D: Q × (T ∪ {ε}) × Г → 2^{Q × Г*}
q₀ ∈ Q — начальное состояние
z₀ — начальный символ магазина
F ⊆ Q — множество конечных состояний

Расширенный магазинный автомат

Расширенный магазинный автомат — M = (Q, T, Г, D, q₀, z₀, F)

Q — конечное множество состояний
T — конечный входной алфавит
Г — конечный алфавит магазинных символов
D — D: Q × (T ∪ {ε}) × Г* → 2^{Q × Г*}
q₀ ∈ Q — начальное состояние
z₀ — начальный символ магазина
F ⊆ Q — множество конечных состояний

Грамматика в нормальной форме Хомского

Грамматика находится в нормальной форме Хомского, если правила вывода имеют вид:

A → BC; B, C ∈ N
A → a
S → ε (если ε ∈ L; S не входит ни в одну правую часть)

Лемма о разрастании (для контекстно-свободного языка)

Для любого контекстно-свободного языка L ∃ l, k: α ∈ L, |α| > l, α = uvwxy

|vwx| ≤ k
vx ≠ ε
uvⁱwxⁱy ∈ L, ∀ i

Недостижимый символ

x — недостижимый символ, если он не входит ни в одну сентенциальную форму.

x — недостижимый символ, если не существует вывода S ⇒* αxβ

Непорождающий символ

x — непорождающий символ, если из него нельзя вывести терминальную цепочку

x — непорождающий символ, если из не существует вывода x ⇒* w, w ∈ T*

Бесполезный символ

Бесполезный символ — недостижимый или непорождающий символ.

Приведённая грамматика

Грамматика называется приведённой, если она не содержит бесполезных символов.

Регулярное множество

Регулярное множество в алфавите T определяется следующим образом:

{} (пустое множество) — регулярное множество в алфавите T
{a} — регулярное множество в алфавите T для каждого a ∈ T
{ε} — регулярное множество в алфавите T
Если P и Q — регулярные множества в алфавите T, то таковы же и множества
1. P ∪ Q (объединение)
2. PQ (конкатенация, то есть множество таких pq, что p ∈ P, q ∈ Q)
3. P* (итерация: P* = {ε} ∪ P ∪ PP ∪ PPP ∪ …)
Ничто друге не является регулярным множеством в алфавите T

Регулярное выражение

Регулярное выражение — форма записи регулярного множества.

Длина пути от листа к корню

Длиной пути от листа к корню называется число вершин в этом пути, считая сам лист (то есть, <число дуг> + 1)

Высота дерева

Высота дерева — максимальная длина пути (по всем терминальным символам).

Множество FIRST(u)

Если u — любая строка символов грамматики, положим FIRST(u) — множество терминалов, с которых начинаются строки, выводимые из u. Если u ⇒* ε, то ε так же принадлежит FIRST(u).

Множество FOLLOW(A)

Пусть A — нетерминал. Тогда FOLLOW(A) — множество терминалов a, которые могут появиться непосредственно справа от A в некоторой сентенциальной форме, то есть, множество терминалов a таких, что существует вывод вида S ⇒* uAav для некоторых u и v.

Множество FIRST₁

FIRST₁ — множество всех терминальных символов, с которых может начинаться цепочка терминальных символов, выводимых из цели грамматики или ε, если u ⇒* ε.

Пример:

S → aS | A
A → b | bSd | bA | ε
FIRST₁ = {a, b, ε}

Основа сентенциальной формы

Основа сентенциальной формы — позиция в сентенциальной форме, которая заменена в следующей сентенциальной форме.

Множество FIRST(A)

Множество FIRST(A) — множество терминальных символов,которыми начинаются цепочки, выводимые из A в грамматике G = (VT, VN, P, S), то есть, FIRST(A) = {a ∈ VT | A ⇒ aα, A ∈ VN, α ∈ (VT ∪ VN)*}

Множество FOLLOW(A)

Множество FOLLOW(A) — множество терминальных символов, которые следуют за цепочками, выводимыми из A в грамматике G = (VT, VN, P, S), то есть, FOLLOW(A) = {a ∈ VT | S ⇒ αAβ, β → aγ, A ∈ VN, α, β, γ ∈ (VT ∪ VN)*}

Леворекурсивная грамматика

Грамматика называется леворекурсивной, если в ней имеется нетерминал A такой, что существует вывод A ⇒ Au для некоторой строки u.

LL(1) грамматика

Контекстно-свободная грамматика называется LL(1) грамматикой тогда и только тогда, когда выполняются следующие два условия:

Для каждого нетерминала, являющегося левой частью нескольких правил:
< A > → α₁ | α₂ | … | α_n
необходимо, чтобы пересечение множеств FIRST(α_i) и FIRST(α_j) было пусто для всех i ≠ j
Для каждого аннулирующего нетерминала < A > ⇒ *$ необходимо, чтобы пересечение FIRST(A) и FOLLOW(A) было пустым

'Грамматика, для которой таблицы анализа не имеют неоднозначно определённых входов, называются LL(1).

LR грамматика

Грамматика, для которой можно построить таблицу LR разбора, называется LR грамматикой.

Конфигурация LR анализатора

Конфигурация LR анализатора — пара, первая компонента которой —содержимое стека, вторая — непросмотренный вход:
(S₀ X₁ S₁ X₂ S₂ … X_m S_m, A_i A_{i + 1} … A_n $).
Эта конфигурация соответствует правой сентенциальной форме X₁ X₂ … X_m A_i A_{i + 1} … A_n.

Атрибутная грамматика

Атрибутной грамматикой называется четвёрка AG = (G, A_S, A_I, R), где

G = (N, T, P, S) — приведённая контекстно-свободная грамматика
A_S — конечное множество синтезируемых элементов
A_I — конечное множество наследуемых атрибутов, A_S ∩ A_I = ∅
R — конечное множество семантических правил

Основа сентенциальной формы

Подцепочка сентенциальной формы, которая может быть сопоставлена правой части некоторого правила вывода, свертка по которому к левой части правила соответствует одному шагу в обращении правостороннего вывода, называется основой цепочки.

Пролог подпрограммы

Пролог подпрограммы — инициализация стека для подпрограммы (то есть, это PUSH BP, MOV BP, SP и подобное)

Дисплей

Дисплей — это массив, i-й элемент которого представляет собой указатель на область активации процедуры i-го статического уровня.

Статическая цепочка

Статическая цепочка — список, в который связаны все статические контексты.

Динамическая цепочка

Динамическая цепочка — «база» динамически предыдущей процедуры.

P.S. это скорее объяснение, нежели определение.

Конструирование Компиляторов

01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16

Календарь

	пн	пн	пн	пн	пн
Февраль		12	19	26
Март	05	12	19	26
Апрель	02	09	16	23	30
Май		07	14	21	28

Материалы к экзамену
Проведение экзамена | Определения | Теормин: 2007, 2009, 2012 | Алгоритмы решения задач

Получено с http://libesyr.so/wiki/%D0%9A%D0%BE%D0%BD%D1%81%D1%82%D1%80%D1%83%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%9A%D0%BE%D0%BC%D0%BF%D0%B8%D0%BB%D1%8F%D1%82%D0%BE%D1%80%D0%BE%D0%B2%2C_%D0%9E%D0%BF%D1%80%D0%B5%D0%B4%D0%B5%D0%BB%D0%B5%D0%BD%D0%B8%D1%8F

@@ Строка 7: / Строка 7: @@
 == Грамматика ==
 '''Грамматика''' — G = (N, T, P, S)
-* N — множество нетерминальных символов (A, B, C)
+* N — множество нетерминальных символов (напр. A, B, C...)
-* T (иногда E) — алфавит терминальных символов
+* T (иногда E) — алфавит терминальных символов (N &cup; T = ∅)
-* P — множество правил вывода
+* P — конечное множество правил вывода
-** P = {&alpha; &rarr; &beta; | &alpha; &isin; (N &cup; T)* N (N &cup; T)*, B &isin; (N &cup; T)* }
+** P = {&alpha; &rarr; &beta; | &alpha; &isin; (N &cup; T)<sup>+</sup>; &beta; &isin; (N &cup; T)*}
-* S &isin; N — аксиома
+* S &isin; N — аксиома (или начальный символ) грамматики
 == Сентенциальная форма ==

Конструирование Компиляторов, Определения

Материал из eSyr's wiki.

Версия 19:25, 4 сентября 2008

Содержание

Язык

Грамматика

Сентенциальная форма

Язык, порождённый грамматикой

Иерархия по Хомскому

Машина Тьюринга

Универсальная машина Тьюринга

Рекурсивно-перечислимый язык

Линейно-ограниченный автомат

Лемма о разрастании

Неоднозначная грамматика

Левосторонний вывод

Магазинный автомат

Расширенный магазинный автомат

Грамматика в нормальной форме Хомского

Лемма о разрастании (для контекстно-свободного языка)

Недостижимый символ

Непорождающий символ

Бесполезный символ

Приведённая грамматика

Регулярное множество

Регулярное выражение

Длина пути от листа к корню

Высота дерева

Множество FIRST(u)

Множество FOLLOW(A)

Множество FIRST1

Основа сентенциальной формы

Множество FIRST(A)

Множество FOLLOW(A)

Леворекурсивная грамматика

LL(1) грамматика

LR грамматика

Конфигурация LR анализатора

Атрибутная грамматика

Основа сентенциальной формы

Пролог подпрограммы

Дисплей

Статическая цепочка

Динамическая цепочка

Просмотры

Личные инструменты

Навигация

инструменты

Разделы

Спецкурсы

9 семестр

7 семестр

5 семестр

3 семестр

Поиск

Инструменты

Множество FIRST₁