Uma gramática é um formalismo axiomático de geração que permite derivar todas as palavras da linguagem que representa. Pode-se definir uma gramática como uma quádrupla ordenada tais que:
- é um conjunto finito de símbolos variáveis ou não-terminais;
- é um conjunto finito de símbolos terminais (disjunto de );
- é uma relação finita (conjunto finito de pares) na forma denominada regras de produção;
- é um elemento de chamado variável inicial.
As regras de produção definem as condições de geração das palavras da linguagem. A aplicação sucessiva de regras de produção permite derivar todas as palavras da linguagem representada pela gramática. Sendo assim, dada uma gramática , uma linguagem gerada por , denotada por é composta por todas as palavras de símbolos terminais deriváveis a partir do símbolo inicial , ou seja:
Duas gramáticas e são equivalentes se e somente se ambas geram a mesma linguagem, ou seja, se .
Uma cadeia é dita uma sentença da gramática se e somente se , ou seja, se é uma cadeia formada apenas de símbolos terminais e pode ser obtida a partir do símbolo da gramática por meio de sucessivas derivações.
Uma cadeia é dita forma sentencial da gramática se e somente se , ou seja, é uma palavra formada por símbolos variáveis ou terminais (ou ambos). Sendo assim, uma forma sentencial é um dos passos intermediários para alguma sentença gerada pela gramática, ou a própria sentença.