grammar.py: Fix duplicate and missing rules

- unroll_lists() sometimes introduced identical lists into a rule set - unroll_options() sometimes chopped off a production's last rule Signed-off-by: Jan Lindemann <jan@janware.com>
2026-01-15 09:53:32 +01:00 · 2017-11-05 18:30:57 +01:00 · 2017-11-05 18:30:57 +01:00 · a2e5f9e1c9
commit a2e5f9e1c9
parent dafe6d34b2
1 changed files with 32 additions and 2 deletions
--- a/tools/python/jwutils/grammar.py
+++ b/tools/python/jwutils/grammar.py
@ -418,6 +418,18 @@ def split_list_by_regex(l_, regex):
    l = copy.deepcopy(l_)
    return [list(x[1]) for x in itertools.groupby(l, lambda x: re.match(regex, x)) if not x[0]]

+def remove_duplicate_rules(rules):
+    r = []
+    for rule in rules:
+        if rule in r:
+            continue
+        r.append(rule)
+    slog(DEBUG, "rules after removing duplicates >")
+    for rule in rules:
+        slog(DEBUG, "-> " + format_rule(rule))
+    slog(DEBUG, "rules after removing duplicates <")
+    return r
+
 def grammar_tokenize_ebnf(content):
    r = []
    c = ''
@ -627,6 +639,7 @@ def grammar_fix_extensions(grammar, mode):

 def grammar_unroll_lists(grammar):
    delimiters = [ '","', '";"', '"|"' ] # TODO: this could be a function parameter to make it generic
+    newrule = None
    for tok, p in grammar.iteritems():
        newrules = []
        for rule in p.rules:
@ -677,13 +690,22 @@ def grammar_unroll_lists(grammar):
                    listrule.append(c)
                    continue
                newrule.append(c)
+            slog(DEBUG, "appending " + format_rule(newrule))
            newrules.append(newrule)
-        grammar[tok].rules = newrules
+            newrule = None
+        else:
+            if newrule is not None:
+                slog(DEBUG, "appending " + format_rule(newrule))
+                newrules.append(newrule)
+                newrule = None
+        slog(DEBUG, "done processing rules for " + tok)
+        grammar[tok].rules = remove_duplicate_rules(newrules)
    return grammar

 def rules_unroll_options(rules):
    r = []
    found = False
+    newrule = None
    slog(DEBUG, "unrolling", format_rules(rules))
    for rule in rules:
        square = 0
@ -733,13 +755,19 @@ def rules_unroll_options(rules):
            break
        if not found:
            r.append(newrule)
+            newrule = None
+    else:
+        if newrule is not None:
+            slog(DEBUG, "appending " + format_rule(newrule))
+            r.append(newrule)
+            newrule = None
    if found:
        return rules_unroll_options(r)
    return r

 def grammar_unroll_options(grammar):
    for tok, p in grammar.iteritems():
-        grammar[tok].rules = rules_unroll_options(p.rules)
+        grammar[tok].rules = remove_duplicate_rules(rules_unroll_options(p.rules))
    return grammar

 def rules_unroll_alternatives(rules):
@ -1208,6 +1236,7 @@ def grammar_create_y(grammar, opts):
    out += textwrap.dedent("""\

        %define parse.error verbose
+        // %define lr.type ielr
        %define api.pure full
        %param { struct context *context } { void *scanner }
    """)
@ -1673,6 +1702,7 @@ class GrammarCmd(jwutils.Cmd):
            grammar = grammar_unroll_alternatives(grammar)
        if args.unroll_options:
            grammar = grammar_unroll_options(grammar)
+        #grammar['logical_expression'].dump(ERR)
        if len(args.check_symbols):
            check_symbols = []
            if args.check_symbols == 'all':