Интерпретация строковых выражений как функций
Иногда возникает потребность интерпретировать в программе строковое выражение как функцию
Например, при написании графопостроителя требуется переработать полученную строку так, чтобы в результате получилась функция, причем работающая со скоростью, необходимой для многократного пересчета координат точек. На самом деле круг подобных задач намного шире, он включает в себя программы, использующие любые варианты условий отбора (например, интерпретация условий SQL запросов). Эта статья посвящена решению задач такого рода, правда я не буду приводить готовых исходников, которые можно скачать и скомпилировать, моя задача - показать одну из возможностей реализации. Кому это нужно и интересно, сами напишут все, что надо и разовьют идею.
Примеры в статье будут написаны на PERL только потому, что этот язык является достаточно гибким и не придется отвлекать внимание от задачи на особенности реализации под конкретный язык.
Итак сначала о постановке задачи: программа получает строковое выражение, содержащее определение математической или логической функции любой сложности. Например, выражение
1/(5*6 + x^0.5 + y*0.8) или
(A == B AND C != 5) OR (D != 'abc')
Эти выражения являются сложными, но их можно свести к простому виду
[ПЕР1] [Функция1] [ПЕР2]
Операторы сравнения также являются функциями, например оператор != получает значения 2-х переменных и возвращает "0" или "1". Пусть [Функция1] возвращает значение [Значение1], тогда процесс упрощения строки может вестись следующим образом:
$A == 34 AND $C != 5
[ПЕР1] = $A, [ПЕР2] = 34, [Функция1] = "=="
После выделения функции заменяем ее в исходной строке возвращаемым значением:
[Значение1] AND $C != 5,
[Значение1] AMD [Значение2],
[Значение3]
Последнее значение и будет являться значением выражения, которое требуется найти (Далее будет рассматриваться работа только с простыми выражениями). Однако, если использовать переработку исходной строки с заменой функции на её значение при конкретных значениях переменных, то будут серьёзные потери производительности. Поэтому логичным является использовать не сами значения, а указатели на них. Для этого потребуется хранить значения самих переменных, констант и значений функций.
# Массив аргументов - констант
my @F_args_const;
my $Ch_args_const;
# Ассоциативный массив аргументов - переменных
my %zn_p;
# Массив аргументов - результатов функций
my $F_rez;
# Массив указателей на аргументы функции
my @F_args_p;
# Указатель на функцию
my $F_Name_p;
# Два указателя на аргументы функции
my $F_arg_p1;
my $F_arg_p2;
Для тех, кто не знаком с синтаксисом PERL поясню, что если перед именем переменной стоит знак "$", то переменная является скаляром и может содержать любое единичное значение: строку, число, указатель на объект. Если "@", то это массив скаляров, обращаться к каждому элементу массива можно используя имя массива с указанием перед ним знака "$" (то есть элемент массива - скаляр) и индекса в квадратных скобках после имени. Если "%", то это ассоциативный массив, обращаются к нему так же, как и к обычному, только вместо индекса в квадратных скобках указывается строковое выражение в фигурных.
Следует отметить, что строка разбирается только один раз при заполнении массивов, поэтому последующие расчеты выполняются быстрее.
# Определение функции "=="
sub ravno_ch
{
my $str1 = $_[0];
my $str2 = $_[1];
if ($str1 == $str2) {return 1;};
return 0;
};
# Значения, полученные из начальной строки
my $ARG1 = '$A';
my $ARG2 = '34';
my $FUNC = '==';
# Заполнение данных о функции
if ($FUNC eq '==')
{
$F_Name_p = &ravno_ch;
};
# Запоминаем ЗНАЧЕНИЕ $ARG2 в мессиве констант
$F_args_const[0] = $ARG2;
# Запоминием УКАЗАТЕЛЬ на первый аргумент функции
$F_arg_p1 = $zn_p{$ARG1};
# Запоминием УКАЗАТЕЛЬ на второй аргумент функции
$F_arg_p2 = $F_args_const[0];
Теперь несколько слов о вызове функции и о задании её аргументов. С константным аргументом всё просто, его значение сохранено в массиве констант и при каждом расчете значения функции оно будет использоваться. Значение же переменной $A будет храниться в элементе ассоциативного массива $zn_p{'$A'}. Его можно будет легко задавать перед каждым расчетом.
# Запоминаем текущее значение переменной
$zn_p{'$A'} = 12;
# Вызываем функцию
$F_rez = &$F_Name_p($$F_arg_p1, $$F_arg_p2);
Знак "$$" перед именем переменных F_arg_p1 и F_arg_p2 означает, что при расчете нужно брать не значения этих переменных (в них лежат указатели), а данные, на которые они указывают. Знак "&$" перед именем F_Name_p означает, что нужно вызвать функцию, указатель на которую записан в переменной $F_Name_p.
Все, что было описано в статье, можно использовать и для интерпретации сложных выражений, просто в таком случае они будут представляться не одной функцией, а набором функций (указатели на них логично записать в массив и вызывать их последовательно). Наверняка найдутся читатели, которые скажут, что реализация такой задачи на PERL не нужна, или её можно реализовать с использованием стандартных средств языка. Они конечно будут правы, однако подход, примененный для решения задачи позволяет сделать аналог например на СИ (язык поддерживает все методы, которые использовались в данном примере)