Условие задачи
Решение задачи по извлечению формулы изобретения
Ответ
Для решения поставленной задачи с помощью Томита-парсера понадобилось создать следующие файлы:
Config.proto файл конфигурации парсера;
First_grammar.cxx файл с грамматикой;
Dic.gzt файл словарь;
Fact_types.proto файл с извлекаемыми фактами;
Input.txt файл с исходным предложением.
Томита-парсер работает с кодировкой UTF-8, поэтому все файлы необходимо сохранить в данной кодировке и в начале каждого файла содержащего код программы указать это(encoding "utf8";).
На рисунке 1 представлен код файла конфигурации.