ТЕОРИЯ РАСПОЗНАВАНИЯ ОБРАЗОВ В ЭКОНОМИЧЕСКИХ ИССЛЕДОВАНИЯХ

Сараева Н.В.
(Москва, МГТУ "Станкин")

        В данной статье рассматривается совместное применение аппарата распознавания образов и методов математической статистики для решения задачи прогнозирования экономических показателей по статистическим моделям.
        Классическая математико-статистическая постановка задачи прогнозирования состоит в следующем. Пусть поведение некоторой системы (экономической, технической) характеризуется вектором состояний y(t). Компоненты этого вектора - показатели функционирования системы, т.е.

y(t) = { y1(t), y2(t)...yn(t)} .

        Начиная с момента времени t = t0 за применением вектора y (t) ведутся наблюдения, результаты которых фиксируются в дискретные моменты времени

ti = t0 + i*D t i=1...k

        Для простоты полагаем D t = const.
        Значения y (ti) образуют векторный временной ряд на интервале наблюдения [t0,tk].
        Задача прогнозирования состоит в том, чтобы построить математическую модель временного ряда, такую, что ее экстраполяция за правый предел интервала наблюдения позволяла бы с некоторой вероятностью предсказывать будущие значения вектора

y(tk + T),

где T - интервал прогнозирования.
        В теории временных рядов, являющейся частью математической статистики, разработаны разнообразные методы построения моделей [1].
        Один из простейших методов состоит в последовательном выявлении в результатах наблюдения монотонных (в частном случае - линейных) трендов, периодических составляющих с различными частотами и амплитудами и в статистическом анализе случайной компоненты. В результате такого анализа процесс функционирования системы представляют в виде аддитивной формы:

y (t) = f (t) +j = 1...n,

где fj (t) - монотонная функция (тренд);
- амплитуда, частота и фаза гармонических составляющих;
- случайная составляющая, характеризующаяся функцией распределения вероятностей.
        Располагая набором таких зависимостей можно вычислить значения детерминированных составляющих в момент прогноза, а зная законы распределения величин - определить доверительный интервал и доверительную вероятность (достоверность) прогноза.
        Описанный подход (и его более сложные разновидности) позволяет с достаточной степенью уверенности строить краткосрочные и среднесрочные прогнозы для процессов, описываемых количественно.
        Однако в реальной жизни, в реальных производственных и экономических системах многие факторы, влияющие на ход и результат процессов, носят качественный характер. В этих условиях описанный выше метод построения прогнозов неприемлем и требуются иные подходы. Один из таких подходов базируется на использовании теории и методов распознавания образов. Суть его состоит в следующем.
        Производственный процесс (ПП) можно рассматривать как преобразование входного материального потока (сырья, заготовок, полуфабрикатов и т.д.) в готовую продукцию. В процессе этого преобразования расходуется энергия и используется необходимая информация. Возможность влияния ПП на его будущие результаты зависит от наличия различного рода ресурсов: материалов, рабочей силы, оборудования и его технического состояния, инструмента, оснастки и т.д. Все это будем называть производственными факторами (ПФ). Некоторые из ПФ допускают лишь качественное описание. Результаты выполнения ПП оцениваются набором экономических показателей (ЭП): количеством произведенной за некоторое время продукции, ее себестоимости, качеством и т.д. Часто требуется, чтобы все или некоторые ЭП удовлетворяли нормативным условиям, выражаемым в форме неравенств. Так, если q - некий ЭП, то могут быть заданы требования вида , либо , где qн - нормативное значение ЭП.
        Для прогнозирования результатов ПП методами распознавания образов выдвигается следующая основная гипотеза. Пусть в момент времени t0 существует некоторый набор (вектор) ПФ:

x(t0) = { x1(t0), x2(t0)...xn(t0)}

        Предполагается, что вследствие существования x(t0) в момент времени (t0 + T) реализуется набор (вектор) ЭП:

Q(t0 + T) = { q1(t0 + T), q2(t0 + T)...qm(t0 + T)} ,

т.е. существует некоторое отображение пространства X в пространство Q. Это отображение можно интерпретировать как функциональную, либо как корреляционную зависимость.
        Компоненты qj (j = 1...m) могут удовлетворять, либо не удовлетворять нормативным условиям. В зависимости от того, какие из qj удовлетворяют нормативным условиям, а какие нет, вектор Q относится к одному из непересекающихся классов: B1,B2,...Bk. Вектор Q можно трактовать как образ в соответствующем пространстве. В силу существования отношения x(t0) задачу прогнозирования можно сформулировать так:
        Формулировка 1: зная значение вектора x(t0) определить принадлежность вектора к одному из классов B1,B2,...Bk.
        Эта задача допускает следующую модификацию.
        Пусть среди компонент вектора x есть такие, которые определяются качественно. Для простоты будем считать, что качественные ПФ определяются бинарно (1 - наличие некоего признака, 0 - его отсутствие). Что касается компонент, определяемых количественно, то для них можно указать некоторые «зоны нечувствительности» или «зоны безразличия», т.е. между некоторыми точками множества х можно установить отношения эквивалентности. В этих предложениях множество х можно разбить на непересекающиеся подмножества - классы A1,A2,...Al.
        Принадлежность вектора x(t0) к одному из этих классов Аj (j =1...l) порождает принадлежность вектора к одному из классов Вi (i = 1...k) с разной вероятностью.В этом случае задача прогнозирования состоит в следующем:
        Формулировка 2: зная принадлежность вектора x(t0) к классу Аj (j =1...l), определить класс Вi (i = 1...k), вероятность принадлежности вектора к которому максимальна.
        Необходимым условием выполнения прогнозов является наличие адекватной имитационной модели ПП или экономической системы, с помощью которой по значениям вектора x(t0) можно получать текущие значения Q(t) и, следовательно . Исследуя имитационную модель, можно получить более простую и удобную прогнозирующую модель - вторичную по отношению к имитационной [2].
        Рассмотрим два случая построения прогнозирующей модели.
        Пусть задача прогнозирования решается в формулировке 1.
В этом случае на имитационной модели ПП проводится серия модельных экспериментов, спланированная, например, по методу Монте-Карло, т.е. в каждом эксперименте значения ПФ, т.е. компонент вектора x(t0), выбираются как случайные числа, равномерно распределенные на интервале определения каждого ПФ:

(i = 1...n).

        По результатам каждого эксперимента фиксируют значения ЭП, т.е. компонент вектора и определяют, к какому из классов Вi (i = 1...k) относится получившийся результат. В итоге формируется таблица:

N экспер. x1(t0) x2(t0) ... xn(t0) q1(t0+T) ... qm(t0+T) Класс
1 x11 x21 ... xn1 q11 ... qm1 Вi1(i=1...k)
2 x12 x22 ... xn2 q12 ... qm2 Вi2(i=1...k)
... ... ... ... ... ... ... ... ...
N x1N x2N ... xnN q1N ... qmN ВiN(i=1...k)


        Располагая такой таблицей, можно, применяя какой-либо из известных алгоритмов теории распознавания образов [3], построить в пространстве х поверхности, отделяющие друг от друга группы точек, дающих результат моделирования, относящихся к различным классам Вi (i = 1...k). Система уравнений таких поверхностей будет представлять собой решающее правило, с помощью которого в дальнейшем можно осуществлять прогноз. Подставляя в эти уравнения значений ПФ для данной конкретной ситуации можно оперативно оценить, каковы будут ЭП по истечении периода прогноза Т.
        Пусть, далее, задача прогнозирования решается в формулировке 2. Начало процедуры построения прогнозирующей модели не отличается от рассмотренной выше, однако итоговая таблица выглядит иначе. Оценивается принадлежность вектора x(t0) к одному из классов Аj (j =1...l). В зависимости от того, к какому из классов Вi относится получившийся результат, к числу, содержащемуся в ячейке с индексом ji, добавляется единица. В результате получается таблица - матрица размера (l * k), показанная ниже. В ячейках матрицы находится число опытов аij, показывающее, какова частота получения результата, относящегося к классу Вi, если исходное состояние относится к классу Аj.

Классы по А Классы по В
  В1 В2 ... Вj Вk
А1 a11 a12 ... a1i a1k
А2 a21 a22 ... a2i a2k
...
Аj aj1 aj2 ... aji ajk
...
Аl al1 al2 ... ali alk


        Наиболее вероятный класс B1,B2,...Bi,…,Bk для каждого класса A1,A2,...Aj,…,Al выбирается по максимальному значению a11…. alk в соответствующей строке.
        В прогнозировании удобнее использовать матрицу частот. Для этого необходимо все строки таблицы разделить на общее число экспериментов N.

Pji=aji / N

Классы B1 В2 Вi Вk
А1 P11 P12 P1i P1k
А2 P21 P22 P2i Р2k
Аj Pj1 Pj2 Pji Pjk
Аl Pl1 Pl2 Pli Plk
  P(B1) P(B2) P(Bi) P(Bk)


        Располагая такой матрицей и зная, что конкретный вектор x(t0) относится к классу Аj,, можно оценить, к какому классу Вi с наибольшей вероятностью будет относится вектор .
        Использование теории и методов распознавания образов совместно с классическими математико-статистическими методами позволяет рассматривать задачу прогнозирования производства в полном объеме, т.е. с учетом количественных и качественных показателей.

 

ЛИТЕРАТУРА:

  1. Бокс Дж., Дженкинс Г. Анализ временных рядов. Прогноз и управление. Вып.1 М.: «Мир», 1971, 406 с.
  2. Левин А.И. Математическое моделирование в исследованиях и проектировании станков. М.:«Машиностроение», 1978.
  3. Вапник В.Н., Червоненкис А.Я. Теория распознавания образов. М.: «Наука», 1974, 415 с.