StatSoft Russia
StatSoft Russia

 

Анализ структуры поставщиков и выбор оптимального поставщика

Описание объекта и цель исследования

Анализировалась структура поставщиков предприятия. Поставляемая продукция представляет собой сырье для производства конечного продукта на предприятии. Качество сырья поставщиков различается. Каждый поставщик характеризуется месячным объемом поставок. Рассматривалось 11 поставщиков.
Конечный продукт характеризуется выходным параметром, который является показателем его качества. На выходной параметр оказывает влияние структура поставщиков (поскольку сырье различается по качеству, то в зависимости от объема поставок того или иного поставщика параметр качества будет меняться). Характер зависимости выходного параметра от объема поставок каждого поставщика неизвестен.
Целью исследования является анализ влияния объемов поставок каждого поставщика на значения выходного параметра, характеризующего качество продукции.
Стояла задачи построение математической модели, описывающей характер влияния объемов поставок каждого поставщика на выходной параметр.
В ходе решения задачи рассматривалась также классификация поставщиков по степени их влияния на исходный показатель.
Исходные данные представляют месячные ряды объемов поставок каждого поставщика и значения выходного показателя.
Мы проводим анализ последовательно в соответствии с технологиями
На предварительном этапе производится организация данных для последующего анализа в системе STATISTICA. Данные представлены следующим образом: столбцы соответствуют поставщикам, строки – масяцам. Таким образом, каждый столбец представляет собой временной ряд месячных объемов продаж каждого поставщика.
Если поставщик не поставлял продукцию в текущем месяце, то в соответствующих ячейках стоят нули.
Файл данных приведен на рисунке.

Файл данных к задаче в формате STATISTICA
Рис.1. Файл данных к задаче в формате STATISTICA

Разведочный анализ

Представим графически зависимость выходного параметра от объемов поставок каждого поставщика:

Зависимость параметра 1 от объема поставок поставщика 1 Зависимость параметра 1 от объема поставок поставщика 2
Зависимость параметра 1 от объема поставок поставщика 3 Зависимость параметра 1 от объема поставок поставщика 4
Зависимость параметра 1 от объема поставок поставщика 5 Зависимость параметра 1 от объема поставок поставщика 6
Зависимость параметра 1 от объема поставок поставщика 7 Зависимость параметра1 от объема поставок поставщика 8
Зависимость параметра 1 от объема поставок поставщика 10 Зависимость параметра 1 от объема поставок поставщика 10
Зависимость параметра 1 от объема поставок поставщика 11
Рис.2 Зависимость параметра 1 от объема поставок каждого поставщика. На диаграммах четко прослеживается наличие устойчивого влияния одних поставщиков и достаточно слабое воздействие других.

Анализ диаграмм рассеяния позволяет говорить о том, что статистически значимое влияние на выходную переменную могут оказывать поставщики 2, 3, 5, 8, 9, 11. Влияние поставщиков 4, 7 статистически незначимо – выходной параметр слабо зависит от изменения в их объемах продаж.

Динамика объемов продаж на исследуемом промежутке времени:

                                  Динамика объемов поставок поставщиков 1-4
                                  Динамика объемов поставок поставщиков 5-9
                                  Динамика объемов поставок поставщиков 10-11
                                  Динамика выходного параметра 1
Рис.3. Динамика объемов поставок каждого поставщика и динамика выходного параметра

Классификация поставщиков

Проведем классификацию поставщиков по степени их влияния на выходной показатель. Для этого воспользуемся методами модуля “Кластерный анализ” системы STATISTICA. Проведем классификационный анализ поставщиков. Его целью является определение степени сходства поставщиков друг с другом. Процедура носит название “Древовидная кластеризация”. Результаты следующие:

Дерево классификации множества поставщиков
Рис. 4. Результаты древовидной кластеризации множества поставщиков

Диаграмма классификации иллюстрирует разбиение поставщиков на группы. Анализируя ее, можно, например, утверждать, что поставщики 4, 5, 6, 7, 9, 10 оказывают сходное влияние на выход продукции. Следовательно, можно говорить о сходстве качества сырья у данных поставщиков.

Построение модели. Строим регрессионную линейную модель влияния объемов поставок на выходную переменную, т.е. будем приближать выходную переменную формулой:

Output = A1 + A2*Пост1 +…A11*Пост11 + e

– линейная зависимость от объемов продаж каждого поставщика с неизвестными коэффициентами. e – случайная компонента с нулевым математическим ожиданием.

Задача состоит в том, чтобы оценить неизвестные коэффициенты. Для построения регрессионной модели и численной оценки коэффициентов перед объемами продаж поставщиков воспользуемся модулем STATISTICA “Множественная регрессия”.

Все оценки строятся легко в диалоговом режиме. Программа автоматически найдет лучшую модель, т.е. исключит поставщиков, влияние которых на выходной параметр очень слабое, и оставит в модели поставщиков, которые действительно оказывают значимое влияние на исследуемую переменную.

Множественная регрессия
Рис. 5. Указание зависимой переменной и независимых факторов

Результаты множественной регрессии
Рис. 6. Окно результатов расчетов коэффициентов регрессии. Красным цветом выделены статистически значимые независимые переменные, синим – незначимые переменные

Окончательная формула для расчета выходного показателя в линейной спецификации следующая:
Output = 162.3 - 46.8*Пост1 – 36.8*Пост2 –19.9*Пост3 – 58.8*Пост5
38.4*Пост6 – 38.1*Пост8 – 150.1*Пост10 – 38.2*Пост11
Результаты численного оценивания модели позволяют построить прогноз параметра 1:

Наблюдаемые значения и прогноз
Рис. 7. Наблюдаемые значения и прогноз

Определим оптимальное множество поставщиков. Для этого проведем анализ модели на избыточность. Наша цель - проверить обоснованность вхождения всех поставщиков в модель. Проверка проводится методом расчета показателя толерантности для каждой независимой переменной в уравнении. Толерантность переменной показывает, насколько велика ее связь с остальными независимыми переменными. Если связь достаточно велика, то использование данной переменной нецелесообразно и является избыточным. Следовательно, ее можно исключить из модели без большой потери в объясняющих свойствах. В итоге мы получим некоторое множество поставщиков, влияние которых на исследуемый параметр 1 наиболе значимо, причем будет устранена избыточность переменных. С экономической точки зрения избыточность вхождения поставщика в модель означает его слабое влияние на выходной параметр. Целесообразно проводить закупки только у тех поставщиков, качество сырья которых достаточно сильно влияет на параметр 1. Это даст экономию финансовых ресурсов без большого ущерба для параметра 1 конечной продукции предприятия. Результаты проверки на избыточность:
Толерантность переменных
Рис.8. Толерантность для многих переменных низкая, что говорит о том, что спецификация модели нуждается в улучшении

Реализуем следующий алгоритм поиска оптимальной спецификации модели. Будем включать или исключать из модели независимые переменные на каждом шаге регресии (на первом шаге используем одну переменную, на втором добавляем еще одну и смотрим на результаты. Если значимость коэффициентов ухудшилась, то ищем другую комбинацию из двух переменных). В результате получим оптимальную спецификацию модели. Алгоритм реализован в модуле "Множественная регрессия". Вызвать его можно, выбрав опцию "Пошаговая регрессия с включением":
Определение модели
Рис.9. Выбор опции "Пошаговая регрессия с включением"

Результаты работы алгоритма:

Результаты множественной регрессии
Рис.10. Результаты работы алгоритма пошаговой регрессии с исключением

Алгоритм поиска оптимальной спецификации оставил в модели две переменных: поставщика 3 и поставщика 9. Это оптимальные поставщики для предприятия с точки зрения их влияния на параметр 1. Численное оценивание коэффициентов дает следующие результаты:

Результаты численного оценивания коэффициентов
Рис.11. Итоги численного оценивания модели с оптимальными поставщиками

Характер влияния всех поставщиков на выходной показатель отрицательный. Значение скорректированного R2 = 0.708  довольно высокое для такого количества наблюдений и данной структуры входных переменных, что говорит о достаточно хороших объясняющих свойствах модели.
Первый столбец на рисунке содержит численные значения оценок коэффициентов модели при объемах поставок для каждого поставщика. Интерпретация коэффициентов следующая: при изменении объема поставок для некоторого поставщика на единицу (единицей считается единица измерения представленных данных) значение выходного показателя меняется на величину соответствующего коэффициента в данном столбце.
Построим теперь нелинейную модель влияния поставщиков на выходной параметр 1, которая называется модель экспоненциального роста:
Output = C + exp(b0 + b1*Пост1 + … + b11*Пост11)
Оценивание коэффициентов проводится с использованием методов модуля STATISTICA “Нелинейное оценивание”. Применяем метод оценивания коэффициентов Хука-Дживиса.
Результаты оценивания:
Коэффициент
с
b0
b1
b2
b3
b4
b5
b6
b7
b8
b9
b10
b11
Оценка
-65.5
6.37
-0.63
-0.58
-0.46
-0.11
-0.67
-0.64
-1.74
-0.56
-0.51
-1.7
-0.56
Рис.12. Численные  результаты оценивания

Окончательная формула для расчета выходного показателя в рассматриваемой спецификации следующая:

Output= -65.5+e 6.37-0.63*Пост1-0.58*Пост2-0.46*Пост3-0.11*Пост4-0.67*Пост5-0.64*Пост6-1.74*Пост7-0.56Пост8-0.51*Пост9-1.7*Пост10-0.56*Пост11
Доля объясненной дисперсии в модели: 84.592%.
Приведем для сравнения прогнозные свойства двух построенных моделей: линейной и экспоненциальной:

Прогноз и наблюдаемые значения
Рис.13. Построим на одном графике прогнозы, сделанные различными способами: с помощью линейной модели и с помощью модели экспоненциального роста

Выводы

Исследование проводилось поэтапно. На этапе разведочного анализа данных данные были представлены графически. Установлено, что поставщики распадаются на две категории: поставщики, оказывающие сильное статистическое влияние на выходной параметр и поставщики, влияние которых очень слабое. Методом древовидной классификации выделены группы поставщиков, сырье которых имеет сходное качество. Это 4, 7 и 10. Были построены две различные модели влияния объемов поставок на выходной параметр: линейная модель и экспоненциальная модель. Проведено численное оценивание коэффициентов модели, отражающих влияние каждого поставщика. С помощью алгоритма пошаговой линейной регрессии с включением определено множество оптимальных поставщиков с точки зрения максимизации выходного параметра 1. Это оказались поставщики 3 и 9.

наверх