Динамическое программирование (задача о загрузке)
Категория реферата: Рефераты по математике
Теги реферата: доклад, доклад по обж
Добавил(а) на сайт: Ignat'ev.
Предыдущая страница реферата | 1 2 3 4 5 | Следующая страница реферата
3. Выяснить набор шаговых управлений xi для каждого шага и налагаемые на них ограничения.
4. Определить какой выигрыш приносит на i-ом шаге управление xi, если перед этим система была в состоянии S, т.е. записать «функцию выигрыша»:
[pic].
5. Определить, как изменяется состояние S системы S под влиянием управление xi на i-ом шаге: оно переходит в новое состояние
[pic]. (1.1)
6. Записать основное рекуррентное уравнение динамического программирования, выражающее условный оптимальный выигрыш Wi(S)
(начиная с i-го шага и до конца) через уже известную функцию
Wi+1(S):
[pic]. (1.2)
Этому выигрышу соответствует условное оптимальное управление на i-м шаге xi(S) (причем в уже известную функцию Wi+1(S) надо вместо S подставить измененное состояние [pic])
7. Произвести условную оптимизацию последнего (m-го) шага, задаваясь гаммой состояний S, из которых можно за один шаг дойти до конечного состояния, вычисляя для каждого из них условный оптимальный выигрыш по формуле [pic]
8. Произвести условную оптимизацию (m-1)-го, (m-2)-го и т.д. шагов по формуле (1.2), полагая в ней i=(m-1),(m-2),…, и для каждого из шагов указать условное оптимальное управление xi(S), при котором максимум достигается.
Заметим, что если состояние системы в начальный момент известно (а это
обычно бывает так), то на первом шаге варьировать состояние системы не
нужно - прямо находим оптимальный выигрыш для данного начального состояния
S0. Это и есть оптимальный выигрыш за всю операцию
[pic]
9. Произвести безусловную оптимизацию управления, «читая» соответствующие рекомендации на каждом шаге. Взять найденное оптимальное управление на первом шаге [pic]; изменить состояние системы по формуле (1.1); для вновь найденного состояния найти оптимальное управление на втором шаге х2* и т.д. до конца.
Данные этапы рассматривались для аддитивных задач, в которых выигрыш за
всю операцию равен сумме выигрышей на отдельных шагах. Метод динамического
программирования применим также и к задачам с так называемым
«мультипликативным» критерием, имеющим вид произведения:
[pic]
(если только выигрыши wi положительны). Эти задачи решаются точно так
же, как задачи с аддитивным критерием, с той единственной разницей, что в
основном уравнении (1.2) вместо знака «плюс» ставится знак «умножения»:
[pic]
1.2 Примеры задач динамического программирования
Задача планирования рабочей силы:
При выполнении некоторых проектов число рабочих, необходимых для
выполнения какого-либо проекта, регулируется путем их найма и увольнения.
Поскольку как наем, так и увольнение рабочих связано с дополнительными
затратами, необходимо определить, каким образом должна регулироваться
численность рабочих в период реализации проекта.
Предположим, что проект будет выполнятся в течение n недель и минимальная потребность в рабочей силе на протяжении i-й недели составит bi рабочих. При идеальных условиях хотелось бы на протяжении i-й недели иметь в точности bi рабочих. Однако в зависимости от стоимостных показателей может быть более выгодным отклонение численности рабочей силы как в одну, так и в другую сторону от минимальных потребностей.
Если xi – количество работающих на протяжении i-й недели, то возможны затраты двух видов: 1) С1(xi- bi)-затраты, связанные с необходимостью содержать избыток xi - bi рабочей силы и 2) С2(xi- xi-1)-затраты, связанные с необходимостью дополнительного найма (xi- xi-1) рабочих.
Элементы модели динамического программирования определяются следующим образом:
1. Этап і представляется порядковым номером недели і, і=1,2,…n.
Рекомендуем скачать другие рефераты по теме: физика и техника, реферат на тему творчество.
Предыдущая страница реферата | 1 2 3 4 5 | Следующая страница реферата