Standard form of Optimization Problem
Equailty constraints와 Ineqaulity contraints를 가지고 있는 optimization problem (minimization의 경우)은 다음과 같이 표현된다.
minimize f(x)s.t:gi(x)≤0,i=1,…,mhj(x)=0,j=1,…,k
여기서 f:Rn→R 임.
이 standard form 의 optimization problem을 가르켜,
원래 풀어야하는 문제라는 뜻에서 Primal problem이라고도 부름.
convex problem으로 한정되지는 않으나,
convex problem일 경우 여러가지로 풀기 쉬어지는 장점을 가지기 때문에
대부분 convex problem으로 한정된다.
Lagrangian Primal
위 optimization problem에 대한 Lagrangian (or Lagrangian primal)은 다음과 같이 정의됨.
L(x,α,μ)=f(x)+α⋅g(x)+μ⋅h(x)
다음으로 풀어서 표기할 수 있음.
L(x,α,μ)=f(x)+m∑i=1αigi(x)+k∑j=1μjhj(x)
여기서 α∈Rm 이고 μ∈Rk이므로,
L:Rn×Rm×Rk→R
Lagrangian을 통해,
contraint optimzation problem이
unconstrained optimization problem이 됨.
Lagrangian Primal이 위와 같이 나오는 것에 대한 보다 자세한 설명은 다음 URL을 참고할 것.
2023.06.26 - [.../Math] - [Math] Lagrange Method or Lagrange Multiplier Method
[Math] Lagrange Method or Lagrange Multiplier Method
Lagrange Method or Lagrange Multiplier MethodLagrange Method (or Lagrange multiplier method, 라그랑지 승수법)은equality constraints를 가진 optimization problem의 solution을 쉽게 구하는 방법을 가르킨다. 이를 좀 더 자세
dsaint31.tistory.com
2023.07.06 - [.../Math] - [Math] Lagrangian from Standard Form using Indicator Function
[Math] Lagrangian from Standard Form using Indicator Function
Standard Form of Optimization ProblemEquailty constraints와 Ineqaulity contraints를 가지고 있는Optimization Problem (minimization의 경우)은 다음과 같이 표현된다. $$\begin{aligned}&\text{minimize }f(\textbf{x})\\ & \text{s.t:}\\ & g_i(\
dsaint31.tistory.com
Lagrangian dual로의 확장
Lagrangian primal의 중요한 특성 중 하나는
α의 모든 component αi≥0일 경우
전체 feasible set S 에 속하는 x∈S에서는
항상 primal problem의 optimal value p∗≜minx∈Sf(x) 보다 항상 작거나 같다는 것임.
p∗≜min x∈Sf(x)≥min x∈SL(x,α,μ)
x가 feasible set S에 속하는 것으로 제한될 때의 최소값인
min x∈SL(x,α,μ)에 비해,
모든 x로 확장한 경우의 Lagrangian primal의 최소값이 같거나 작은 것이 당연하므로 다음이 성립.
p∗≜min x∈Sf(x)≥min x∈SL(x,α,μ)≥min x∈RnL(x,α,μ)이 성립됨.
여기서 min x∈RnL(x,α,μ) 은Lagrangian의 infimum (하한, 최대하계)을 의미함.
infx∈RnL(x,α,μ)=min x∈RnL(x,α,μ)
Lagrangian Dual
앞서 주어진 L:Rn×Rm×Rk→R에 대한 Lagrangian dual function d:Rm×Rk→R은 다음과 같이 정의됨.
D(α,μ)=infx∈RnL(x,α,μ)=min x∈RnL(x,α,μ)
즉, Lagrangian Dual은 Lagrangian Primal의 infimum(하한)임.

infimum에 대해선 다음을 참고: 2023.07.05 - [.../Math] - [Math] Upper Bound (상계) and Lower Bound (하계)
[Math] Upper Bound (상계) and Lower Bound (하계)
Upper Bound and Supremum Wolfram MathWorld에서 언급하는 Upper Bound (상계)와 Supremum(상한) 정의는 다음과 같음. A function f is said to have an upper bound c if f(x)≤c for all x in its domain. The least upper
dsaint31.tistory.com
실제로 Lagrangian Dual에서
- x를 α,μ의 식으로 치환을 하게 되며,
- 해당 치환은 ∂L(x,α,μ)∂x=0를 이용하여 구함.
2023.07.07 - [.../Math] - [Math] Duality (쌍대성) 이란 : Optimization에서
[Math] Duality (쌍대성) 이란 : Optimization에서
요약optimization에서 Duality 는 primal problem과 dual problem의 관계를 의미함.이를 이용하여,원래 최적화(minimization ro maximization)해야 할 문제인 primal problem을 직접 푸는 대신에,duality를 이용하여 이에 해
dsaint31.tistory.com
Lagrangian Dual과 Lower Boundary of f(x)
Standard form으로 주어진 optimization proble의 solution을
x∗∈Rn이라고 하고,
최솟값 p∗=f(x∗)=min x∈Sf(x)라고 하고,
α의 모든 component αi≥0인 경우,
Lagrange dual D(α,μ)는
p∗ (f의 optimal value)에 대해 infimum이 된다.
즉,
f(x)≥f(x∗)=p∗≥min x∈RnL(x,α,μ)≥D(α,μ)
모든 αi가 0 이상이면서
x가 feasible set S에 속할 경우 constraints를 만족하므로, 다음이 항상 성립.
- min x∈SL(x,α,μ)≤f(x)
- Lagrangian의 두번째 항이 항상 0이하로 나오고, 세번째 항은 0이 되기 때문임.
Lagrangian dual은 Lagrangian의 infmum이므로 다음이 성립함.
D(α,μ)≤min x∈SL(x,α,μ)≤p∗=f(x∗)≤f(x)
결국, 다음이 성립한다.
D(α,μ)≤f(x∗)=p∗for ∀αi≥0,μj
위의 식에 의해,
max D(α,μ)를 통해 얻은 optimal dual value d∗=D(α∗,μ∗)도 p∗=f(x∗)보다 작거나 같음이 성립함.
d∗=D(α∗,μ∗)≤p∗=f(x∗)
위의 관계를 가르켜 weak duality라고 칭함.
Lagragian Dual Problem
다음을 Primal Problem (standard form) 이라고 부름.
min f(x)s.t:gi(x)≤0,i=1,…,mhj(x)=0,j=1,…,k
다음은 위의 Primal Problem에 대한 Lagrangian Problem임.
min x∈SL(x,α,μ)
- α의 모든 component αi≥0
다음은 위의 Primal Problem에 대한 Lagrangian Dual Problem임.
max D(α,μ)s.t:αi≥0,i=1,…,m
Primal problem을 풀 때,
- Lagrangian을 이용하여 not-constrained problem으로 바꾸어 풀 수 있으며,
- 또는 Lagrangian dual problem으로 바꾸어 풀 수도 있다.
일반적으로 Dual Problem의 optimal solution(최적해)가 Primal Problem의 optimal solution(최적해)는 같지 않고 이들에서의 최적값들 p∗,d∗들도 같지 않다.
단지 weak duality에 의해 p∗≥d∗ 가 성립한다.
하지만, D(α,μ)≤f(x∗)≤f(x) 이기 때문에 (weak duality),
만약 D(α,μ)=f(x)인 α,μ,x가 존재한다면, 위의 weak duality에 의해 해당 α,μ,x은 optimal solution이 된다 (strong duality).
즉, Strong duality의 경우 Dual Problem에서 구한 최대값 d∗은 Primal Problem의 최소값 p∗과 같아지며 이들 strong duality와 관련된 여러 conditions (Slater's condition, KKT conditions)을 활용하면 보다 효과적으로 풀 수 있게 된다.
일반적으로 dual problem을 이용하여 푸는 순서는 다음과 같음.
- ∇xL=0 을 만족하는 x 를 구함.
- ∇α,μD(α,μ)=0으로 α,μ를 구함.
Duality와 관련된 여러 conditions에 대한 이해가 이 문서에서의 Lagrangian과 Lagrangian Dual Problem에 더해지면 Optimization을 보다 효과적으로 풀 수 있게 된다.
'... > Math' 카테고리의 다른 글
[Math] Slater's Condition (0) | 2023.07.06 |
---|---|
[Math] Lagrangian from Standard Form using Indicator Function (0) | 2023.07.06 |
[Math] Upper Bound (상계) and Lower Bound (하계) (0) | 2023.07.05 |
[Math] Lagrange Method or Lagrange Multiplier Method (0) | 2023.06.26 |
[Math] Tangent Vector (0) | 2023.06.24 |