domain의 convex set인 function f:Rn→R가 convex function임을 보이기 위한 조건.
Theorem
Vector space Rn에서 정의된 function f:Rn→R가 differentiable 일 경우, 다음 두 조건이 necessary and sufficient condition임.
- function f는 convex function임.
- domain dom f는 convex set이고, 임의의 x1,x2∈dom f에 대해 다음이 성립.
f(x1)≥f(x2)+∇f(x2)T(x1−x2)
증명
1이 성립할 경우, 항상 2가 성립하는지에 대한 증명 : 1→2.
q(α)=f(x2+α(x1−x2))라면 다음이 성립함.
lim
chain rule에 의해 q^\prime(\alpha)=\nabla f(\textbf{x}_2 +\alpha(\textbf{x}_1-\textbf{x}_2))^T(\textbf{x}_1-\textbf{x}_2)이 성립하므로, g^\prime(0)=\nabla f(\textbf{x}_2)^T(\textbf{x}_1-\textbf{x}_2) 임.
f(\textbf{x}_2 + \alpha (\textbf{x}_1-\textbf{x}_2))는 다음이 성립함.
f(\textbf{x}_2 +\alpha (\textbf{x}_1 - \textbf{x}_2)) = f(\alpha \textbf{x_1} + (1-\alpha)\textbf{x}_2)
f가 convex function일 경우 다음이 성립.
f(\alpha \textbf{x}_1 +(1-\alpha)\textbf{x}_2) \le \alpha f(\textbf{x}_1) + (1-\alpha) f(\textbf{x}_2)
위의 식은 다음이 성립함.
\begin{aligned}f(\alpha \textbf{x}_1 +(1-\alpha)\textbf{x}_2) &\le \alpha f(\textbf{x}_1) + (1-\alpha) f(\textbf{x}_2)\\ \frac{f(\alpha \textbf{x}_1 +(1-\alpha)\textbf{x}_2)}{\alpha} &\le f(\textbf{x}_1) + \frac{1}{\alpha}f(\textbf{x}_2) - f(\textbf{x}_2)\\ \frac{f(\alpha \textbf{x}_1 +(1-\alpha)\textbf{x}_2) - f(\textbf{x}_2)}{\alpha} &\le f(\textbf{x}_1)- f(\textbf{x}_2) \\ f(\textbf{x}_2) +\frac{f(\alpha \textbf{x}_1 +(1-\alpha)\textbf{x}_2) - f(\textbf{x}_2)}{\alpha} &\le f(\textbf{x}_1)\\ f(\textbf{x}_1) &\ge f(\textbf{x}_2) +\frac{f(\textbf{x}_2+\alpha(\textbf{x}_1-\textbf{x}_2)) - f(\textbf{x}_2)}{\alpha} \end{aligned}
여기에 \displaystyle \lim_{\alpha \to 0}를 양 side에 취하면,
\begin{aligned} \lim_{\alpha \to 0} f(\textbf{x}_1) &\ge \lim_{\alpha \to 0}f(\textbf{x}_2) +\lim_{\alpha \to 0}\frac{f(\textbf{x}_2+\alpha(\textbf{x}_1-\textbf{x}_2)) - f(\textbf{x}_2)}{\alpha} \\ f(\textbf{x}_1) &\ge f(\textbf{x}_2)+\lim_{\alpha \to 0}\frac{f(\textbf{x}_2+\alpha(\textbf{x}_1-\textbf{x}_2)) - f(\textbf{x}_2)}{\alpha} \\ f(\textbf{x}_1) &\ge f(\textbf{x}_2)+\lim_{\alpha \to 0}\frac{f(\textbf{x}_2+\alpha(\textbf{x}_1-\textbf{x}_2)) - f(\textbf{x}_2)}{\alpha (\textbf{x}_1-\textbf{x}_2)}(\textbf{x}_1-\textbf{x}_2) \\ f(\textbf{x}_1) &\ge f(\textbf{x}_2) + \nabla f(\textbf{x}_2)^T(\textbf{x}_1-\textbf{x}_2)\end{aligned}
2가 성립할 경우, 항상 1이 성립하는지에 대한 증명 : 1\leftarrow 2.
모든 \textbf{x}_1, \textbf{x}_2 \in \text{dom }f에 대해 f(\textbf{x}_1) \ge f(\textbf{x}_2) + \nabla f(\textbf{x}_2)^T(\textbf{x}_1-\textbf{x}_2) 가 성립하면서, [0,1]에 속하는 real number \alpha에 대해 \textbf{x}_3 = \alpha \textbf{x}_1+(1-\alpha)\textbf{x}_2라고 정의하면, convex set의 정의에 의해 \textbf{x}_3 \in \text{dom }f이며, 다음이 성립함.
f(\textbf{x}_1) \ge f(\textbf{x}_3) +\nabla f(\textbf{x}_3)^T (\textbf{x}_1-\textbf{x}_3) \\ f(\textbf{x}_2) \ge f(\textbf{x}_3) +\nabla f(\textbf{x}_3)^T (\textbf{x}_2-\textbf{x}_3)
위의 식에 \alpha와 1-\alpha를 곱하고 이 두 식을 더해주면 다음이 성립함.
\begin{aligned} \alpha f(\textbf{x}_1) + (1-\alpha) f (\textbf{x}_2) \ge &\alpha f(\textbf{x}_3) + \alpha \nabla f(\textbf{x}_3)^T (\textbf{x}_1-\textbf{x}_3) \\ &+ (1-\alpha)f(\textbf{x}_3) + (1-\alpha)\nabla f(\textbf{x}_3)^T (\textbf{x}_2-\textbf{x}_3) \\ \end{aligned}
위의 식의 right side는 다음과 같음.
\begin{aligned} \alpha f(\textbf{x}_3) + \alpha \nabla f(\textbf{x}_3)^T (\textbf{x}_1-\textbf{x}_3) + (1-\alpha)f(\textbf{x}_3) + (1-\alpha)\nabla f(\textbf{x}_3)^T (\textbf{x}_2-\textbf{x}_3) &= (\alpha +1 -\alpha)f(\textbf{x}_3) + \nabla f(\textbf{x}_3)^T (\alpha(\textbf{x}_1-\textbf{x}_3)+(1-\alpha)(\textbf{x}_2-\textbf{x}_3)) \\ &=f(\textbf{x}_3) +\nabla f(\textbf{x}_3)^T (\alpha \textbf{x}_1 +(1-\alpha) \textbf{x}_2 - \textbf{x}_3) \\ &= f(\textbf{x}_3) \\ &= f(\alpha \textbf{x}_1 +(1-\alpha) \textbf{x}_2) \end{aligned}
즉, 다음이 성립함.
\alpha f(\textbf{x}_1) + (1-\alpha) f (\textbf{x}_1) \ge f(\alpha \textbf{x}_1 +(1-\alpha) \textbf{x}_2)
위의 식은 f가 convex function임을 의미한다. 즉, sufficient condition이 성립.
비슷한 Theorem (Jensen's inequality)으로, 임의의 \textbf{x}_1, \textbf{x}_2 \in \text{dom }f이고 [0,1]인 \alpha에 대해 다음의 부등식이 성립한다.
f(\alpha\textbf{x}_1+(1-\alpha)\textbf{x}_2) \le \alpha f(\textbf{x}_1) + (1-\alpha)f (\textbf{x}_2)
- left side는 \textbf{x}_1,\textbf{x}_2사이에 존재하는 \alpha\textbf{x}_1+(1-\alpha)\textbf{x}_2에서의 실제 convex function f의 함수값.
- right side는 \alpha\textbf{x}_1+(1-\alpha)\textbf{x}_2의 함수값을 \textbf{x}_1,\textbf{x}_2에서의 함수값들을 bilinear interpolation을 하여 구한 것임
- convex이므로 bilinear interpolation한 값이 항상 커야함.

'... > Math' 카테고리의 다른 글
[Math] Stationary point (or Critical point) (0) | 2023.07.10 |
---|---|
[Math] Second Order Condition : Convexity (0) | 2023.07.10 |
[Math] Linear Programming and Quadratic Programming (0) | 2023.07.08 |
[Math] A regular point of the feasible set. (0) | 2023.07.07 |
[Math] Duality (쌍대성) 이란 : Optimization에서 (0) | 2023.07.07 |