[Math] First Order Condition : Convexity

2023. 7. 10. 08:34·.../Math
728x90
728x90

domain의 convex set인 function $f:\mathbb{R}^n\to\mathbb{R}$가 convex function임을 보이기 위한 조건.

Theorem

Vector space $\mathbb{R}^n$에서 정의된 function $f:\mathbb{R}^n\to\mathbb{R}$가 differentiable 일 경우, 다음 두 조건이 necessary and sufficient condition임.

  1. function $f$는 convex function임.
  2. domain $\text{dom }f$는 convex set이고, 임의의 $\textbf{x}_1, \textbf{x}_2 \in \text{dom }f$에 대해 다음이 성립.

$$f(\textbf{x}_1) \ge f(\textbf{x}_2) + \nabla f(\textbf{x}_2)^T(\textbf{x}_1-\textbf{x}_2)$$

 


증명

1이 성립할 경우, 항상 2가 성립하는지에 대한 증명 : $1\rightarrow 2$.

$q(\alpha)=f(\textbf{x}_2+\alpha(\textbf{x}_1-\textbf{x}_2))$라면 다음이 성립함.

$$\lim_{\alpha \to 0}\dfrac{ f(\textbf{x}_2+\alpha (\textbf{x}_1-\textbf{x}_2)) -f(\textbf{x}_2)}{\alpha}=\lim_{\alpha\to 0}\frac{q(\alpha)-q(0)}{\alpha}=q^\prime(0)$$

chain rule에 의해 $q^\prime(\alpha)=\nabla f(\textbf{x}_2 +\alpha(\textbf{x}_1-\textbf{x}_2))^T(\textbf{x}_1-\textbf{x}_2)$이 성립하므로, $g^\prime(0)=\nabla f(\textbf{x}_2)^T(\textbf{x}_1-\textbf{x}_2)$ 임.

$f(\textbf{x}_2 + \alpha (\textbf{x}_1-\textbf{x}_2))$는 다음이 성립함.

$$f(\textbf{x}_2 +\alpha (\textbf{x}_1 - \textbf{x}_2)) = f(\alpha \textbf{x_1} + (1-\alpha)\textbf{x}_2)$$

$f$가 convex function일 경우 다음이 성립.

$$f(\alpha \textbf{x}_1 +(1-\alpha)\textbf{x}_2) \le \alpha f(\textbf{x}_1) + (1-\alpha) f(\textbf{x}_2)$$

위의 식은 다음이 성립함.

$$\begin{aligned}f(\alpha \textbf{x}_1 +(1-\alpha)\textbf{x}_2) &\le \alpha f(\textbf{x}_1) + (1-\alpha) f(\textbf{x}_2)\\ \frac{f(\alpha \textbf{x}_1 +(1-\alpha)\textbf{x}_2)}{\alpha} &\le f(\textbf{x}_1) + \frac{1}{\alpha}f(\textbf{x}_2) - f(\textbf{x}_2)\\ \frac{f(\alpha \textbf{x}_1 +(1-\alpha)\textbf{x}_2) - f(\textbf{x}_2)}{\alpha} &\le f(\textbf{x}_1)- f(\textbf{x}_2) \\ f(\textbf{x}_2) +\frac{f(\alpha \textbf{x}_1 +(1-\alpha)\textbf{x}_2) - f(\textbf{x}_2)}{\alpha} &\le f(\textbf{x}_1)\\ f(\textbf{x}_1) &\ge f(\textbf{x}_2) +\frac{f(\textbf{x}_2+\alpha(\textbf{x}_1-\textbf{x}_2)) - f(\textbf{x}_2)}{\alpha} \end{aligned}$$

여기에 $\displaystyle \lim_{\alpha \to 0}$를 양 side에 취하면,

$$\begin{aligned} \lim_{\alpha \to 0} f(\textbf{x}_1) &\ge \lim_{\alpha \to 0}f(\textbf{x}_2) +\lim_{\alpha \to 0}\frac{f(\textbf{x}_2+\alpha(\textbf{x}_1-\textbf{x}_2)) - f(\textbf{x}_2)}{\alpha} \\ f(\textbf{x}_1) &\ge f(\textbf{x}_2)+\lim_{\alpha \to 0}\frac{f(\textbf{x}_2+\alpha(\textbf{x}_1-\textbf{x}_2)) - f(\textbf{x}_2)}{\alpha} \\ f(\textbf{x}_1) &\ge f(\textbf{x}_2)+\lim_{\alpha \to 0}\frac{f(\textbf{x}_2+\alpha(\textbf{x}_1-\textbf{x}_2)) - f(\textbf{x}_2)}{\alpha (\textbf{x}_1-\textbf{x}_2)}(\textbf{x}_1-\textbf{x}_2) \\ f(\textbf{x}_1) &\ge f(\textbf{x}_2) + \nabla f(\textbf{x}_2)^T(\textbf{x}_1-\textbf{x}_2)\end{aligned}$$


2가 성립할 경우, 항상 1이 성립하는지에 대한 증명 : $1\leftarrow 2$.

모든 $\textbf{x}_1, \textbf{x}_2 \in \text{dom }f$에 대해 $f(\textbf{x}_1) \ge f(\textbf{x}_2) + \nabla f(\textbf{x}_2)^T(\textbf{x}_1-\textbf{x}_2)$ 가 성립하면서, $[0,1]$에 속하는 real number $\alpha$에 대해 $\textbf{x}_3 = \alpha \textbf{x}_1+(1-\alpha)\textbf{x}_2$라고 정의하면, convex set의 정의에 의해 $\textbf{x}_3 \in \text{dom }f$이며, 다음이 성립함.

$$f(\textbf{x}_1) \ge f(\textbf{x}_3) +\nabla f(\textbf{x}_3)^T (\textbf{x}_1-\textbf{x}_3) \\ f(\textbf{x}_2) \ge f(\textbf{x}_3) +\nabla f(\textbf{x}_3)^T (\textbf{x}_2-\textbf{x}_3)$$

위의 식에 $\alpha$와 $1-\alpha$를 곱하고 이 두 식을 더해주면 다음이 성립함.

$$\begin{aligned} \alpha f(\textbf{x}_1) + (1-\alpha) f (\textbf{x}_2) \ge &\alpha f(\textbf{x}_3) + \alpha \nabla f(\textbf{x}_3)^T (\textbf{x}_1-\textbf{x}_3) \\ &+ (1-\alpha)f(\textbf{x}_3) + (1-\alpha)\nabla f(\textbf{x}_3)^T (\textbf{x}_2-\textbf{x}_3) \\ \end{aligned}$$

위의 식의 right side는 다음과 같음.

$$\begin{aligned} \alpha f(\textbf{x}_3) + \alpha \nabla f(\textbf{x}_3)^T (\textbf{x}_1-\textbf{x}_3) + (1-\alpha)f(\textbf{x}_3) + (1-\alpha)\nabla f(\textbf{x}_3)^T (\textbf{x}_2-\textbf{x}_3) &= (\alpha +1 -\alpha)f(\textbf{x}_3) + \nabla f(\textbf{x}_3)^T (\alpha(\textbf{x}_1-\textbf{x}_3)+(1-\alpha)(\textbf{x}_2-\textbf{x}_3)) \\ &=f(\textbf{x}_3) +\nabla f(\textbf{x}_3)^T (\alpha \textbf{x}_1 +(1-\alpha) \textbf{x}_2 - \textbf{x}_3) \\ &= f(\textbf{x}_3) \\ &= f(\alpha \textbf{x}_1 +(1-\alpha) \textbf{x}_2) \end{aligned}$$

즉, 다음이 성립함.
$$\alpha f(\textbf{x}_1) + (1-\alpha) f (\textbf{x}_1) \ge f(\alpha \textbf{x}_1 +(1-\alpha) \textbf{x}_2)$$

위의 식은 $f$가 convex function임을 의미한다. 즉, sufficient condition이 성립.

 


비슷한 Theorem (Jensen's inequality)으로, 임의의 $\textbf{x}_1, \textbf{x}_2 \in \text{dom }f$이고 $[0,1]$인 $\alpha$에 대해 다음의 부등식이 성립한다.

$$ f(\alpha\textbf{x}_1+(1-\alpha)\textbf{x}_2) \le \alpha f(\textbf{x}_1) + (1-\alpha)f (\textbf{x}_2)$$

 

  • left side는 $\textbf{x}_1,\textbf{x}_2$사이에 존재하는 $\alpha\textbf{x}_1+(1-\alpha)\textbf{x}_2$에서의 실제 convex function $f$의 함수값.
  • right side는 $\alpha\textbf{x}_1+(1-\alpha)\textbf{x}_2$의 함수값을 $\textbf{x}_1,\textbf{x}_2$에서의 함수값들을 bilinear interpolation을 하여 구한 것임
  • convex이므로 bilinear interpolation한 값이 항상 커야함.

https://web.cs.ucla.edu/~patricia.xiao/files/Winter2020_ReadingGroup_CVXOP.pdf

 

'... > Math' 카테고리의 다른 글

[Math] Stationary point (or Critical point)  (0) 2023.07.10
[Math] Second Order Condition : Convexity  (0) 2023.07.10
[Math] Linear Programming and Quadratic Programming  (0) 2023.07.08
[Math] A regular point of the feasible set.  (0) 2023.07.07
[Math] Duality (쌍대성) 이란 : Optimization에서  (0) 2023.07.07
'.../Math' 카테고리의 다른 글
  • [Math] Stationary point (or Critical point)
  • [Math] Second Order Condition : Convexity
  • [Math] Linear Programming and Quadratic Programming
  • [Math] A regular point of the feasible set.
dsaint31x
dsaint31x
    반응형
    250x250
  • dsaint31x
    Dsaint31's blog
    dsaint31x
  • 전체
    오늘
    어제
    • 분류 전체보기 (739)
      • Private Life (13)
      • Programming (56)
        • DIP (104)
        • ML (26)
      • Computer (119)
        • CE (53)
        • ETC (33)
        • CUDA (3)
        • Blog, Markdown, Latex (4)
        • Linux (9)
      • ... (350)
        • Signals and Systems (103)
        • Math (171)
        • Linear Algebra (33)
        • Physics (42)
        • 인성세미나 (1)
      • 정리필요. (54)
        • 의료기기의 이해 (6)
        • PET, MRI and so on. (1)
        • PET Study 2009 (1)
        • 방사선 장해방호 (4)
        • 방사선 생물학 (3)
        • 방사선 계측 (9)
        • 기타 방사능관련 (3)
        • 고시 (9)
        • 정리 (18)
      • RI (0)
      • 원자력,방사능 관련법 (2)
  • 블로그 메뉴

    • Math
    • Programming
    • SS
    • DIP
  • 링크

    • Convex Optimization For All
  • 공지사항

    • Test
    • PET Study 2009
    • 기타 방사능관련.
  • 인기 글

  • 태그

    Probability
    signals_and_systems
    Convolution
    signal_and_system
    Optimization
    fourier transform
    Term
    Programming
    Vector
    math
    random
    인허가제도
    numpy
    opencv
    linear algebra
    SS
    SIGNAL
    검사
    Python
    function
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.3
dsaint31x
[Math] First Order Condition : Convexity
상단으로

티스토리툴바