凸性の微分条件

Basis
最終更新: タグ: 微積分, 凸関数

凸性の弦定義はグローバルな条件だ:すべての凸結合における関数値を対応する弦の高さと比較しなければならない。あらゆる点の組についてこれを確認するのは非現実的だ。微分可能性は凸性をローカルな条件に変える:各点での ff' または ff'' に関する一つの不等式が、無限個の弦の比較に取って代わる。

条件 1:ff' の単調性による凸性

定理。 ff を開区間 II 上で微分可能とする。ffII 上で凸であることと、ff'II 上で単調非減少であることは同値だ。

証明(\Rightarrow):凸 \Rightarrow ff' 非減少

ffII 上で凸であると仮定する。II 内の x1<x2x_1 < x_2 をとり、f(x1)f(x2)f'(x_1) \leq f'(x_2) を示すことが目標だ。

凸性のチェックポイントから、同値な割線傾斜の特徴付けを思い出す:II 内の任意の a<b<ca < b < c に対して

f(b)f(a)ba    f(c)f(b)cb.(1)\frac{f(b) - f(a)}{b - a} \;\leq\; \frac{f(c) - f(b)}{c - b}. \tag{1}

(1)(1)a=x1a = x_1b=x2b = x_2c=x2+hc = x_2 + h(小さい h>0h > 0)で適用する:

f(x2)f(x1)x2x1    f(x2+h)f(x2)h.\frac{f(x_2) - f(x_1)}{x_2 - x_1} \;\leq\; \frac{f(x_2 + h) - f(x_2)}{h}.

右辺で h0+h \to 0^+ とすると f(x2)f'(x_2) が得られる。

(1)(1) を再び a=x1a = x_1b=x1+hb = x_1 + hc=x2c = x_2(小さい h>0h > 0)で適用する:

f(x1+h)f(x1)h    f(x2)f(x1+h)x2x1h.\frac{f(x_1 + h) - f(x_1)}{h} \;\leq\; \frac{f(x_2) - f(x_1 + h)}{x_2 - x_1 - h}.

左辺で h0+h \to 0^+ とすると f(x1)f'(x_1) が得られ、右辺は f(x2)f(x1)x2x1\dfrac{f(x_2) - f(x_1)}{x_2 - x_1} に収束する。

つなぎ合わせると:

f(x1)    f(x2)f(x1)x2x1    f(x2).f'(x_1) \;\leq\; \frac{f(x_2) - f(x_1)}{x_2 - x_1} \;\leq\; f'(x_2).

よって f(x1)f(x2)f'(x_1) \leq f'(x_2)\square

証明(\Leftarrow):ff' 非減少 \Rightarrow

ff'II 上で非減少であると仮定する。II 内の x<yx < yλ(0,1)\lambda \in (0, 1) をとり、zλx+(1λ)yz \coloneqq \lambda x + (1 - \lambda)y と置く(x<z<yx < z < y)。

zx=(1λ)(yx)z - x = (1-\lambda)(y - x) かつ yz=λ(yx)y - z = \lambda(y - x) であることに注意する。

平均値の定理より:

f(z)f(x)  =  f(c1)(zx)ある c1(x,z) に対して、f(z) - f(x) \;=\; f'(c_1)(z - x) \quad\text{ある } c_1 \in (x, z) \text{ に対して、} f(y)f(z)  =  f(c2)(yz)ある c2(z,y) に対して。f(y) - f(z) \;=\; f'(c_2)(y - z) \quad\text{ある } c_2 \in (z, y) \text{ に対して。}

c1<z<c2c_1 < z < c_2 かつ ff' が非減少なので、f(c1)f(c2)f'(c_1) \leq f'(c_2) だ。したがって:

f(z)f(x)zx  =  f(c1)    f(c2)  =  f(y)f(z)yz.\frac{f(z) - f(x)}{z - x} \;=\; f'(c_1) \;\leq\; f'(c_2) \;=\; \frac{f(y) - f(z)}{y - z}.

zx=(1λ)(yx)z - x = (1-\lambda)(y-x) および yz=λ(yx)y - z = \lambda(y-x) を代入する:

f(z)f(x)1λ    f(y)f(z)λ.\frac{f(z) - f(x)}{1 - \lambda} \;\leq\; \frac{f(y) - f(z)}{\lambda}.

λ(1λ)>0\lambda(1-\lambda) > 0 を両辺に掛けると:

λ(f(z)f(x))    (1λ)(f(y)f(z)).\lambda\bigl(f(z) - f(x)\bigr) \;\leq\; (1-\lambda)\bigl(f(y) - f(z)\bigr).

整理すると:

λf(z)λf(x)    (1λ)f(y)(1λ)f(z),\lambda f(z) - \lambda f(x) \;\leq\; (1-\lambda)f(y) - (1-\lambda)f(z), f(z)    λf(x)+(1λ)f(y).f(z) \;\leq\; \lambda f(x) + (1-\lambda)f(y). \quad \square

これはまさに弦の不等式なので、ff は凸だ。

条件 2:第二導関数による凸性

定理。 fC2(I)f \in C^2(I) とする。ffII 上で凸であることと、全ての xIx \in I に対して f(x)0f''(x) \geq 0 であることは同値だ。

証明。 条件 1 より、ffII 上で凸であることと ff'II 上で非減少であることは同値だ。ff'単調性テストを適用すると、ff'II 上で非減少であることと (f)=f0(f')' = f'' \geq 0II 上)は同値だ。二つの同値をつなぎ合わせると結論が得られる。\square

狭義凸性

系。 全ての xIx \in I に対して f(x)>0f''(x) > 0 ならば、ffII 上で狭義凸(strictly convex)だ。

証明。 ff'' が厳密に正であることは、ff' が狭義単調増加であることを意味する(単調性テスト、場合 1)。上の(\Leftarrow)の証明において、c1<c2c_1 < c_2 ならば f(c1)<f(c2)f'(c_1) < f'(c_2) が強制されるため、連鎖する不等式がすべて狭義になり、狭義凸性が得られる。\square

逆は成り立たない:f(x)=x4f(x) = x^4f(0)=0f''(0) = 0 を満たすが狭義凸だ——f>0f'' > 0 が至るところで成立することは狭義凸性の十分条件だが必要条件ではない。

凸関数の見分け方

第二導関数テストにより、凸性は符号の確認の問題になる:

関数定義域ff''凸?
x2x^2R\mathbb{R}2>02 > 0狭義凸
x4x^4R\mathbb{R}12x2012x^2 \geq 0狭義凸(上記注参照)
exe^xR\mathbb{R}ex>0e^x > 0狭義凸
lnx-\ln x(0,)(0, \infty)1/x2>01/x^2 > 0狭義凸
lnx\ln x(0,)(0, \infty)1/x2<0-1/x^2 < 0狭義凹
x3x^3R\mathbb{R}6x6x(符号が変わる)凸でも凹でもない

f(x)=x3f(x) = x^3 について:f(x)>0f''(x) > 0(0,)(0, \infty) 上)かつ f(x)<0f''(x) < 0(,0)(-\infty, 0) 上)なので、ff(0,)(0, \infty) 上で凸、(,0)(-\infty, 0) 上で凹だが、R\mathbb{R} 全体では凸でない。

まとめ

  • 条件 1II 上で微分可能な ff は凸     \iff ff'II 上で非減少。
    • \Rightarrow):凸関数の割線傾斜特性により f(x1)f(x2)f'(x_1) \leq f'(x_2) が挟み撃ちで得られる。
    • \Leftarrow):平均値の定理により c1<c2c_1 < c_2f(c1)f(c2)f'(c_1) \leq f'(c_2) が得られ、代数的に弦の不等式が従う。
  • 条件 2fC2(I)f \in C^2(I) は凸     \iff II 上で f0f'' \geq 0(条件 1 と ff' への単調性テストを組み合わせる)。
  • 狭義凸性:至るところ f>0f'' > 0 \Rightarrow 狭義凸;逆は孤立点で成立しない場合がある。
  • 凸性を実際に確認するには:ff'' を計算し、対象の区間での符号を調べる。