凸性の弦定義はグローバルな条件だ:すべての凸結合における関数値を対応する弦の高さと比較しなければならない。あらゆる点の組についてこれを確認するのは非現実的だ。微分可能性は凸性をローカルな条件に変える:各点での f′ または f′′ に関する一つの不等式が、無限個の弦の比較に取って代わる。
条件 1:f′ の単調性による凸性
定理。 f を開区間 I 上で微分可能とする。f が I 上で凸であることと、f′ が I 上で単調非減少であることは同値だ。
証明(⇒):凸 ⇒ f′ 非減少
f が I 上で凸であると仮定する。I 内の x1<x2 をとり、f′(x1)≤f′(x2) を示すことが目標だ。
凸性のチェックポイントから、同値な割線傾斜の特徴付けを思い出す:I 内の任意の a<b<c に対して
b−af(b)−f(a)≤c−bf(c)−f(b).(1)
(1) を a=x1、b=x2、c=x2+h(小さい h>0)で適用する:
x2−x1f(x2)−f(x1)≤hf(x2+h)−f(x2).
右辺で h→0+ とすると f′(x2) が得られる。
(1) を再び a=x1、b=x1+h、c=x2(小さい h>0)で適用する:
hf(x1+h)−f(x1)≤x2−x1−hf(x2)−f(x1+h).
左辺で h→0+ とすると f′(x1) が得られ、右辺は x2−x1f(x2)−f(x1) に収束する。
つなぎ合わせると:
f′(x1)≤x2−x1f(x2)−f(x1)≤f′(x2).
よって f′(x1)≤f′(x2)。□
証明(⇐):f′ 非減少 ⇒ 凸
f′ が I 上で非減少であると仮定する。I 内の x<y と λ∈(0,1) をとり、z:=λx+(1−λ)y と置く(x<z<y)。
z−x=(1−λ)(y−x) かつ y−z=λ(y−x) であることに注意する。
平均値の定理より:
f(z)−f(x)=f′(c1)(z−x)ある c1∈(x,z) に対して、
f(y)−f(z)=f′(c2)(y−z)ある c2∈(z,y) に対して。
c1<z<c2 かつ f′ が非減少なので、f′(c1)≤f′(c2) だ。したがって:
z−xf(z)−f(x)=f′(c1)≤f′(c2)=y−zf(y)−f(z).
z−x=(1−λ)(y−x) および y−z=λ(y−x) を代入する:
1−λf(z)−f(x)≤λf(y)−f(z).
λ(1−λ)>0 を両辺に掛けると:
λ(f(z)−f(x))≤(1−λ)(f(y)−f(z)).
整理すると:
λf(z)−λf(x)≤(1−λ)f(y)−(1−λ)f(z),
f(z)≤λf(x)+(1−λ)f(y).□
これはまさに弦の不等式なので、f は凸だ。
条件 2:第二導関数による凸性
定理。 f∈C2(I) とする。f が I 上で凸であることと、全ての x∈I に対して f′′(x)≥0 であることは同値だ。
証明。 条件 1 より、f が I 上で凸であることと f′ が I 上で非減少であることは同値だ。f′ に単調性テストを適用すると、f′ が I 上で非減少であることと (f′)′=f′′≥0(I 上)は同値だ。二つの同値をつなぎ合わせると結論が得られる。□
狭義凸性
系。 全ての x∈I に対して f′′(x)>0 ならば、f は I 上で狭義凸(strictly convex)だ。
証明。 f′′ が厳密に正であることは、f′ が狭義単調増加であることを意味する(単調性テスト、場合 1)。上の(⇐)の証明において、c1<c2 ならば f′(c1)<f′(c2) が強制されるため、連鎖する不等式がすべて狭義になり、狭義凸性が得られる。□
逆は成り立たない:f(x)=x4 は f′′(0)=0 を満たすが狭義凸だ——f′′>0 が至るところで成立することは狭義凸性の十分条件だが必要条件ではない。
凸関数の見分け方
第二導関数テストにより、凸性は符号の確認の問題になる:
| 関数 | 定義域 | f′′ | 凸? |
|---|
| x2 | R | 2>0 | 狭義凸 |
| x4 | R | 12x2≥0 | 狭義凸(上記注参照) |
| ex | R | ex>0 | 狭義凸 |
| −lnx | (0,∞) | 1/x2>0 | 狭義凸 |
| lnx | (0,∞) | −1/x2<0 | 狭義凹 |
| x3 | R | 6x(符号が変わる) | 凸でも凹でもない |
f(x)=x3 について:f′′(x)>0((0,∞) 上)かつ f′′(x)<0((−∞,0) 上)なので、f は (0,∞) 上で凸、(−∞,0) 上で凹だが、R 全体では凸でない。
まとめ
- 条件 1:I 上で微分可能な f は凸 ⟺ f′ が I 上で非減少。
- (⇒):凸関数の割線傾斜特性により f′(x1)≤f′(x2) が挟み撃ちで得られる。
- (⇐):平均値の定理により c1<c2 で f′(c1)≤f′(c2) が得られ、代数的に弦の不等式が従う。
- 条件 2:f∈C2(I) は凸 ⟺ I 上で f′′≥0(条件 1 と f′ への単調性テストを組み合わせる)。
- 狭義凸性:至るところ f′′>0 ⇒ 狭義凸;逆は孤立点で成立しない場合がある。
- 凸性を実際に確認するには:f′′ を計算し、対象の区間での符号を調べる。