解析や確率論における多くの不等式は、ひとつの幾何的な観察に帰着する:「お椀型」の関数において、グラフ上の2点を結ぶ直線はグラフの下に潜ることはない。その観察を形式化したものが凸関数(convex function)の概念だ。
弦条件
I⊆R を区間、f:I→R とする。
定義。 任意の x,y∈I と任意の λ∈[0,1] に対して
f(λx+(1−λ)y)≤λf(x)+(1−λ)f(y)(1)
が成り立つとき、f は I 上で凸であるという。
点 λx+(1−λ)y は x と y の**凸結合(convex combination)であり、λ が [0,1] を動くにつれ、y から x へ向かう線分を描く。右辺 λf(x)+(1−λ)f(y) は (x,f(x)) から (y,f(y)) への弦(chord)**上の対応点だ。
言い換えると:f のグラフはすべての弦と同じ高さか、それより下にある。
狭義凸性
定義。 x=y かつ λ∈(0,1) のとき不等式 (1) が狭義(strict)になる場合、すなわち
f(λx+(1−λ)y)<λf(x)+(1−λ)f(y)
が成り立つとき、f は I 上で狭義凸であるという。
狭義凸性は、グラフの任意の部分が弦上に完全に乗る(flat になる)ことを排除する。狭義凸な関数はすべて凸だが、逆は成り立たない(恒等関数 f(x)=x は凸だが狭義凸ではない)。
凹性
−f が(狭義に)凸であるとき、f は**(狭義に)凹(concave)**であるという。つまり (1) の不等号が逆向きになる。凹関数は「山型」であり、すべての弦はグラフと同じ高さか、それより下にある。
例
| 関数 | 定義域 | 凸か | 狭義か |
|---|
| x2 | R | はい | はい |
| ex | R | はい | はい |
| ∥x∥ | R | はい | いいえ(−a から a への弦上の x=0 でフラット) |
| lnx | (0,∞) | いいえ(凹) | — |
| −x2 | R | いいえ(凹) | — |
| c(定数) | R | はい | いいえ |
x2 の検証。 λ∈[0,1]、x,y∈R に対して:
(λx+(1−λ)y)2≤λx2+(1−λ)y2
は λ(1−λ)(x−y)2≥0 と同値であり、これはすべての λ∈[0,1] で成立し、x=y かつ λ∈(0,1) のとき狭義になる。よって x2 は狭義凸だ。
等価な二点形式
(1) を t=λ と置いて整理すると、凸性は次のようにも読める:I 内の任意の3点 x<z<y に対して、
z−xf(z)−f(x)≤y−xf(y)−f(x)≤y−zf(y)−f(z).
各分数は割線(secant)の傾きであるから、これは「固定した左端からの割線の傾きは、右端を右に動かすにつれて単調非減少である」ことを述べている。この単調傾き性は (1) と完全に同値であり、グラフから凸性を確認する最も手軽な方法であることが多い。
まとめ
- f が I 上で凸であるとは、(x,f(x)) から (y,f(y)) へのすべての弦がグラフと同じ高さかそれより上にあること、すなわちすべての x,y∈I、λ∈[0,1] に対して f(λx+(1−λ)y)≤λf(x)+(1−λ)f(y) が成り立つことだ。
- 狭義凸性は x=y かつ λ∈(0,1) のとき狭義の不等号を要求する。
- 凹性は不等号を逆転させる。f が凹であることと −f が凸であることは同値だ。
- 標準的な例:x2 と ex は狭義凸、lnx は狭義凹だ。