イェンゼンの不等式の3通りの証明

イェンゼンの不等式(Jensen's inequality,凸不等式)

f(x)f(x) が凸関数のとき,

  • 任意の x1,,xnx_1,\dots,x_n
  • λi0,i=1nλi=1\lambda_i\geqq 0,\displaystyle\sum_{i=1}^n\lambda_i=1 を満たす任意の λ1,,λn\lambda_1,\dots,\lambda_n

に対して, i=1nλif(xi)f(i=1nλixi) \sum_{i=1}^{n} \lambda_{i} f(x_{i}) \geqq f \left( \sum_{i=1}^{n} \lambda_i x_i \right) が成立する。

イェンゼンの不等式はいろいろな場面で役に立つ不等式です。

具体例

「凸関数」の意味やイェンゼンの不等式の証明は後述します。まずは具体例を紹介します。

特に n=2,3n=2, 3 の場合が頻繁に用いられます。

  • n=2n=2 の場合:λ1,λ20,λ1+λ2=1\lambda_1,\lambda_2\geqq 0, \lambda_1+\lambda_2=1 のとき
    λ1f(x1)+λ2f(x2)f(λ1x1+λ2x2)\lambda_1f(x_1)+\lambda_2f(x_2)\geqq f(\lambda_1x_1+\lambda_2x_2)

    • 例えば,f(x)=exf(x)=e^x は凸関数なので,
      λ1ex1+λ2ex2eλ1x1+λ2x2\lambda_1 e^{x_1}+\lambda_2 e^{x_2}\geqq e^{\lambda_1x_1+\lambda_2x_2}
      この不等式はヤングの不等式の証明で活躍します。
  • n=3n=3 の場合:λ1,λ2,λ30,λ1+λ2+λ3=1\lambda_1,\lambda_2, \lambda_3\geqq 0,\lambda_1+\lambda_2+\lambda_3=1 のとき
    λ1f(x1)+λ2f(x2)+λ3f(x3)f(λ1x1+λ2x2+λ3x3)\lambda_1f(x_1)+\lambda_2f(x_2)+\lambda_3f(x_3)\geqq f(\lambda_1x_1+\lambda_2x_2+\lambda_3x_3)

    • 例えば,f(x)=11xf(x)=\dfrac{1}{1-x}0<x<10<x<1 で凸関数なので,
      11x1+11x2+11x331x1+x2+x33\dfrac{1}{1-x_1}+\dfrac{1}{1-x_2}+\dfrac{1}{1-x_3}\geqq\dfrac{3}{1-\frac{x_1+x_2+x_3}{3}}
      この不等式はNesbittの不等式の証明で活躍します。

イェンゼンの不等式の意味

まずは準備として「凸関数」について説明します。

f(x)f(x) が凸関数である」というのは f(x)f(x) が以下の3つの性質のいずれかを満たすことを言います。

凸関数とは
  • 性質1:任意の x1,x2,λ(0λ1)x_1, x_2, \lambda \:(0\leq \lambda\leq 1) に対して,λf(x1)+(1λ)f(x2)f(λx1+(1λ)x2)\lambda f(x_1)+(1-\lambda)f(x_2)\geqq f(\lambda x_1+(1-\lambda)x_2) を満たす。

  • 性質2:任意の x1,x2x_1, x_2 に対して,2点 (x1,f(x1)),(x2,f(x2))(x_1, f(x_1)), (x_2, f(x_2)) を結ぶ線分が関数の上側にある(図参照)。 凸関数の定義

  • 性質3:二階微分 f(x)f^{\prime\prime} (x) が存在して0以上である。

二階微分が存在するなら以上の 3つの性質は同値で,1つ成立すれば凸関数であると言えます(二階微分が存在しないときは性質1と性質2のみが同値)。

性質1が最も基本的で,凸関数の性質を議論する際に用いられます。性質2により凸関数をイメージできます。性質3は実際に関数が凸関数かどうかを判断する基準として用いられます。

イェンゼンの不等式は,線分(凸包)が関数の上側にあるという性質を一般的な数式で表したものです。 n=3n=3 の場合を図に示します。

イェンゼンの不等式

青い点 \geqq 赤い点という図形的性質を不等式で表すとイェンゼンの不等式になります。

イェンゼンの不等式の証明1(数学的帰納法)

有名な証明方法です。

帰納法と性質1の不等式のみを用いて証明します。

証明

n=2n=2 のイェンゼンの不等式は性質1そのものである。

n=kn=k のときイェンゼンの不等式が成立すると仮定して,n=k+1n=k+1 のときを示す。n=k+1n=k+1 の場合のイェンゼンの不等式の左辺を変形していく。

i=1k+1λif(xi)=i=1kλif(xi)+λk+1f(xk+1)=Ai=1kλiAf(xi)+λk+1f(xk+1)\begin{aligned} \sum_{i=1}^{k+1}\lambda_i f(x_i) &= \sum_{i=1}^{k}\lambda_i f(x_i) + \lambda_{k+1}f(x_{k+1})\\ &=A \sum_{i=1}^{k}\dfrac{\lambda_i}{A}f(x_i) +\lambda_{k+1}f(x_{k+1}) \end{aligned}

ただし,A=i=1kλiA=\displaystyle\sum_{i=1}^{k}\lambda_i とおいた。ここで, i=1kλiA=1\displaystyle\sum_{i=1}^{k}\dfrac{\lambda_i}{A}=1 と帰納法の仮定より,

Ai=1kλiAf(xi)+λk+1f(xk+1)Af(i=1kλixiA)+λk+1f(xk+1) A \sum_{i=1}^{k}\dfrac{\lambda_i}{A}f(x_i) +\lambda_{k+1}f(x_{k+1}) \geqq A f \left( \sum_{i=1}^{k}\dfrac{\lambda_i x_i}{A} \right) +\lambda_{k+1}f(x_{k+1})

となる。さらに,A+λk+1=1A+\lambda_{k+1}=1 と性質1より Af(i=1kλixiA)+λk+1f(xk+1)f(i=1k+1λixi) A f \left( \sum_{i=1}^{k}\dfrac{\lambda_i x_i}{A} \right) +\lambda_{k+1}f(x_{k+1}) \geqq f \left(\sum_{i=1}^{k+1}\lambda_i x_i\right)

となり示された。

イェンゼンの不等式の証明2(接線)

イェンゼンの不等式の証明

凸関数の接線が関数の下側にあるというのは,厳密には証明する必要がありますが,直感的に明らかなのでここでは認めてしまいます。

証明

(i=1nλixi,f(i=1nλixi))(\sum_{i=1}^n\lambda_ix_i,f(\sum_{i=1}^n\lambda_ix_i)) における f(x)f(x) の接線の方程式を y=ax+by=ax+b とおくと, f(i=1nλixi)=a(i=1nλixi)+b(1) f \left( \sum_{i=1}^n\lambda_i x_i \right) =a \left( \sum_{i=1}^n\lambda_i x_i \right) +b \quad\cdots \cdots(1) である。

また,凸関数なので接線は関数の下側にあるので,

f(xi)axi+b(i=1,2,,n)f(x_i)\geqq ax_i+b \quad (i=1,2,\cdots,n)

この各式を λi\lambda_i 倍して i=1i=1 から nn まで加える。

i=1nλif(xi)ai=1nλixi+(i=1nλi)b=a(i=1nλixi)+b\begin{aligned} \sum_{i=1}^n\lambda_if(x_i) &\geqq a\sum_{i=1}^n\lambda_ix_i+\left( \sum_{i=1}^n\lambda_i \right) b\\ &=a \left( \sum_{i=1}^n\lambda_i x_i \right)+b \end{aligned}

この不等式と (1)(1) からイェンゼンの不等式が示された。

イェンゼンの不等式の証明3(直感)

イェンゼンの不等式

1.凸包(図で緑色で表した図形)が関数より上側にあること

2.青い点 (i=1nλixi,i=1nλif(xi))({\displaystyle\sum_{i=1}^{n}\lambda_ix_i}, {\displaystyle\sum_{i=1}^{n}\lambda_if(x_i)}) が凸包に含まれること

より,証明されます。1は直感的に明らかです。2も直感的に正しそうですが,それでは証明にならないので一応示しておきます。

証明

まず,(λ1x1+λ2x2λ1+λ2,λ1f(x1)+λ2f(x2)λ1+λ2)\left(\dfrac{\lambda_1x_1+\lambda_2x_2}{\lambda_1+\lambda_2}, \dfrac{\lambda_1f(x_1)+\lambda_2f(x_2)}{\lambda_1+\lambda_2}\right) は点 (x1,f(x1))(x_1,f(x_1)) と点 (x2,f(x2))(x_2,f(x_2))λ2:λ1\lambda_2:\lambda_1 に内分する点なので,凸包に含まれる。

よって,(λ1x1+λ2x2λ1+λ2(λ1+λ2)+λ3x3λ1+λ2+λ3,λ1f(x1)+λ2f(x2)λ1+λ2(λ1+λ2)+λ3f(x3)λ1+λ2+λ3)\left(\dfrac{\tfrac{\lambda_1x_1+\lambda_2x_2}{\lambda_1+\lambda_2}(\lambda_1+\lambda_2)+\lambda_3x_3}{\lambda_1+\lambda_2+\lambda_3},\dfrac{\tfrac{\lambda_1f(x_1)+\lambda_2f(x_2)}{\lambda_1+\lambda_2}(\lambda_1+\lambda_2)+\lambda_3f(x_3)}{\lambda_1+\lambda_2+\lambda_3}\right)

は点 (λ1x1+λ2x2λ1+λ2,λ1f(x1)+λ2f(x2)λ1+λ2)\left(\dfrac{\lambda_1x_1+\lambda_2x_2}{\lambda_1+\lambda_2}, \dfrac{\lambda_1f(x_1)+\lambda_2f(x_2)}{\lambda_1+\lambda_2}\right) と点 (x3,f(x3))(x_3,f(x_3))λ3:λ1+λ2\lambda_3:\lambda_1+\lambda_2 に内分する点なので,凸包に含まれる。

つまり,

(λ1x1+λ2x2+λ3x3λ1+λ2+λ3,λ1f(x1)+λ2f(x2)+λ3f(x3)λ1+λ2+λ3)\left(\dfrac{\lambda_1x_1+\lambda_2x_2+\lambda_3x_3}{\lambda_1+\lambda_2+\lambda_3}, \dfrac{\lambda_1f(x_1)+\lambda_2f(x_2)+\lambda_3f(x_3)}{\lambda_1+\lambda_2+\lambda_3}\right) も凸包に含まれる。

以下同様にして,

(i=1nλixii=1nλi,i=1nλif(xi)i=1nλi)\left(\dfrac{\sum_{i=1}^n\lambda_ix_i}{\sum_{i=1}^n\lambda_i},\dfrac{\sum_{i=1}^n\lambda_if(x_i)}{\sum_{i=1}^n\lambda_i}\right) も凸包に含まれることが分かるが,i=1nλi=1\displaystyle\sum_{i=1}^n\lambda_i=1 よりイェンゼンの不等式は示された。

積分版

実はイェンゼンの不等式には積分版もあります。

イェンゼンの不等式(積分版)

f(x)f(x) が凸関数のとき,区間 [a,b][a,b] において,

  • abg(x)dx<\displaystyle \int_a^b g(x) dx < \infty を満たす任意の関数 g(x)g(x)
  • abp(x)dx=1\displaystyle \int_a^b p(x) dx = 1 を満たす任意の関数 p(x)p(x)

に対して, abf(g(x))p(x)dxf(abg(x)p(x)dx) \int_a^b f(g(x)) p(x) dx \geqq f \left( \int_a^b g(x) p(x) dx \right) が成立する。

a=a = - \inftyb=b = \infty のときも OK

特に有界区間では p(x)=1bap(x) = \dfrac{1}{b-a} とできるため, 1baabf(g(x))dxf(1baabg(x)dx) \dfrac{1}{b-a} \int_a^b f(g(x)) dx \geqq f \left( \dfrac{1}{b-a} \int_a^b g(x) dx \right) が成立します。

証明のスケッチ

α=abg(x)p(x)dx\displaystyle \alpha = \int_a^b g(x) p(x) dx とおく。

x=αx = \alpha での y=f(x)y = f(x) の接線を ll とおく。凸性より lly=f(x)y = f(x) より下にある。

つまり, f(x)f(α)(xα)+f(α) f(x) \geqq f'(\alpha) (x-\alpha) + f(\alpha) となる。x=g(t)x = g(t) を代入し,辺々に p(t)p(t) を掛けると f(g(t))p(t)f(α)(g(t)α)p(t)+f(α)p(t) f(g(t)) p(t) \geqq f'(\alpha) (g(t)-\alpha) p(t) + f(\alpha) p(t) となる。

辺々を [a,b][a,b] で積分すると abf(g(t))p(t)dtf(a)(abg(t)p(t)dtα)+f(α)f(abg(x)p(x)dx)\begin{aligned} &\int_a^b f(g(t)) p(t) dt\\ &\geqq f'(a) \left( \int_a^b g(t) p(t) dt - \alpha \right) + f(\alpha)\\ &\geqq f \left( \int_a^b g(x) p(x) dx \right) \end{aligned} となる。(abp(t)dt=1 に注意)\displaystyle \left( \int_a^b p(t) dt = 1 \ \text{に注意} \right)

補足:「上に凸」と「下に凸」

  • 今回紹介した「線分 \geqq 関数値」を満たす凸関数のことを下に凸な関数と言うこともあります。

  • 逆に,「線分 \leqq 関数値」を満たす関数のことを上に凸な関数と言うことがあります。

  • f(x)f(x)上に凸なら f(x)-f(x)下に凸です。

  • よって,上に凸な関数 g(x)g(x) についてはイェンゼンの不等式の不等号を逆向きにしたものが成立します:
    i=1nλig(xi)g(i=1nλixi) \sum_{i=1}^{n} \lambda_{i} g(x_{i}) \leqq g \left( \sum_{i=1}^{n} \lambda_i x_i \right)

参考:上に凸,下に凸な関数と二階微分

この記事ではイェンゼンと書きましたが,イェンセンの不等式やジェンセンの不等式という表記も見ます。

Tag:数学的帰納法をわかりやすく【例題3問、応用5パターン】

Tag:数学オリンピック突破のための有名不等式まとめ

Tag:有名な定理を複数の方法で証明