import numpy as np
N = 1000
theta = 2.0
eps = np.random.randn(N)
x = theta + eps

grad1 = lambda x: np.sum(np.square(x)*(x-theta)) / x.size
grad2 = lambda eps: np.sum(2*(theta + eps)) / x.size

print(grad1(x))
print(grad2(eps))

4.123032608893911
4.0690527003813735

Ns = [10, 100, 1000, 10000, 100000]
reps = 100

means1 = np.zeros(len(Ns))
vars1 = np.zeros(len(Ns))
means2 = np.zeros(len(Ns))
vars2 = np.zeros(len(Ns))

est1 = np.zeros(reps)
est2 = np.zeros(reps)
for i, N in enumerate(Ns):
    for r in range(reps):
        x = np.random.randn(N) + theta
        est1[r] = grad1(x)
        eps = np.random.randn(N)
        est2[r] = grad2(eps)
    means1[i] = np.mean(est1)
    means2[i] = np.mean(est2)
    vars1[i] = np.var(est1)
    vars2[i] = np.var(est2)
    
print(means1)
print(means2)
print('\n')
print(vars1)
print(vars2)

[4.17122868 3.87558084 4.01226787 4.00891375 3.99965225]
[4.07831224 4.00082622 4.0002942  4.00003672 3.9999935 ]


[9.00639146e+00 8.62340828e-01 7.14688062e-02 8.08338655e-03
 9.57645160e-04]
[4.01040381e-01 4.23572088e-02 4.16290247e-03 4.51501426e-04
 4.45516975e-05]

import matplotlib.pyplot as plt

plt.plot(Ns, vars1)
plt.plot(Ns, vars2)
plt.legend(['no rt', 'rt'])
plt.xlabel('Sample Size')
plt.xscale('log')
plt.ylabel('Gradient Variance')

Text(0, 0.5, 'Gradient Variance')

重参化(Reparameterization)的作用¶