Index

B | C | D | E | F | G | K | L | M | N | O | P | R | S | T | U | V

B

C

ConjugateGradientOptimizer (class in meta_policy_search.optimizers)

constraint_val() (meta_policy_search.optimizers.ConjugateGradientOptimizer method)

D

E

entropy() (meta_policy_search.policies.distributions.base.Distribution method)
- (meta_policy_search.policies.distributions.diagonal_gaussian.DiagonalGaussian method)

entropy_sym() (meta_policy_search.policies.distributions.base.Distribution method)
- (meta_policy_search.policies.distributions.diagonal_gaussian.DiagonalGaussian method)

F

fit() (meta_policy_search.baselines.Baseline method)
- (meta_policy_search.baselines.LinearFeatureBaseline method)
- (meta_policy_search.baselines.LinearTimeBaseline method)

G

K

kl() (meta_policy_search.policies.distributions.base.Distribution method)
- (meta_policy_search.policies.distributions.diagonal_gaussian.DiagonalGaussian method)

kl_sym() (meta_policy_search.policies.distributions.base.Distribution method)
- (meta_policy_search.policies.distributions.diagonal_gaussian.DiagonalGaussian method)

L

M

N

num_envs (meta_policy_search.samplers.vectorized_env_executor.MetaIterativeEnvExecutor attribute)
- (meta_policy_search.samplers.vectorized_env_executor.MetaParallelEnvExecutor attribute)

O

optimize_policy() (meta_policy_search.meta_algos.MAMLAlgo method)

P

R

reset() (meta_policy_search.samplers.vectorized_env_executor.MetaIterativeEnvExecutor method)
- (meta_policy_search.samplers.vectorized_env_executor.MetaParallelEnvExecutor method)

S

T

train() (meta_policy_search.meta_trainer.Trainer method)

U

update_task_parameters() (meta_policy_search.policies.MetaGaussianMLPPolicy method)
- (meta_policy_search.policies.MetaPolicy method)

update_tasks() (meta_policy_search.samplers.MetaSampler method)

V

VPGMAML (class in meta_policy_search.meta_algos)