docs/rol/ROL__KLDivergence_8hpp_source.html

// @HEADER

// *****************************************************************************

//               Rapid Optimization Library (ROL) Package

//

// Copyright 2014 NTESS and the ROL contributors.

// SPDX-License-Identifier: BSD-3-Clause

// *****************************************************************************

// @HEADER


#ifndef ROL_KLDIVERGENCE_HPP

#define ROL_KLDIVERGENCE_HPP


#include "ROL_RandVarFunctional.hpp"


namespace ROL {


template<class Real>


class KLDivergence : public RandVarFunctional<Real> {

private:

  Real eps_;


  Real gval_;

  Real gvval_;

  Real hval_;

  ROL::Ptr<Vector<Real> > scaledGradient_;

  ROL::Ptr<Vector<Real> > scaledHessVec_;


  bool firstResetKLD_;


  using RandVarFunctional<Real>::val_;

  using RandVarFunctional<Real>::gv_;

  using RandVarFunctional<Real>::g_;

  using RandVarFunctional<Real>::hv_;

  using RandVarFunctional<Real>::dualVector_;


  using RandVarFunctional<Real>::point_;

  using RandVarFunctional<Real>::weight_;


  using RandVarFunctional<Real>::computeValue;

  using RandVarFunctional<Real>::computeGradient;

  using RandVarFunctional<Real>::computeGradVec;

  using RandVarFunctional<Real>::computeHessVec;


  void checkInputs(void) const {

    Real zero(0);

    ROL_TEST_FOR_EXCEPTION((eps_ <= zero), std::invalid_argument,

      ">>> ERROR (ROL::KLDivergence): Threshold must be positive!");

  }


public:


  KLDivergence(const Real eps = 1.e-2)

    : RandVarFunctional<Real>(), eps_(eps), firstResetKLD_(true) {

    checkInputs();

  }


  KLDivergence(ROL::ParameterList &parlist)

    : RandVarFunctional<Real>(), firstResetKLD_(true) {

    ROL::ParameterList &list

      = parlist.sublist("SOL").sublist("Risk Measure").sublist("KL Divergence");

    eps_ = list.get<Real>("Threshold");

    checkInputs();

  }


  void initialize(const Vector<Real> &x) {

    RandVarFunctional<Real>::initialize(x);

    if ( firstResetKLD_ ) {

      scaledGradient_ = x.dual().clone();

      scaledHessVec_  = x.dual().clone();

      firstResetKLD_ = false;

    }

    const Real zero(0);

    gval_ = zero; gvval_ = zero; hval_ = zero;

    scaledGradient_->zero(); scaledHessVec_->zero();

  }


  void updateValue(Objective<Real>         &obj,

                   const Vector<Real>      &x,

                   const std::vector<Real> &xstat,

                   Real                    &tol) {

    Real val = computeValue(obj,x,tol);

    Real ev  = exponential(val,xstat[0]*eps_);

    val_    += weight_ * ev;

  }


  Real getValue(const Vector<Real>      &x,

                const std::vector<Real> &xstat,

                SampleGenerator<Real>   &sampler) {

    if ( xstat[0] == static_cast<Real>(0) ) {

      return ROL_INF<Real>();

    }

    Real ev(0);

    sampler.sumAll(&val_,&ev,1);

    return (static_cast<Real>(1) + std::log(ev)/eps_)/xstat[0];

  }


  void updateGradient(Objective<Real>         &obj,

                      const Vector<Real>      &x,

                      const std::vector<Real> &xstat,

                      Real                    &tol) {

    Real val = computeValue(obj,x,tol);

    Real ev  = exponential(val,xstat[0]*eps_);

    val_    += weight_ * ev;

    gval_   += weight_ * ev * val;

    computeGradient(*dualVector_,obj,x,tol);

    g_->axpy(weight_*ev,*dualVector_);

  }


  void getGradient(Vector<Real>            &g,

                   std::vector<Real>       &gstat,

                   const Vector<Real>      &x,

                   const std::vector<Real> &xstat,

                   SampleGenerator<Real>   &sampler) {

    std::vector<Real> local(2), global(2);

    local[0] = val_;

    local[1] = gval_;

    sampler.sumAll(&local[0],&global[0],2);

    Real ev = global[0], egval = global[1];


    sampler.sumAll(*g_,g);

    g.scale(static_cast<Real>(1)/ev);


    if ( xstat[0] == static_cast<Real>(0) ) {

      gstat[0] = ROL_INF<Real>();

    }

    else {

      gstat[0] = -((static_cast<Real>(1) + std::log(ev)/eps_)/xstat[0]

                 - egval/ev)/xstat[0];

    }

  }


  void updateHessVec(Objective<Real>         &obj,

                     const Vector<Real>      &v,

                     const std::vector<Real> &vstat,

                     const Vector<Real>      &x,

                     const std::vector<Real> &xstat,

                     Real                    &tol) {

    Real val = computeValue(obj,x,tol);

    Real ev  = exponential(val,xstat[0]*eps_);

    Real gv  = computeGradVec(*dualVector_,obj,v,x,tol);

    val_    += weight_ * ev;

    gv_     += weight_ * ev * gv;

    gval_   += weight_ * ev * val;

    gvval_  += weight_ * ev * val * gv;

    hval_   += weight_ * ev * val * val;

    g_->axpy(weight_*ev,*dualVector_);

    scaledGradient_->axpy(weight_*ev*gv,*dualVector_);

    scaledHessVec_->axpy(weight_*ev*val,*dualVector_);

    computeHessVec(*dualVector_,obj,v,x,tol);

    hv_->axpy(weight_*ev,*dualVector_);

  }


  void getHessVec(Vector<Real>            &hv,

                  std::vector<Real>       &hvstat,

                  const Vector<Real>      &v,

                  const std::vector<Real> &vstat,

                  const Vector<Real>      &x,

                  const std::vector<Real> &xstat,

                  SampleGenerator<Real>   &sampler) {

    std::vector<Real> local(5), global(5);

    local[0] = val_;

    local[1] = gv_;

    local[2] = gval_;

    local[3] = gvval_;

    local[4] = hval_;

    sampler.sumAll(&local[0],&global[0],5);

    Real ev     = global[0], egv   = global[1], egval = global[2];

    Real egvval = global[3], ehval = global[4];

    Real c0 = static_cast<Real>(1)/ev, c1 = c0*egval, c2 = c0*egv, c3 = eps_*c0;


    sampler.sumAll(*hv_,hv);

    dualVector_->zero();

    sampler.sumAll(*scaledGradient_,*dualVector_);

    hv.axpy(xstat[0]*eps_,*dualVector_);

    hv.scale(c0);


    dualVector_->zero();

    sampler.sumAll(*g_,*dualVector_);

    hv.axpy(-c3*(vstat[0]*c1 + xstat[0]*c2),*dualVector_);


    dualVector_->zero();

    sampler.sumAll(*scaledHessVec_,*dualVector_);

    hv.axpy(vstat[0]*c3,*dualVector_);


    if ( xstat[0] == static_cast<Real>(0) ) {

      hvstat[0] = ROL_INF<Real>();

    }

    else {

      Real xstat2 = static_cast<Real>(2)/(xstat[0]*xstat[0]);

      Real h11 = xstat2*((static_cast<Real>(1) + std::log(ev)/eps_)/xstat[0] - c1)

                 + (c3*ehval - eps_*c1*c1)/xstat[0];

      hvstat[0] = vstat[0] * h11 + (c3*egvval - eps_*c1*c2);

    }

  }


private:


  Real exponential(const Real arg1, const Real arg2) const {

    if ( arg1 < arg2 ) {

      return power(exponential(arg1),arg2);

    }

    else {

      return power(exponential(arg2),arg1);

    }

  }


  Real exponential(const Real arg) const {

    if ( arg >= std::log(ROL_INF<Real>()) ) {

      return ROL_INF<Real>();

    }

    else {

      return std::exp(arg);

    }

  }


  Real power(const Real arg, const Real pow) const {

    if ( arg >= std::pow(ROL_INF<Real>(),static_cast<Real>(1)/pow) ) {

      return ROL_INF<Real>();

    }

    else {

      return std::pow(arg,pow);

    }

  }


};


}


#endif

zero
Objective_SerialSimOpt(const Ptr< Obj > &obj, const V &ui) z0_ zero()
Definition ROL_Objective_SerialSimOpt.hpp:77

ROL_RandVarFunctional.hpp

ROL::KLDivergence
Provides an interface for the Kullback-Leibler distributionally robust expectation.
Definition ROL_KLDivergence.hpp:47

ROL::KLDivergence::checkInputs
void checkInputs(void) const
Definition ROL_KLDivergence.hpp:73

ROL::KLDivergence::updateValue
void updateValue(Objective< Real > &obj, const Vector< Real > &x, const std::vector< Real > &xstat, Real &tol)
Update internal storage for value computation.
Definition ROL_KLDivergence.hpp:117

ROL::KLDivergence::gvval_
Real gvval_
Definition ROL_KLDivergence.hpp:52

ROL::KLDivergence::gval_
Real gval_
Definition ROL_KLDivergence.hpp:51

ROL::KLDivergence::getHessVec
void getHessVec(Vector< Real > &hv, std::vector< Real > &hvstat, const Vector< Real > &v, const std::vector< Real > &vstat, const Vector< Real > &x, const std::vector< Real > &xstat, SampleGenerator< Real > &sampler)
Return risk measure Hessian-times-a-vector.
Definition ROL_KLDivergence.hpp:193

ROL::KLDivergence::KLDivergence
KLDivergence(ROL::ParameterList &parlist)
Constructor.
Definition ROL_KLDivergence.hpp:97

ROL::KLDivergence::updateHessVec
void updateHessVec(Objective< Real > &obj, const Vector< Real > &v, const std::vector< Real > &vstat, const Vector< Real > &x, const std::vector< Real > &xstat, Real &tol)
Update internal risk measure storage for Hessian-time-a-vector computation.
Definition ROL_KLDivergence.hpp:172

ROL::KLDivergence::getGradient
void getGradient(Vector< Real > &g, std::vector< Real > &gstat, const Vector< Real > &x, const std::vector< Real > &xstat, SampleGenerator< Real > &sampler)
Return risk measure (sub)gradient.
Definition ROL_KLDivergence.hpp:149

ROL::KLDivergence::getValue
Real getValue(const Vector< Real > &x, const std::vector< Real > &xstat, SampleGenerator< Real > &sampler)
Return risk measure value.
Definition ROL_KLDivergence.hpp:126

ROL::KLDivergence::KLDivergence
KLDivergence(const Real eps=1.e-2)
Constructor.
Definition ROL_KLDivergence.hpp:84

ROL::KLDivergence::hval_
Real hval_
Definition ROL_KLDivergence.hpp:53

ROL::KLDivergence::firstResetKLD_
bool firstResetKLD_
Definition ROL_KLDivergence.hpp:57

ROL::KLDivergence::power
Real power(const Real arg, const Real pow) const
Definition ROL_KLDivergence.hpp:255

ROL::KLDivergence::initialize
void initialize(const Vector< Real > &x)
Initialize temporary variables.
Definition ROL_KLDivergence.hpp:105

ROL::KLDivergence::eps_
Real eps_
Definition ROL_KLDivergence.hpp:49

ROL::KLDivergence::exponential
Real exponential(const Real arg) const
Definition ROL_KLDivergence.hpp:246

ROL::KLDivergence::exponential
Real exponential(const Real arg1, const Real arg2) const
Definition ROL_KLDivergence.hpp:237

ROL::KLDivergence::updateGradient
void updateGradient(Objective< Real > &obj, const Vector< Real > &x, const std::vector< Real > &xstat, Real &tol)
Update internal risk measure storage for gradient computation.
Definition ROL_KLDivergence.hpp:137

ROL::KLDivergence::scaledGradient_
ROL::Ptr< Vector< Real > > scaledGradient_
Definition ROL_KLDivergence.hpp:54

ROL::KLDivergence::scaledHessVec_
ROL::Ptr< Vector< Real > > scaledHessVec_
Definition ROL_KLDivergence.hpp:55

ROL::Objective
Provides the interface to evaluate objective functions.
Definition ROL_Objective.hpp:44

ROL::RandVarFunctional
Provides the interface to implement any functional that maps a random variable to a (extended) real n...
Definition ROL_RandVarFunctional.hpp:47

ROL::RandVarFunctional::computeValue
Real computeValue(Objective< Real > &obj, const Vector< Real > &x, Real &tol)
Definition ROL_RandVarFunctional.hpp:68

ROL::RandVarFunctional::g_
Ptr< Vector< Real > > g_
Definition ROL_RandVarFunctional.hpp:59

ROL::RandVarFunctional::gv_
Real gv_
Definition ROL_RandVarFunctional.hpp:58

ROL::RandVarFunctional::initialize
virtual void initialize(const Vector< Real > &x)
Initialize temporary variables.
Definition ROL_RandVarFunctional.hpp:219

ROL::RandVarFunctional::computeHessVec
void computeHessVec(Vector< Real > &hv, Objective< Real > &obj, const Vector< Real > &v, const Vector< Real > &x, Real &tol)
Definition ROL_RandVarFunctional.hpp:122

ROL::RandVarFunctional::hv_
Ptr< Vector< Real > > hv_
Definition ROL_RandVarFunctional.hpp:60

ROL::RandVarFunctional::computeGradient
void computeGradient(Vector< Real > &g, Objective< Real > &obj, const Vector< Real > &x, Real &tol)
Definition ROL_RandVarFunctional.hpp:86

ROL::RandVarFunctional::point_
std::vector< Real > point_
Definition ROL_RandVarFunctional.hpp:64

ROL::RandVarFunctional::dualVector_
Ptr< Vector< Real > > dualVector_
Definition ROL_RandVarFunctional.hpp:61

ROL::RandVarFunctional::weight_
Real weight_
Definition ROL_RandVarFunctional.hpp:65

ROL::RandVarFunctional::val_
Real val_
Definition ROL_RandVarFunctional.hpp:57

ROL::RandVarFunctional::computeGradVec
Real computeGradVec(Vector< Real > &g, Objective< Real > &obj, const Vector< Real > &v, const Vector< Real > &x, Real &tol)
Definition ROL_RandVarFunctional.hpp:102

ROL::SampleGenerator
Definition ROL_SampleGenerator.hpp:20

ROL::SampleGenerator::sumAll
void sumAll(Real *input, Real *output, int dim) const
Definition ROL_SampleGenerator.hpp:94

ROL::Vector
Defines the linear algebra or vector space interface.
Definition ROL_Vector.hpp:51

ROL::Vector::scale
virtual void scale(const Real alpha)=0
Compute  where .

ROL::Vector::dual
virtual const Vector & dual() const
Return dual representation of , for example, the result of applying a Riesz map, or change of basis,...
Definition ROL_Vector.hpp:193

ROL::Vector::clone
virtual ROL::Ptr< Vector > clone() const =0
Clone to make a new (uninitialized) vector.

ROL::Vector::axpy
virtual void axpy(const Real alpha, const Vector &x)
Compute  where .
Definition ROL_Vector.hpp:120

ROL
Definition ROL_ElementwiseVector.hpp:27