Grid/dev/ConjugateGradientMultiShift_8h_source.html

/*************************************************************************************


    Grid physics library, www.github.com/paboyle/Grid


    Source file: ./lib/algorithms/iterative/ConjugateGradientMultiShift.h


    Copyright (C) 2015


Author: Azusa Yamaguchi <ayamaguc@staffmail.ed.ac.uk>

Author: Peter Boyle <paboyle@ph.ed.ac.uk>


    This program is free software; you can redistribute it and/or modify

    it under the terms of the GNU General Public License as published by

    the Free Software Foundation; either version 2 of the License, or

    (at your option) any later version.


    This program is distributed in the hope that it will be useful,

    but WITHOUT ANY WARRANTY; without even the implied warranty of

    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the

    GNU General Public License for more details.


    You should have received a copy of the GNU General Public License along

    with this program; if not, write to the Free Software Foundation, Inc.,

    51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.


    See the full license in the file "LICENSE" in the top level distribution directory

*************************************************************************************/

/*  END LEGAL */

#ifndef GRID_CONJUGATE_MULTI_SHIFT_GRADIENT_H

#define GRID_CONJUGATE_MULTI_SHIFT_GRADIENT_H


NAMESPACE_BEGIN(Grid);


// Base classes for iterative processes based on operators

// single input vec, single output vec.


template<class Field>


class ConjugateGradientMultiShift : public OperatorMultiFunction<Field>,

                    public OperatorFunction<Field>

{

public:


  using OperatorFunction<Field>::operator();


  //  RealD   Tolerance;

  Integer MaxIterations;

  Integer IterationsToComplete; //Number of iterations the CG took to finish. Filled in upon completion

  std::vector<int> IterationsToCompleteShift;  // Iterations for this shift

  int verbose;

  MultiShiftFunction shifts;

  std::vector<RealD> TrueResidualShift;


  ConjugateGradientMultiShift(Integer maxit, const MultiShiftFunction &_shifts) :

    MaxIterations(maxit),

    shifts(_shifts)

  {

    verbose=1;

    IterationsToCompleteShift.resize(_shifts.order);

    TrueResidualShift.resize(_shifts.order);

  }


  void operator() (LinearOperatorBase<Field> &Linop, const Field &src, Field &psi)

  {

    GridBase *grid = src.Grid();

    int nshift = shifts.order;

    std::vector<Field> results(nshift,grid);

    (*this)(Linop,src,results,psi);

  }


  void operator() (LinearOperatorBase<Field> &Linop, const Field &src, std::vector<Field> &results, Field &psi)

  {

    int nshift = shifts.order;


    (*this)(Linop,src,results);


    psi = shifts.norm*src;

    for(int i=0;i<nshift;i++){

      psi = psi + shifts.residues[i]*results[i];

    }


    return;

  }


  void operator() (LinearOperatorBase<Field> &Linop, const Field &src, std::vector<Field> &psi)

  {

    GRID_TRACE("ConjugateGradientMultiShift");


    GridBase *grid = src.Grid();


    // Convenience references to the info stored in "MultiShiftFunction"

    int nshift = shifts.order;


    std::vector<RealD> &mass(shifts.poles); // Make references to array in "shifts"

    std::vector<RealD> &mresidual(shifts.tolerances);

    std::vector<RealD> alpha(nshift,1.0);

    std::vector<Field>   ps(nshift,grid);// Search directions


    assert(psi.size()==nshift);

    assert(mass.size()==nshift);

    assert(mresidual.size()==nshift);


    // remove dynamic sized arrays on stack; 2d is a pain with vector

    std::vector<RealD>  bs(nshift);

    std::vector<RealD>  rsq(nshift);

    std::vector<std::array<RealD,2> >  z(nshift);

    std::vector<int>     converged(nshift);


    const int       primary =0;


    //Primary shift fields CG iteration

    RealD a,b,c,d;

    RealD cp,bp,qq; //prev


    // Matrix mult fields

    Field r(grid);

    Field p(grid);

    Field tmp(grid);

    Field mmp(grid);


    // Check lightest mass

    for(int s=0;s<nshift;s++){

      assert( mass[s]>= mass[primary] );

      converged[s]=0;

    }


    // Wire guess to zero

    // Residuals "r" are src

    // First search direction "p" is also src

    cp = norm2(src);


    // Handle trivial case of zero src.

    if( cp == 0. ){

      for(int s=0;s<nshift;s++){

    psi[s] = Zero();

    IterationsToCompleteShift[s] = 1;

    TrueResidualShift[s] = 0.;

      }

      return;

    }


    for(int s=0;s<nshift;s++){

      rsq[s] = cp * mresidual[s] * mresidual[s];

      std::cout<<GridLogMessage<<"ConjugateGradientMultiShift: shift "<<s

           <<" target resid^2 "<<rsq[s]<<std::endl;

      ps[s] = src;

    }

    // r and p for primary

    r=src;

    p=src;


    //MdagM+m[0]

    Linop.HermOpAndNorm(p,mmp,d,qq);

    axpy(mmp,mass[0],p,mmp);

    RealD rn = norm2(p);

    d += rn*mass[0];


    // have verified that inner product of

    // p and mmp is equal to d after this since

    // the d computation is tricky

    //  qq = real(innerProduct(p,mmp));

    //  std::cout<<GridLogMessage << "debug equal ?  qq "<<qq<<" d "<< d<<std::endl;


    b = -cp /d;


    // Set up the various shift variables

    int       iz=0;

    z[0][1-iz] = 1.0;

    z[0][iz]   = 1.0;

    bs[0]      = b;

    for(int s=1;s<nshift;s++){

      z[s][1-iz] = 1.0;

      z[s][iz]   = 1.0/( 1.0 - b*(mass[s]-mass[0]));

      bs[s]      = b*z[s][iz];

    }


    // r += b[0] A.p[0]

    // c= norm(r)

    c=axpy_norm(r,b,mmp,r);


    for(int s=0;s<nshift;s++) {

      axpby(psi[s],0.,-bs[s]*alpha[s],src,src);

    }


    std::cout << GridLogIterative << "ConjugateGradientMultiShift: initial rn (|src|^2) =" << rn << " qq (|MdagM src|^2) =" << qq << " d ( dot(src, [MdagM + m_0]src) ) =" << d << " c=" << c << std::endl;


  // Timers

  GridStopWatch AXPYTimer;

  GridStopWatch ShiftTimer;

  GridStopWatch QRTimer;

  GridStopWatch MatrixTimer;

  GridStopWatch SolverTimer;

  SolverTimer.Start();


    // Iteration loop

    int k;


    for (k=1;k<=MaxIterations;k++){


      a = c /cp;

    AXPYTimer.Start();

      axpy(p,a,p,r);

    AXPYTimer.Stop();


      // Note to self - direction ps is iterated seperately

      // for each shift. Does not appear to have any scope

      // for avoiding linear algebra in "single" case.

      //

      // However SAME r is used. Could load "r" and update

      // ALL ps[s]. 2/3 Bandwidth saving

      // New Kernel: Load r, vector of coeffs, vector of pointers ps

    AXPYTimer.Start();

      for(int s=0;s<nshift;s++){

    if ( ! converged[s] ) {

      if (s==0){

        axpy(ps[s],a,ps[s],r);

      } else{

        RealD as =a *z[s][iz]*bs[s] /(z[s][1-iz]*b);

        axpby(ps[s],z[s][iz],as,r,ps[s]);

      }

    }

      }

    AXPYTimer.Stop();


      cp=c;

    MatrixTimer.Start();

    //Linop.HermOpAndNorm(p,mmp,d,qq); // d is used

    // The below is faster on KNL

    Linop.HermOp(p,mmp);

    d=real(innerProduct(p,mmp));


    MatrixTimer.Stop();


    AXPYTimer.Start();

      axpy(mmp,mass[0],p,mmp);

    AXPYTimer.Stop();

      RealD rn = norm2(p);

      d += rn*mass[0];


      bp=b;

      b=-cp/d;


    AXPYTimer.Start();

      c=axpy_norm(r,b,mmp,r);

    AXPYTimer.Stop();


      // Toggle the recurrence history

      bs[0] = b;

      iz = 1-iz;

    ShiftTimer.Start();

      for(int s=1;s<nshift;s++){

    if((!converged[s])){

      RealD z0 = z[s][1-iz];

      RealD z1 = z[s][iz];

      z[s][iz] = z0*z1*bp

        / (b*a*(z1-z0) + z1*bp*(1- (mass[s]-mass[0])*b));

      bs[s] = b*z[s][iz]/z0; // NB sign  rel to Mike

    }

      }

    ShiftTimer.Stop();


      for(int s=0;s<nshift;s++){

    int ss = s;

    // Scope for optimisation here in case of "single".

    // Could load psi[0] and pull all ps[s] in.

    //      if ( single ) ss=primary;

    // Bandwith saving in single case is Ls * 3 -> 2+Ls, so ~ 3x saving

    // Pipelined CG gain:

    //

    // New Kernel: Load r, vector of coeffs, vector of pointers ps

    // New Kernel: Load psi[0], vector of coeffs, vector of pointers ps

    // If can predict the coefficient bs then we can fuse these and avoid write reread cyce

    //  on ps[s].

    // Before:  3 x npole  + 3 x npole

    // After :  2 x npole (ps[s])        => 3x speed up of multishift CG.


    if( (!converged[s]) ) {

      axpy(psi[ss],-bs[s]*alpha[s],ps[s],psi[ss]);

    }

      }


      // Convergence checks

      int all_converged = 1;

      for(int s=0;s<nshift;s++){


    if ( (!converged[s]) ){

      IterationsToCompleteShift[s] = k;


      RealD css  = c * z[s][iz]* z[s][iz];


      if(css<rsq[s]){

        if ( ! converged[s] )

          std::cout<<GridLogMessage<<"ConjugateGradientMultiShift k="<<k<<" Shift "<<s<<" has converged"<<std::endl;

        converged[s]=1;

      } else {

        all_converged=0;

      }


    }

      }


      if ( all_converged ){


    SolverTimer.Stop();


    std::cout<<GridLogMessage<< "CGMultiShift: All shifts have converged iteration "<<k<<std::endl;

    std::cout<<GridLogMessage<< "CGMultiShift: Checking solutions"<<std::endl;


    // Check answers

    for(int s=0; s < nshift; s++) {

      Linop.HermOpAndNorm(psi[s],mmp,d,qq);

      axpy(tmp,mass[s],psi[s],mmp);

      axpy(r,-alpha[s],src,tmp);

      RealD rn = norm2(r);

      RealD cn = norm2(src);

      TrueResidualShift[s] = std::sqrt(rn/cn);

      std::cout<<GridLogMessage<<"CGMultiShift: shift["<<s<<"] true residual "<< TrueResidualShift[s] <<std::endl;

    }


      std::cout << GridLogMessage << "Time Breakdown "<<std::endl;

      std::cout << GridLogMessage << "\tElapsed    " << SolverTimer.Elapsed()     <<std::endl;

      std::cout << GridLogMessage << "\tAXPY     " << AXPYTimer.Elapsed()     <<std::endl;

      std::cout << GridLogMessage << "\tMatrix   " << MatrixTimer.Elapsed()     <<std::endl;

      std::cout << GridLogMessage << "\tShift    " << ShiftTimer.Elapsed()     <<std::endl;


      IterationsToComplete = k;


    return;

      }


    }

    // ugly hack

    std::cout<<GridLogMessage<<"CG multi shift did not converge"<<std::endl;

    //  assert(0);

  }


};


NAMESPACE_END(Grid);

#endif

axpy_norm
RealD axpy_norm(Lattice< vobj > &ret, sobj a, const Lattice< vobj > &x, const Lattice< vobj > &y)
Definition Lattice_arith.h:262

axpy
void axpy(Lattice< vobj > &ret, sobj a, const Lattice< vobj > &x, const Lattice< vobj > &y)
Definition Lattice_arith.h:232

axpby
void axpby(Lattice< vobj > &ret, sobj a, sobj b, const Lattice< vobj > &x, const Lattice< vobj > &y)
Definition Lattice_arith.h:246

real
Lattice< vobj > real(const Lattice< vobj > &lhs)
Definition Lattice_real_imag.h:41

innerProduct
ComplexD innerProduct(const Lattice< vobj > &left, const Lattice< vobj > &right)
Definition Lattice_reduction.h:290

norm2
RealD norm2(const Lattice< vobj > &arg)
Definition Lattice_reduction.h:202

GridLogIterative
GridLogger GridLogIterative(1, "Iterative", GridLogColours, "BLUE")

GridLogMessage
GridLogger GridLogMessage(1, "Message", GridLogColours, "NORMAL")

NAMESPACE_BEGIN
#define NAMESPACE_BEGIN(A)
Definition Namespace.h:35

NAMESPACE_END
#define NAMESPACE_END(A)
Definition Namespace.h:36

Integer
uint32_t Integer
Definition Simd.h:58

RealD
double RealD
Definition Simd.h:61

GRID_TRACE
#define GRID_TRACE(name)
Definition Tracing.h:68

ConjugateGradientMultiShift::IterationsToComplete
Integer IterationsToComplete
Definition ConjugateGradientMultiShift.h:49

ConjugateGradientMultiShift::verbose
int verbose
Definition ConjugateGradientMultiShift.h:51

ConjugateGradientMultiShift::IterationsToCompleteShift
std::vector< int > IterationsToCompleteShift
Definition ConjugateGradientMultiShift.h:50

ConjugateGradientMultiShift::operator()
void operator()(LinearOperatorBase< Field > &Linop, const Field &src, Field &psi)
Definition ConjugateGradientMultiShift.h:64

ConjugateGradientMultiShift::ConjugateGradientMultiShift
ConjugateGradientMultiShift(Integer maxit, const MultiShiftFunction &_shifts)
Definition ConjugateGradientMultiShift.h:55

ConjugateGradientMultiShift::shifts
MultiShiftFunction shifts
Definition ConjugateGradientMultiShift.h:52

ConjugateGradientMultiShift::TrueResidualShift
std::vector< RealD > TrueResidualShift
Definition ConjugateGradientMultiShift.h:53

ConjugateGradientMultiShift::MaxIterations
Integer MaxIterations
Definition ConjugateGradientMultiShift.h:48

GridBase
Definition Cartesian_base.h:43

GridStopWatch
Definition Timer.h:83

GridStopWatch::Start
void Start(void)
Definition Timer.h:92

GridStopWatch::Elapsed
GridTime Elapsed(void) const
Definition Timer.h:113

GridStopWatch::Stop
void Stop(void)
Definition Timer.h:99

LinearOperatorBase
Definition LinearOperator.h:44

LinearOperatorBase::HermOp
virtual void HermOp(const Field &in, Field &out)=0

LinearOperatorBase::HermOpAndNorm
virtual void HermOpAndNorm(const Field &in, Field &out, RealD &n1, RealD &n2)=0

MultiShiftFunction
Definition MultiShiftFunction.h:34

MultiShiftFunction::order
int order
Definition MultiShiftFunction.h:36

OperatorFunction
Definition LinearOperator.h:622

OperatorMultiFunction
Definition LinearOperator.h:661

Zero
Definition Simd.h:194

Grid
Definition Deflation.h:31