d8/d2e/a03548_source.html

 //////////////////////////////////////////////////////////////////////////////////////
 // This file is distributed under the University of Illinois/NCSA Open Source License.
 // See LICENSE file in top directory for details.
 //
 // Copyright (c) 2016 Jeongnim Kim and QMCPACK developers.
 //
 // File developed by: Ken Esler, kpesler@gmail.com, University of Illinois at Urbana-Champaign
 //                    Miguel Morales, moralessilva2@llnl.gov, Lawrence Livermore National Laboratory
 //                    Jeremy McMinnis, jmcminis@gmail.com, University of Illinois at Urbana-Champaign
 //                    Jeongnim Kim, jeongnim.kim@gmail.com, University of Illinois at Urbana-Champaign
 //                    Ye Luo, yeluo@anl.gov, Argonne National Laboratory
 //                    Raymond Clay III, j.k.rofling@gmail.com, Lawrence Livermore National Laboratory
 //                    Mark A. Berrill, berrillma@ornl.gov, Oak Ridge National Laboratory
 //
 // File created by: Jeongnim Kim, jeongnim.kim@gmail.com, University of Illinois at Urbana-Champaign
 //////////////////////////////////////////////////////////////////////////////////////


 #include "QMCCostFunctionBatched.h"
 #include "QMCDrivers/WFOpt/CostFunctionCrowdData.h"
 #include "Particle/MCWalkerConfiguration.h"
 #include "QMCWaveFunctions/TrialWaveFunction.h"
 #include "Message/CommOperators.h"
 #include "QMCDrivers/Optimizers/DescentEngine.h"
 #include "Concurrency/ParallelExecutor.hpp"
 //#define QMCCOSTFUNCTION_DEBUG

 namespace qmcplusplus
 {
 QMCCostFunctionBatched::QMCCostFunctionBatched(ParticleSet& w,
                                                TrialWaveFunction& psi,
                                                QMCHamiltonian& h,
                                                SampleStack& samples,
                                                const std::vector<int>& walkers_per_crowd,
                                                Communicate* comm)
     : QMCCostFunctionBase(w, psi, h, comm),
       samples_(samples),
       walkers_per_crowd_(walkers_per_crowd),
       check_config_timer_(createGlobalTimer("QMCCostFunctionBatched::checkConfigurations", timer_level_medium)),
       corr_sampling_timer_(createGlobalTimer("QMCCostFunctionBatched::correlatedSampling", timer_level_medium)),
       fill_timer_(createGlobalTimer("QMCCostFunctionBatched::fillOverlapHamiltonianMatrices", timer_level_medium))

 {
   app_log() << " Using QMCCostFunctionBatched::QMCCostFunctionBatched" << std::endl;
 }


 /** Clean up the vector */
 QMCCostFunctionBatched::~QMCCostFunctionBatched() = default;

 void QMCCostFunctionBatched::GradCost(std::vector<Return_rt>& PGradient,
                                       const std::vector<Return_rt>& PM,
                                       Return_rt FiniteDiff)
 {
   if (FiniteDiff > 0)
   {
     QMCTraits::RealType dh = 1.0 / (2.0 * FiniteDiff);
     for (int i = 0; i < NumOptimizables; i++)
     {
       for (int j = 0; j < NumOptimizables; j++)
         OptVariables[j] = PM[j];
       OptVariables[i]               = PM[i] + FiniteDiff;
       QMCTraits::RealType CostPlus  = this->Cost();
       OptVariables[i]               = PM[i] - FiniteDiff;
       QMCTraits::RealType CostMinus = this->Cost();
       PGradient[i]                  = (CostPlus - CostMinus) * dh;
     }
   }
   else
   {
     for (int j = 0; j < NumOptimizables; j++)
       OptVariables[j] = PM[j];
     resetPsi();
     //evaluate new local energies and derivatives
     EffectiveWeight effective_weight = correlatedSampling(true);
     //Estimators::accumulate has been called by correlatedSampling
     curAvg_w = SumValue[SUM_E_WGT] / SumValue[SUM_WGT];
     //    Return_t curAvg2_w = curAvg_w*curAvg_w;
     curVar_w = SumValue[SUM_ESQ_WGT] / SumValue[SUM_WGT] - curAvg_w * curAvg_w;
     std::vector<Return_rt> EDtotals(NumOptimizables, 0.0);
     std::vector<Return_rt> EDtotals_w(NumOptimizables, 0.0);
     std::vector<Return_rt> E2Dtotals_w(NumOptimizables, 0.0);
     std::vector<Return_rt> URV(NumOptimizables, 0.0);
     std::vector<Return_rt> HD_avg(NumOptimizables, 0.0);
     Return_rt wgtinv   = 1.0 / SumValue[SUM_WGT];
     Return_rt delE_bar = 0;
     {
       for (int iw = 0; iw < rank_local_num_samples_; iw++)
       {
         const Return_rt* restrict saved = RecordsOnNode_[iw];
         Return_rt weight                = saved[REWEIGHT] * wgtinv;
         Return_rt eloc_new              = saved[ENERGY_NEW];
         delE_bar += weight * std::pow(std::abs(eloc_new - EtargetEff), PowerE);
         const Return_rt* HDsaved = HDerivRecords_[iw];
         for (int pm = 0; pm < NumOptimizables; pm++)
           HD_avg[pm] += HDsaved[pm];
       }
     }
     myComm->allreduce(HD_avg);
     myComm->allreduce(delE_bar);
     for (int pm = 0; pm < NumOptimizables; pm++)
       HD_avg[pm] *= 1.0 / static_cast<Return_rt>(NumSamples);
     {
       for (int iw = 0; iw < rank_local_num_samples_; iw++)
       {
         const Return_rt* restrict saved = RecordsOnNode_[iw];
         Return_rt weight                = saved[REWEIGHT] * wgtinv;
         Return_rt eloc_new              = saved[ENERGY_NEW];
         Return_rt delta_l               = (eloc_new - curAvg_w);
         bool ltz(true);
         if (eloc_new - EtargetEff < 0)
           ltz = false;
         Return_rt delE           = std::pow(std::abs(eloc_new - EtargetEff), PowerE);
         Return_rt ddelE          = PowerE * std::pow(std::abs(eloc_new - EtargetEff), PowerE - 1);
         const Return_t* Dsaved   = DerivRecords_[iw];
         const Return_rt* HDsaved = HDerivRecords_[iw];
         for (int pm = 0; pm < NumOptimizables; pm++)
         {
           //From Toulouse J. Chem. Phys. 126, 084102 (2007), this is H_0j+H_j0, which are independent
           //estimates of 1/2 the energy gradient g.  So g1+g2 is an estimate of g.
           EDtotals_w[pm] += weight * (HDsaved[pm] + 2.0 * std::real(Dsaved[pm]) * delta_l);
           URV[pm] += 2.0 * (eloc_new * HDsaved[pm] - curAvg * HD_avg[pm]);
           if (ltz)
             EDtotals[pm] += weight * (2.0 * std::real(Dsaved[pm]) * (delE - delE_bar) + ddelE * HDsaved[pm]);
           else
             EDtotals[pm] += weight * (2.0 * std::real(Dsaved[pm]) * (delE - delE_bar) - ddelE * HDsaved[pm]);
         }
       }
     }
     myComm->allreduce(EDtotals);
     myComm->allreduce(EDtotals_w);
     myComm->allreduce(URV);
     Return_rt smpinv = 1.0 / static_cast<Return_rt>(NumSamples);
     {
       for (int iw = 0; iw < rank_local_num_samples_; iw++)
       {
         const Return_rt* restrict saved = RecordsOnNode_[iw];
         Return_rt weight                = saved[REWEIGHT] * wgtinv;
         Return_rt eloc_new              = saved[ENERGY_NEW];
         Return_rt delta_l               = (eloc_new - curAvg_w);
         Return_rt sigma_l               = delta_l * delta_l;
         const Return_t* Dsaved          = DerivRecords_[iw];
         const Return_rt* HDsaved        = HDerivRecords_[iw];
         for (int pm = 0; pm < NumOptimizables; pm++)
         {
           E2Dtotals_w[pm] +=
               weight * 2.0 * (std::real(Dsaved[pm]) * (sigma_l - curVar_w) + delta_l * (HDsaved[pm] - EDtotals_w[pm]));
         }
       }
     }
     myComm->allreduce(E2Dtotals_w);
     for (int pm = 0; pm < NumOptimizables; pm++)
       URV[pm] *= smpinv;
     for (int j = 0; j < NumOptimizables; j++)
     {
       PGradient[j] = 0.0;
       if (std::abs(w_var) > 1.0e-10)
         PGradient[j] += w_var * E2Dtotals_w[j];
       if (std::abs(w_en) > 1.0e-10)
         PGradient[j] += w_en * EDtotals_w[j];
       if (std::abs(w_w) > 1.0e-10)
         PGradient[j] += w_w * URV[j];
       if (std::abs(w_abs) > 1.0e-10)
         PGradient[j] += w_abs * EDtotals[j];
     }

     IsValid = isEffectiveWeightValid(effective_weight);
   }
 }

 void QMCCostFunctionBatched::getConfigurations(const std::string& aroot)
 {
   auto components = H.getTWFDependentComponents();
   app_log() << " Found " << components.size() << " wavefunction dependent components in the Hamiltonian";
   if (components.size())
     for (const OperatorBase& component : components)
       app_log() << " '" << component.getName() << "'";
   app_log() << "." << std::endl;

   rank_local_num_samples_ = samples_.getNumSamples();

   if (dLogPsi.size() != rank_local_num_samples_)
   {
     delete_iter(dLogPsi.begin(), dLogPsi.end());
     delete_iter(d2LogPsi.begin(), d2LogPsi.end());
     int nptcl = W.getTotalNum();
     dLogPsi.resize(rank_local_num_samples_);
     d2LogPsi.resize(rank_local_num_samples_);
     for (int i = 0; i < rank_local_num_samples_; ++i)
       dLogPsi[i] = new ParticleGradient(nptcl);
     for (int i = 0; i < rank_local_num_samples_; ++i)
       d2LogPsi[i] = new ParticleLaplacian(nptcl);
   }
 }

 /** Compute number of batches and final batch size given the number of samples
    *   and a batch size.
    * \param[in] sample_size number of samples to process.
    * \param[in] batch_size process samples in batch_size at a time (typically the number of walkers in a crowd).
    * \param[out] num_batches number of batches to use.
    * \param[out] final_batch_size the last batch size.  May be smaller than batch_size
    *             if the number of samples is not a multiple of the batch size.
    *
    * There may be cases where the batch size is zero. One cause is when the number of walkers per
    *  rank is less than the number of crowds.
    */
 void compute_batch_parameters(int sample_size, int batch_size, int& num_batches, int& final_batch_size)
 {
   if (batch_size == 0)
     num_batches = 0;
   else
     num_batches = sample_size / batch_size;

   final_batch_size = batch_size;
   if (batch_size != 0 && sample_size % batch_size != 0)
   {
     num_batches += 1;
     final_batch_size = sample_size % batch_size;
   }
 }

 /** evaluate everything before optimization */
 void QMCCostFunctionBatched::checkConfigurations(EngineHandle& handle)
 {
   ScopedTimer tmp_timer(check_config_timer_);

   RealType et_tot = 0.0;
   RealType e2_tot = 0.0;

   // Ensure number of samples did not change after getConfigurations
   assert(rank_local_num_samples_ == samples_.getNumSamples());

   if (RecordsOnNode_.size1() == 0)
   {
     RecordsOnNode_.resize(rank_local_num_samples_, SUM_INDEX_SIZE);
     if (needGrads)
     {
       DerivRecords_.resize(rank_local_num_samples_, NumOptimizables);
       HDerivRecords_.resize(rank_local_num_samples_, NumOptimizables);
     }
   }
   else if (RecordsOnNode_.size1() != rank_local_num_samples_)
   {
     RecordsOnNode_.resize(rank_local_num_samples_, SUM_INDEX_SIZE);
     if (needGrads)
     {
       DerivRecords_.resize(rank_local_num_samples_, NumOptimizables);
       HDerivRecords_.resize(rank_local_num_samples_, NumOptimizables);
     }
   }
   //    synchronize the random number generator with the node
   (*MoverRng[0]) = (*RngSaved[0]);
   H.setRandomGenerator(MoverRng[0]);


   // Create crowd-local storage for evaluation
   outputManager.pause();
   const size_t opt_num_crowds = walkers_per_crowd_.size();
   std::vector<std::unique_ptr<CostFunctionCrowdData>> opt_eval(opt_num_crowds);
   for (int i = 0; i < opt_num_crowds; i++)
     opt_eval[i] = std::make_unique<CostFunctionCrowdData>(walkers_per_crowd_[i], W, Psi, H, *MoverRng[0]);
   outputManager.resume();


   // TODO - walkers per crowd may not be evenly divided, so the samples per crowd
   //        might need to be divided differently for better load balancing.

   // Divide samples among the crowds
   std::vector<int> samples_per_crowd_offsets(opt_num_crowds + 1);
   FairDivide(rank_local_num_samples_, opt_num_crowds, samples_per_crowd_offsets);

   handle.prepareSampling(NumOptimizables, rank_local_num_samples_);
   // lambda to execute on each crowd
   auto evalOptConfig = [](int crowd_id, UPtrVector<CostFunctionCrowdData>& opt_crowds,
                           const std::vector<int>& samples_per_crowd_offsets, const std::vector<int>& walkers_per_crowd,
                           std::vector<ParticleGradient*>& gradPsi, std::vector<ParticleLaplacian*>& lapPsi,
                           Matrix<Return_rt>& RecordsOnNode, Matrix<Return_t>& DerivRecords,
                           Matrix<Return_rt>& HDerivRecords, const SampleStack& samples, opt_variables_type& optVars,
                           bool needGrads, EngineHandle& handle) {
     CostFunctionCrowdData& opt_data = *opt_crowds[crowd_id];

     const int local_samples = samples_per_crowd_offsets[crowd_id + 1] - samples_per_crowd_offsets[crowd_id];
     int num_batches;
     int final_batch_size;

     compute_batch_parameters(local_samples, walkers_per_crowd[crowd_id], num_batches, final_batch_size);

     for (int inb = 0; inb < num_batches; inb++)
     {
       int current_batch_size = walkers_per_crowd[crowd_id];
       if (inb == num_batches - 1)
         current_batch_size = final_batch_size;

       const int base_sample_index = inb * walkers_per_crowd[crowd_id] + samples_per_crowd_offsets[crowd_id];

       auto wf_list_no_leader = opt_data.get_wf_list(current_batch_size);
       auto p_list_no_leader  = opt_data.get_p_list(current_batch_size);
       auto h_list_no_leader  = opt_data.get_h_list(current_batch_size);
       const RefVectorWithLeader<ParticleSet> p_list(p_list_no_leader[0], p_list_no_leader);
       const RefVectorWithLeader<TrialWaveFunction> wf_list(wf_list_no_leader[0], wf_list_no_leader);
       const RefVectorWithLeader<QMCHamiltonian> h_list(h_list_no_leader[0], h_list_no_leader);

       ResourceCollectionTeamLock<ParticleSet> mw_pset_lock(opt_data.getSharedResource().pset_res, p_list);
       ResourceCollectionTeamLock<TrialWaveFunction> twfs_res_lock(opt_data.getSharedResource().twf_res, wf_list);
       ResourceCollectionTeamLock<QMCHamiltonian> hams_res_lock(opt_data.getSharedResource().ham_res, h_list);

       auto ref_dLogPsi  = convertPtrToRefVectorSubset(gradPsi, base_sample_index, current_batch_size);
       auto ref_d2LogPsi = convertPtrToRefVectorSubset(lapPsi, base_sample_index, current_batch_size);

       // Load samples into the crowd data
       for (int ib = 0; ib < current_batch_size; ib++)
       {
         samples.loadSample(p_list[ib], base_sample_index + ib);

         // Set the RNG used in QMCHamiltonian.  This is used to offset the grid
         // during spherical integration in the non-local pseudopotential.
         // The RNG state gets reset to the same starting point in correlatedSampling
         // to use the same grid offsets in the correlated sampling values.
         // Currently this code sets the RNG to the same state for every configuration
         // on this node.  Every configuration of electrons is different, and so in
         // theory using the same spherical integration grid should not be a problem.
         // If this needs to be changed, one possibility is to advance the RNG state
         // differently for each configuration.  Make sure the same initialization is
         // performed in correlatedSampling.
         *opt_data.get_rng_ptr_list()[ib] = opt_data.get_rng_save();
         h_list[ib].setRandomGenerator(opt_data.get_rng_ptr_list()[ib].get());
       }

       // Compute distance tables.
       ParticleSet::mw_update(p_list);

       // Log psi and prepare for difference the log psi
       opt_data.zero_log_psi();

       TrialWaveFunction::mw_evaluateDeltaLogSetup(wf_list, p_list, opt_data.get_log_psi_fixed(),
                                                   opt_data.get_log_psi_opt(), ref_dLogPsi, ref_d2LogPsi);

       std::vector<QMCHamiltonian::FullPrecRealType> energy_list;
       if (needGrads)
       {
         // Compute parameter derivatives of the wavefunction
         const size_t nparams = optVars.size();
         RecordArray<Return_t> dlogpsi_array(current_batch_size, nparams);
         RecordArray<Return_t> dhpsioverpsi_array(current_batch_size, nparams);

         energy_list = QMCHamiltonian::mw_evaluateValueAndDerivatives(h_list, wf_list, p_list, optVars, dlogpsi_array,
                                                                      dhpsioverpsi_array);

         handle.takeSample(energy_list, dlogpsi_array, dhpsioverpsi_array, base_sample_index);

         for (int ib = 0; ib < current_batch_size; ib++)
         {
           const int is = base_sample_index + ib;
           for (int j = 0; j < nparams; j++)
           {
             //dlogpsi is in general complex if psi is complex.
             DerivRecords[is][j] = dlogpsi_array[ib][j];
             //but E_L and d E_L/dc are real if c is real.
             HDerivRecords[is][j] = std::real(dhpsioverpsi_array[ib][j]);
           }
           RecordsOnNode[is][LOGPSI_FIXED] = opt_data.get_log_psi_fixed()[ib];
           RecordsOnNode[is][LOGPSI_FREE]  = opt_data.get_log_psi_opt()[ib];
         }
       }
       else
       { // Energy
         energy_list = QMCHamiltonian::mw_evaluate(h_list, wf_list, p_list);
       }
       for (int ib = 0; ib < current_batch_size; ib++)
       {
         const int is = base_sample_index + ib;
         auto etmp    = energy_list[ib];
         opt_data.get_e0() += etmp;
         opt_data.get_e2() += etmp * etmp;

         RecordsOnNode[is][ENERGY_NEW]   = etmp;
         RecordsOnNode[is][ENERGY_TOT]   = etmp;
         RecordsOnNode[is][REWEIGHT]     = 1.0;
         RecordsOnNode[is][ENERGY_FIXED] = etmp;

         const auto twf_dependent_components = h_list[ib].getTWFDependentComponents();
         for (const OperatorBase& component : twf_dependent_components)
           RecordsOnNode[is][ENERGY_FIXED] -= component.getValue();
       }
     }
   };

   ParallelExecutor<> crowd_tasks;
   crowd_tasks(opt_num_crowds, evalOptConfig, opt_eval, samples_per_crowd_offsets, walkers_per_crowd_, dLogPsi, d2LogPsi,
               RecordsOnNode_, DerivRecords_, HDerivRecords_, samples_, OptVariablesForPsi, needGrads, handle);
   // Sum energy values over crowds
   for (int i = 0; i < opt_eval.size(); i++)
   {
     et_tot += opt_eval[i]->get_e0();
     e2_tot += opt_eval[i]->get_e2();
   }

   OptVariablesForPsi.setComputed();
   //     app_log() << "  VMC Efavg = " << eft_tot/static_cast<Return_t>(wPerNode[NumThreads]) << std::endl;
   //Need to sum over the processors
   std::vector<Return_rt> etemp(3);
   etemp[0] = et_tot;
   etemp[1] = static_cast<Return_rt>(rank_local_num_samples_);
   etemp[2] = e2_tot;
   // Sum energy values over nodes
   myComm->allreduce(etemp);
   Etarget    = static_cast<Return_rt>(etemp[0] / etemp[1]);
   NumSamples = static_cast<int>(etemp[1]);
   app_log() << "  VMC Eavg = " << Etarget << std::endl;
   app_log() << "  VMC Evar = " << etemp[2] / etemp[1] - Etarget * Etarget << std::endl;
   app_log() << "  Total weights = " << etemp[1] << std::endl;

   handle.finishSampling();

   app_log().flush();
   setTargetEnergy(Etarget);
   ReportCounter = 0;
   IsValid       = true;

   //collect SumValue for computedCost
   SumValue[SUM_WGT]       = etemp[1];
   SumValue[SUM_WGTSQ]     = etemp[1];
   SumValue[SUM_E_WGT]     = etemp[0];
   SumValue[SUM_ESQ_WGT]   = etemp[2];
   SumValue[SUM_E_BARE]    = etemp[0];
   SumValue[SUM_ESQ_BARE]  = etemp[2];
   SumValue[SUM_ABSE_BARE] = 0.0;
 }

 #ifdef HAVE_LMY_ENGINE
 void QMCCostFunctionBatched::engine_checkConfigurations(cqmc::engine::LMYEngine<Return_t>* EngineObj,
                                                         DescentEngine& descentEngineObj,
                                                         const std::string& MinMethod)
 {
   APP_ABORT("LMYEngine not implemented with batch optimization");
 }
 #endif


 void QMCCostFunctionBatched::resetPsi(bool final_reset)
 {
   if (OptVariables.size() < OptVariablesForPsi.size())
     for (int i = 0; i < equalVarMap.size(); ++i)
       OptVariablesForPsi[equalVarMap[i][0]] = OptVariables[equalVarMap[i][1]];
   else
     for (int i = 0; i < OptVariables.size(); ++i)
       OptVariablesForPsi[i] = OptVariables[i];

   //cout << "######### QMCCostFunctionBatched::resetPsi " << std::endl;
   //OptVariablesForPsi.print(std::cout);
   //cout << "-------------------------------------- " << std::endl;
   resetOptimizableObjects(Psi, OptVariablesForPsi);
 }

 QMCCostFunctionBatched::EffectiveWeight QMCCostFunctionBatched::correlatedSampling(bool needGrad)
 {
   ScopedTimer tmp_timer(corr_sampling_timer_);

   {
     //    synchronize the random number generator with the node
     (*MoverRng[0]) = (*RngSaved[0]);
     H.setRandomGenerator(MoverRng[0]);
   }

   //Return_rt wgt_node = 0.0, wgt_node2 = 0.0;
   Return_rt wgt_tot  = 0.0;
   Return_rt wgt_tot2 = 0.0;

   // Ensure number of samples did not change after getConfiguration
   assert(rank_local_num_samples_ == samples_.getNumSamples());

   Return_rt inv_n_samples = 1.0 / samples_.getGlobalNumSamples();

   const size_t opt_num_crowds = walkers_per_crowd_.size();
   // Divide samples among crowds
   std::vector<int> samples_per_crowd_offsets(opt_num_crowds + 1);
   FairDivide(rank_local_num_samples_, opt_num_crowds, samples_per_crowd_offsets);

   // Create crowd-local storage for evaluation
   outputManager.pause();
   std::vector<std::unique_ptr<CostFunctionCrowdData>> opt_eval(opt_num_crowds);
   for (int i = 0; i < opt_num_crowds; i++)
     opt_eval[i] = std::make_unique<CostFunctionCrowdData>(walkers_per_crowd_[i], W, Psi, H, *MoverRng[0]);
   outputManager.resume();


   // lambda to execute on each crowd
   auto evalOptCorrelated =
       [](int crowd_id, UPtrVector<CostFunctionCrowdData>& opt_crowds, const std::vector<int>& samples_per_crowd_offsets,
          const std::vector<int>& walkers_per_crowd, std::vector<ParticleGradient*>& gradPsi,
          std::vector<ParticleLaplacian*>& lapPsi, Matrix<Return_rt>& RecordsOnNode, Matrix<Return_t>& DerivRecords,
          Matrix<Return_rt>& HDerivRecords, const SampleStack& samples, const opt_variables_type& optVars,
          bool compute_all_from_scratch, Return_rt vmc_or_dmc, bool needGrad) {
         CostFunctionCrowdData& opt_data = *opt_crowds[crowd_id];

         const int local_samples = samples_per_crowd_offsets[crowd_id + 1] - samples_per_crowd_offsets[crowd_id];

         int num_batches;
         int final_batch_size;
         compute_batch_parameters(local_samples, walkers_per_crowd[crowd_id], num_batches, final_batch_size);

         for (int inb = 0; inb < num_batches; inb++)
         {
           int current_batch_size = walkers_per_crowd[crowd_id];
           if (inb == num_batches - 1)
           {
             current_batch_size = final_batch_size;
           }

           const int base_sample_index = inb * walkers_per_crowd[crowd_id] + samples_per_crowd_offsets[crowd_id];

           auto p_list_no_leader  = opt_data.get_p_list(current_batch_size);
           auto wf_list_no_leader = opt_data.get_wf_list(current_batch_size);
           auto h0_list_no_leader = opt_data.get_h0_list(current_batch_size);
           const RefVectorWithLeader<ParticleSet> p_list(p_list_no_leader[0], p_list_no_leader);
           const RefVectorWithLeader<TrialWaveFunction> wf_list(wf_list_no_leader[0], wf_list_no_leader);
           const RefVectorWithLeader<QMCHamiltonian> h0_list(h0_list_no_leader[0], h0_list_no_leader);

           ResourceCollectionTeamLock<ParticleSet> mw_pset_lock(opt_data.getSharedResource().pset_res, p_list);
           ResourceCollectionTeamLock<TrialWaveFunction> twfs_res_lock(opt_data.getSharedResource().twf_res, wf_list);
           ResourceCollectionTeamLock<QMCHamiltonian> hams_res_lock(opt_data.get_h0_res(), h0_list);

           // Load this batch of samples into the crowd data
           for (int ib = 0; ib < current_batch_size; ib++)
           {
             samples.loadSample(p_list[ib], base_sample_index + ib);
             // Copy the saved RNG state
             *opt_data.get_rng_ptr_list()[ib] = opt_data.get_rng_save();
             h0_list[ib].setRandomGenerator(opt_data.get_rng_ptr_list()[ib].get());
           }

           // Update distance tables, etc for the loaded sample positions
           ParticleSet::mw_update(p_list, true);

           // Evaluate difference in log psi

           std::vector<std::unique_ptr<ParticleSet::ParticleGradient>> dummyG_ptr_list;
           std::vector<std::unique_ptr<ParticleSet::ParticleLaplacian>> dummyL_ptr_list;
           RefVector<ParticleSet::ParticleGradient> dummyG_list;
           RefVector<ParticleSet::ParticleLaplacian> dummyL_list;
           if (compute_all_from_scratch)
           {
             int nptcl = gradPsi[0]->size();
             dummyG_ptr_list.reserve(current_batch_size);
             dummyL_ptr_list.reserve(current_batch_size);
             for (int i = 0; i < current_batch_size; i++)
             {
               dummyG_ptr_list.emplace_back(std::make_unique<ParticleGradient>(nptcl));
               dummyL_ptr_list.emplace_back(std::make_unique<ParticleLaplacian>(nptcl));
             }
             dummyG_list = convertUPtrToRefVector(dummyG_ptr_list);
             dummyL_list = convertUPtrToRefVector(dummyL_ptr_list);
           }
           opt_data.zero_log_psi();

           TrialWaveFunction::mw_evaluateDeltaLog(wf_list, p_list, opt_data.get_log_psi_opt(), dummyG_list, dummyL_list,
                                                  compute_all_from_scratch);

           Return_rt inv_n_samples = 1.0 / samples.getGlobalNumSamples();

           for (int ib = 0; ib < current_batch_size; ib++)
           {
             const int is = base_sample_index + ib;
             wf_list[ib].G += *gradPsi[is];
             wf_list[ib].L += *lapPsi[is];
             // This is needed to get the KE correct in QMCHamiltonian::mw_evaluate below
             p_list[ib].G += *gradPsi[is];
             p_list[ib].L += *lapPsi[is];
             Return_rt weight = vmc_or_dmc * (opt_data.get_log_psi_opt()[ib] - RecordsOnNode[is][LOGPSI_FREE]);
             RecordsOnNode[is][REWEIGHT] = weight;
             // move to opt_data
             opt_data.get_wgt() += inv_n_samples * weight;
             opt_data.get_wgt2() += inv_n_samples * weight * weight;
           }

           if (needGrad)
           {
             // Parameter derivatives
             const size_t nparams = optVars.size();
             RecordArray<Return_t> dlogpsi_array(current_batch_size, nparams);
             RecordArray<Return_t> dhpsioverpsi_array(current_batch_size, nparams);

             // Energy
             auto energy_list = QMCHamiltonian::mw_evaluateValueAndDerivatives(h0_list, wf_list, p_list, optVars,
                                                                               dlogpsi_array, dhpsioverpsi_array);

             for (int ib = 0; ib < current_batch_size; ib++)
             {
               const int is                  = base_sample_index + ib;
               auto etmp                     = energy_list[ib];
               RecordsOnNode[is][ENERGY_NEW] = etmp + RecordsOnNode[is][ENERGY_FIXED];
               for (int j = 0; j < nparams; j++)
               {
                 if (optVars.recompute(j))
                 {
                   //In general, dlogpsi is complex.
                   DerivRecords[is][j] = dlogpsi_array[ib][j];
                   //However, E_L is always real, and so d E_L/dc is real, provided c is real.
                   HDerivRecords[is][j] = std::real(dhpsioverpsi_array[ib][j]);
                 }
               }
             }
           }
           else
           {
             // Just energy needed if no gradients
             auto energy_list = QMCHamiltonian::mw_evaluate(h0_list, wf_list, p_list);
             for (int ib = 0; ib < current_batch_size; ib++)
             {
               const int is                  = base_sample_index + ib;
               auto etmp                     = energy_list[ib];
               RecordsOnNode[is][ENERGY_NEW] = etmp + RecordsOnNode[is][ENERGY_FIXED];
             }
           }
         }
       };

   //if we have more than KE depending on TWF, TWF must be fully recomputed.
   const bool compute_all_from_scratch = H.getTWFDependentComponents().size() > 1;
   ParallelExecutor<> crowd_tasks;
   crowd_tasks(opt_num_crowds, evalOptCorrelated, opt_eval, samples_per_crowd_offsets, walkers_per_crowd_, dLogPsi,
               d2LogPsi, RecordsOnNode_, DerivRecords_, HDerivRecords_, samples_, OptVariablesForPsi,
               compute_all_from_scratch, vmc_or_dmc, needGrad);
   // Sum weights over crowds
   for (int i = 0; i < opt_eval.size(); i++)
   {
     wgt_tot += opt_eval[i]->get_wgt();
     wgt_tot2 += opt_eval[i]->get_wgt2();
   }

   //this is MPI barrier
   OHMMS::Controller->barrier();
   //collect the total weight for normalization and apply maximum weight
   myComm->allreduce(wgt_tot);
   myComm->allreduce(wgt_tot2);
   //    app_log()<<"Before Purge"<<wgt_tot<<" "<<wgt_tot2<< std::endl;
   Return_rt wgtnorm = (wgt_tot == 0) ? 0 : wgt_tot;
   wgt_tot           = 0.0;
   {
     for (int iw = 0; iw < rank_local_num_samples_; iw++)
     {
       Return_rt* restrict saved = RecordsOnNode_[iw];
       saved[REWEIGHT] =
           std::min(std::exp(saved[REWEIGHT] - wgtnorm), std::numeric_limits<Return_rt>::max() * (RealType)0.1);
       wgt_tot += inv_n_samples * saved[REWEIGHT];
     }
   }
   myComm->allreduce(wgt_tot);
   //    app_log()<<"During Purge"<<wgt_tot<<" "<< std::endl;
   wgtnorm = (wgt_tot == 0) ? 1 : 1.0 / wgt_tot;
   wgt_tot = 0.0;
   {
     for (int iw = 0; iw < rank_local_num_samples_; iw++)
     {
       Return_rt* restrict saved = RecordsOnNode_[iw];
       saved[REWEIGHT]           = std::min(saved[REWEIGHT] * wgtnorm, MaxWeight);
       wgt_tot += inv_n_samples * saved[REWEIGHT];
     }
   }
   myComm->allreduce(wgt_tot);
   //    app_log()<<"After Purge"<<wgt_tot<<" "<< std::endl;
   for (int i = 0; i < SumValue.size(); i++)
     SumValue[i] = 0.0;
   {
     for (int iw = 0; iw < rank_local_num_samples_; iw++)
     {
       const Return_rt* restrict saved = RecordsOnNode_[iw];
       //      Return_t weight=saved[REWEIGHT]*wgt_tot;
       Return_rt eloc_new = saved[ENERGY_NEW];
       Return_rt delE     = std::pow(std::abs(eloc_new - EtargetEff), PowerE);
       SumValue[SUM_E_BARE] += eloc_new;
       SumValue[SUM_ESQ_BARE] += eloc_new * eloc_new;
       SumValue[SUM_ABSE_BARE] += delE;
       SumValue[SUM_E_WGT] += eloc_new * saved[REWEIGHT];
       SumValue[SUM_ESQ_WGT] += eloc_new * eloc_new * saved[REWEIGHT];
       SumValue[SUM_ABSE_WGT] += delE * saved[REWEIGHT];
       SumValue[SUM_WGT] += saved[REWEIGHT];
       SumValue[SUM_WGTSQ] += saved[REWEIGHT] * saved[REWEIGHT];
     }
   }
   //collect everything
   myComm->allreduce(SumValue);
   return SumValue[SUM_WGT] * SumValue[SUM_WGT] / (SumValue[SUM_WGTSQ] * samples_.getGlobalNumSamples());
 }


 // Construct the overlap and Hamiltonian matrices for the linear method
 // A sum over samples.  Inputs are
 //   DerivRecords - derivative of log psi ( d ln (psi) / dp = 1/psi * d psi / dp )
 //   HDerivRecords - derivative of Hamiltonian
 //   RecordsOnNode - energies and weights (for reweighting)
 //   SumValue - sums of energies and weights
 // Outputs
 //   Left - Hamiltonian matrix
 //   Right - overlap matrix
 //

 QMCCostFunctionBatched::Return_rt QMCCostFunctionBatched::fillOverlapHamiltonianMatrices(Matrix<Return_rt>& Left,
                                                                                          Matrix<Return_rt>& Right)
 {
   ScopedTimer tmp_timer(fill_timer_);

   Right = 0.0;
   Left  = 0.0;

   curAvg_w            = SumValue[SUM_E_WGT] / SumValue[SUM_WGT];
   Return_rt curAvg2_w = SumValue[SUM_ESQ_WGT] / SumValue[SUM_WGT];
   RealType V_avg      = curAvg2_w - curAvg_w * curAvg_w;
   std::vector<Return_t> D_avg(getNumParams(), 0.0);
   Return_rt wgtinv = 1.0 / SumValue[SUM_WGT];

   for (int iw = 0; iw < rank_local_num_samples_; iw++)
   {
     const Return_rt* restrict saved = RecordsOnNode_[iw];
     Return_rt weight                = saved[REWEIGHT] * wgtinv;
     const Return_t* Dsaved          = DerivRecords_[iw];
     for (int pm = 0; pm < getNumParams(); pm++)
     {
       D_avg[pm] += Dsaved[pm] * weight;
     }
   }

   myComm->allreduce(D_avg);

   for (int iw = 0; iw < rank_local_num_samples_; iw++)
   {
     const Return_rt* restrict saved = RecordsOnNode_[iw];
     Return_rt weight                = saved[REWEIGHT] * wgtinv;
     Return_rt eloc_new              = saved[ENERGY_NEW];
     const Return_t* Dsaved          = DerivRecords_[iw];
     const Return_rt* HDsaved        = HDerivRecords_[iw];

     size_t opt_num_crowds = walkers_per_crowd_.size();
     std::vector<int> params_per_crowd(opt_num_crowds + 1);
     FairDivide(getNumParams(), opt_num_crowds, params_per_crowd);


     auto constructMatrices = [](int crowd_id, std::vector<int>& crowd_ranges, int numParams, const Return_t* Dsaved,
                                 const Return_rt* HDsaved, Return_rt weight, Return_rt eloc_new, RealType V_avg,
                                 std::vector<Return_t>& D_avg, RealType b2, RealType curAvg_w, Matrix<Return_rt>& Left,
                                 Matrix<Return_rt>& Right) {
       int local_pm_start = crowd_ranges[crowd_id];
       int local_pm_end   = crowd_ranges[crowd_id + 1];

       for (int pm = local_pm_start; pm < local_pm_end; pm++)
       {
         Return_t wfe   = (HDsaved[pm] + (Dsaved[pm] - D_avg[pm]) * eloc_new) * weight;
         Return_t wfd   = (Dsaved[pm] - D_avg[pm]) * weight;
         Return_t vterm = HDsaved[pm] * (eloc_new - curAvg_w) +
             (Dsaved[pm] - D_avg[pm]) * eloc_new * (eloc_new - RealType(2.0) * curAvg_w);
         //                 Variance
         Left(0, pm + 1) += b2 * std::real(vterm) * weight;
         Left(pm + 1, 0) += b2 * std::real(vterm) * weight;
         //                 Hamiltonian
         Left(0, pm + 1) += (1 - b2) * std::real(wfe);
         Left(pm + 1, 0) += (1 - b2) * std::real(wfd) * eloc_new;
         for (int pm2 = 0; pm2 < numParams; pm2++)
         {
           //                Hamiltonian
           Left(pm + 1, pm2 + 1) +=
               std::real((1 - b2) * std::conj(wfd) * (HDsaved[pm2] + (Dsaved[pm2] - D_avg[pm2]) * eloc_new));
           //                Overlap
           RealType ovlij = std::real(std::conj(wfd) * (Dsaved[pm2] - D_avg[pm2]));
           Right(pm + 1, pm2 + 1) += ovlij;
           //                Variance
           RealType varij = weight *
               std::real((HDsaved[pm] - RealType(2.0) * std::conj(Dsaved[pm] - D_avg[pm]) * eloc_new) *
                         (HDsaved[pm2] - RealType(2.0) * (Dsaved[pm2] - D_avg[pm2]) * eloc_new));
           Left(pm + 1, pm2 + 1) += b2 * (varij + V_avg * ovlij);
         }
       }
     };

     ParallelExecutor<> crowd_tasks;
     crowd_tasks(opt_num_crowds, constructMatrices, params_per_crowd, getNumParams(), Dsaved, HDsaved, weight, eloc_new,
                 V_avg, D_avg, w_beta, curAvg_w, Left, Right);
   }
   myComm->allreduce(Right);
   myComm->allreduce(Left);
   Left(0, 0)  = (1 - w_beta) * curAvg_w + w_beta * V_avg;
   Right(0, 0) = 1.0;

   return 1.0;
 }
 } // namespace qmcplusplus
qmcplusplus::QMCCostFunctionBase::Cost
Return_rt Cost(bool needGrad=true) override
return the cost value for CGMinimization
Definition: QMCCostFunctionBase.cpp:122

qmcplusplus::QMCCostFunctionBase::SUM_E_BARE
Definition: QMCCostFunctionBase.h:60

qmcplusplus::QMCCostFunctionBatched::rank_local_num_samples_
int rank_local_num_samples_
Definition: QMCCostFunctionBatched.h:82

qmcplusplus::Matrix::size1
size_type size1() const
Definition: OhmmsMatrix.h:79

qmcplusplus::QMCCostFunctionBase::Etarget
Return_rt Etarget
target energy
Definition: QMCCostFunctionBase.h:205

qmcplusplus::QMCCostFunctionBase::d2LogPsi
std::vector< ParticleLaplacian * > d2LogPsi
Fixed Laplacian , , components.
Definition: QMCCostFunctionBase.h:301

qmcplusplus::CostFunctionCrowdData::getSharedResource
DriverWalkerResourceCollection & getSharedResource()
Definition: CostFunctionCrowdData.h:62

OutputManagerClass::pause
void pause()
Pause the summary and log streams.
Definition: OutputManager.cpp:50

Communicate::barrier
void barrier() const
Definition: Communicate.cpp:115

qmcplusplus::delete_iter
void delete_iter(IT first, IT last)
delete the pointers in [first,last)
Definition: IteratorUtility.h:22

qmcplusplus::Units::real
QMCTraits::RealType real
Definition: unit_conversion.h:23

qmcplusplus
helper functions for EinsplineSetBuilder
Definition: Configuration.h:43

qmcplusplus::QMCCostFunctionBase::SUM_WGTSQ
Definition: QMCCostFunctionBase.h:67

qmcplusplus::CostFunctionCrowdData::get_e2
Return_rt & get_e2()
Definition: CostFunctionCrowdData.h:57

qmcplusplus::QMCCostFunctionBatched::~QMCCostFunctionBatched
~QMCCostFunctionBatched() override
Destructor.

qmcplusplus::QMCCostFunctionBase::NumSamples
int NumSamples
global number of samples to use in correlated sampling
Definition: QMCCostFunctionBase.h:195

qmcplusplus::CostFunctionCrowdData::get_wgt
Return_rt & get_wgt()
Definition: CostFunctionCrowdData.h:59

qmcplusplus::QMCCostFunctionBatched::checkConfigurations
void checkConfigurations(EngineHandle &handle) override
evaluate everything before optimization
Definition: QMCCostFunctionBatched.cpp:223

qmcplusplus::QMCHamiltonian::getTWFDependentComponents
RefVector< OperatorBase > getTWFDependentComponents()
return components, auxH not included, depending on TWF.
Definition: QMCHamiltonian.cpp:969

qmcplusplus::QMCTraits::RealType
QTBase::RealType RealType
Definition: Configuration.h:58

qmcplusplus::CostFunctionCrowdData::get_log_psi_fixed
std::vector< Return_rt > & get_log_psi_fixed()
Definition: CostFunctionCrowdData.h:48

qmcplusplus::ParallelExecutor
Abstraction for running concurrent tasks in parallel by an executor executor workers can be OpenMP th...
Definition: ParallelExecutor.hpp:35

qmcplusplus::QMCCostFunctionBase::LOGPSI_FREE
Definition: QMCCostFunctionBase.h:52

qmcplusplus::abs
MakeReturn< UnaryNode< FnFabs, typename CreateLeaf< Vector< T1, C1 > >::Leaf_t > >::Expression_t abs(const Vector< T1, C1 > &l)
Definition: OhmmsVectorOperators.h:88

qmcplusplus::ParticleSet::getTotalNum
size_t getTotalNum() const
Definition: ParticleSet.h:493

qmcplusplus::timer_level_medium
Definition: NewTimer.h:47

DescentEngine.h

qmcplusplus::app_log
std::ostream & app_log()
Definition: OutputManager.h:65

qmcplusplus::QMCCostFunctionBase::equalVarMap
std::vector< TinyVector< int, 2 > > equalVarMap
index mapping for <equal> constraints
Definition: QMCCostFunctionBase.h:250

qmcplusplus::convertPtrToRefVectorSubset
static RefVector< T > convertPtrToRefVectorSubset(const std::vector< T *> &ptr_list, int offset, int len)
Definition: template_types.hpp:140

qmcplusplus::CostFunctionCrowdData::get_rng_save
RandomBase< FullPrecRealType > & get_rng_save()
Definition: CostFunctionCrowdData.h:52

qmcplusplus::QMCCostFunctionBase::SUM_ABSE_BARE
Definition: QMCCostFunctionBase.h:62

qmcplusplus::QMCCostFunctionBase::w_var
Return_rt w_var
Definition: QMCCostFunctionBase.h:201

qmcplusplus::QMCCostFunctionBase::NumOptimizables
int NumOptimizables
total number of optimizable variables
Definition: QMCCostFunctionBase.h:197

ParallelExecutor.hpp

optimize::VariableSet::setComputed
void setComputed()
Definition: VariableSet.h:210

qmcplusplus::QMCHamiltonian
Collection of Local Energy Operators.
Definition: QMCHamiltonian.h:49

qmcplusplus::QMCCostFunctionBase::EffectiveWeight
QMCTraits::QTFull::RealType EffectiveWeight
Definition: QMCCostFunctionBase.h:71

qmcplusplus::QMCCostFunctionBase::curAvg_w
Return_rt curAvg_w
current weighted average (correlated sampling)
Definition: QMCCostFunctionBase.h:217

qmcplusplus::SampleStack::getNumSamples
size_t getNumSamples() const
Definition: SampleStack.h:41

qmcplusplus::QMCCostFunctionBase::OptVariables
opt_variables_type OptVariables
list of optimizables
Definition: QMCCostFunctionBase.h:234

qmcplusplus::UPtrVector
std::vector< std::unique_ptr< T > > UPtrVector
Definition: template_types.hpp:38

qmcplusplus::CostFunctionCrowdData::get_h0_res
ResourceCollection & get_h0_res()
Definition: CostFunctionCrowdData.h:63

qmcplusplus::QMCCostFunctionBase::RngSaved
UPtrVector< RandomBase< FullPrecRealType > > RngSaved
Random number generators.
Definition: QMCCostFunctionBase.h:274

qmcplusplus::Matrix::resize
void resize(size_type n, size_type m)
Resize the container.
Definition: OhmmsMatrix.h:99

qmcplusplus::QMCCostFunctionBase::ParticleLaplacian
ParticleSet::ParticleLaplacian ParticleLaplacian
Definition: QMCCostFunctionBase.h:297

OHMMS::Controller
Communicate * Controller
Global Communicator for a process.
Definition: Communicate.cpp:35

qmcplusplus::QMCCostFunctionBase::ParticleGradient
ParticleSet::ParticleGradient ParticleGradient
Saved derivative properties and Hderivative properties of all the walkers.
Definition: QMCCostFunctionBase.h:296

qmcplusplus::QMCCostFunctionBase::ENERGY_NEW
Definition: QMCCostFunctionBase.h:55

qmcplusplus::convertUPtrToRefVector
static RefVector< T > convertUPtrToRefVector(const UPtrVector< T > &ptr_list)
convert a vector of std::unique_ptrs<T> to a refvector<T>
Definition: template_types.hpp:66

qmcplusplus::QMCCostFunctionBase::SUM_INDEX_SIZE
Definition: QMCCostFunctionBase.h:68

omptarget::min
T min(T a, T b)
Definition: OMPTargetMath.hpp:36

qmcplusplus::QMCCostFunctionBatched::GradCost
void GradCost(std::vector< Return_rt > &PGradient, const std::vector< Return_rt > &PM, Return_rt FiniteDiff=0) override
Definition: QMCCostFunctionBatched.cpp:51

qmcplusplus::RecordArray
Definition: RecordArray.hpp:25

qmcplusplus::QMCHamiltonian::mw_evaluate
static std::vector< QMCHamiltonian::FullPrecRealType > mw_evaluate(const RefVectorWithLeader< QMCHamiltonian > &ham_list, const RefVectorWithLeader< TrialWaveFunction > &wf_list, const RefVectorWithLeader< ParticleSet > &p_list)
batched version of evaluate for LocalEnergy
Definition: QMCHamiltonian.cpp:596

outputManager
OutputManagerClass outputManager(Verbosity::HIGH)

qmcplusplus::QMCCostFunctionBase::REWEIGHT
Definition: QMCCostFunctionBase.h:56

qmcplusplus::QMCHamiltonian::mw_evaluateValueAndDerivatives
static std::vector< QMCHamiltonian::FullPrecRealType > mw_evaluateValueAndDerivatives(const RefVectorWithLeader< QMCHamiltonian > &ham_list, const RefVectorWithLeader< TrialWaveFunction > &wf_list, const RefVectorWithLeader< ParticleSet > &p_list, const opt_variables_type &optvars, RecordArray< ValueType > &dlogpsi, RecordArray< ValueType > &dhpsioverpsi)
Definition: QMCHamiltonian.cpp:673

Communicate
Wrapping information on parallelism.
Definition: Communicate.h:68

Communicate::allreduce
void allreduce(T &)
Definition: CommOperatorsMPI.h:29

qmcplusplus::QMCCostFunctionBase::ENERGY_FIXED
Definition: QMCCostFunctionBase.h:54

qmcplusplus::pow
MakeReturn< BinaryNode< FnPow, typename CreateLeaf< Vector< T1, C1 > >::Leaf_t, typename CreateLeaf< Vector< T2, C2 > >::Leaf_t > >::Expression_t pow(const Vector< T1, C1 > &l, const Vector< T2, C2 > &r)
Definition: OhmmsVectorOperators.h:316

qmcplusplus::CostFunctionCrowdData::get_h_list
RefVector< QMCHamiltonian > get_h_list(int len)
Definition: CostFunctionCrowdData.cpp:75

OutputManagerClass::resume
void resume()
Resume the summary and log streams.
Definition: OutputManager.cpp:56

qmcplusplus::ParticleSet
Specialized paritlce class for atomistic simulations.
Definition: ParticleSet.h:55

qmcplusplus::QMCCostFunctionBase::dLogPsi
std::vector< ParticleGradient * > dLogPsi
Fixed Gradients , , components.
Definition: QMCCostFunctionBase.h:299

qmcplusplus::QMCCostFunctionBase::w_beta
Return_rt w_beta
Definition: QMCCostFunctionBase.h:223

qmcplusplus::EngineHandle
Definition: EngineHandle.h:28

qmcplusplus::QMCCostFunctionBase::w_w
Return_rt w_w
Definition: QMCCostFunctionBase.h:201

qmcplusplus::compute_batch_parameters
void compute_batch_parameters(int sample_size, int batch_size, int &num_batches, int &final_batch_size)
Compute number of batches and final batch size given the number of samples and a batch size...
Definition: QMCCostFunctionBatched.cpp:207

qmcplusplus::MPIObjectBase::myComm
Communicate * myComm
pointer to Communicate
Definition: MPIObjectBase.h:62

qmcplusplus::SampleStack
Definition: SampleStack.h:29

qmcplusplus::DriverWalkerResourceCollection::twf_res
ResourceCollection twf_res
Definition: DriverWalkerTypes.h:33

qmcplusplus::QMCCostFunctionBase::curAvg
Return_rt curAvg
current Average
Definition: QMCCostFunctionBase.h:213

qmcplusplus::DriverWalkerResourceCollection::pset_res
ResourceCollection pset_res
Definition: DriverWalkerTypes.h:32

qmcplusplus::CostFunctionCrowdData::get_p_list
RefVector< ParticleSet > get_p_list(int len)
Definition: CostFunctionCrowdData.cpp:65

qmcplusplus::QMCCostFunctionBase::SUM_WGT
Definition: QMCCostFunctionBase.h:66

qmcplusplus::createGlobalTimer
NewTimer & createGlobalTimer(const std::string &myname, timer_levels mylevel)
Definition: TimerManager.cpp:51

qmcplusplus::QMCCostFunctionBase::OptVariablesForPsi
opt_variables_type OptVariablesForPsi
full list of optimizables
Definition: QMCCostFunctionBase.h:242

optimize::VariableSet
class to handle a set of variables that can be modified during optimizations
Definition: VariableSet.h:49

qmcplusplus::TrialWaveFunction::mw_evaluateDeltaLog
static void mw_evaluateDeltaLog(const RefVectorWithLeader< TrialWaveFunction > &wf_list, const RefVectorWithLeader< ParticleSet > &p_list, std::vector< RealType > &logpsi_list, RefVector< ParticleSet::ParticleGradient > &dummyG_list, RefVector< ParticleSet::ParticleLaplacian > &dummyL_list, bool recompute=false)
evaluate the log value for optimizable parts of a many-body wave function
Definition: TrialWaveFunction.cpp:352

qmcplusplus::QMCCostFunctionBase::H
QMCHamiltonian & H
Hamiltonian.
Definition: QMCCostFunctionBase.h:183

qmcplusplus::QMCCostFunctionBase::w_en
Return_rt w_en
weights for energy and variance in the cost function
Definition: QMCCostFunctionBase.h:201

qmcplusplus::batch_size
int batch_size
Definition: test_cuBLAS_LU.cpp:219

APP_ABORT
#define APP_ABORT(msg)
Widely used but deprecated fatal error macros from legacy code.
Definition: AppAbort.h:27

qmcplusplus::QMCCostFunctionBase
Implements wave-function optimization.
Definition: QMCCostFunctionBase.h:46

qmcplusplus::exp
MakeReturn< UnaryNode< FnExp, typename CreateLeaf< Vector< T1, C1 > >::Leaf_t > >::Expression_t exp(const Vector< T1, C1 > &l)
Definition: OhmmsVectorOperators.h:80

qmcplusplus::QMCCostFunctionBase::W
ParticleSet & W
Particle set.
Definition: QMCCostFunctionBase.h:177

qmcplusplus::TrialWaveFunction::mw_evaluateDeltaLogSetup
static void mw_evaluateDeltaLogSetup(const RefVectorWithLeader< TrialWaveFunction > &wf_list, const RefVectorWithLeader< ParticleSet > &p_list, std::vector< RealType > &logpsi_fixed_list, std::vector< RealType > &logpsi_opt_list, RefVector< ParticleSet::ParticleGradient > &fixedG_list, RefVector< ParticleSet::ParticleLaplacian > &fixedL_list)
evaluate the sum of log value of optimizable many-body wavefunctions
Definition: TrialWaveFunction.cpp:294

qmcplusplus::QMCCostFunctionBase::SUM_E_WGT
Definition: QMCCostFunctionBase.h:63

qmcplusplus::QMCCostFunctionBase::isEffectiveWeightValid
bool isEffectiveWeightValid(EffectiveWeight effective_weight) const
check the validity of the effective weight calculated by correlatedSampling
Definition: QMCCostFunctionBase.cpp:1058

qmcplusplus::CostFunctionCrowdData::get_wgt2
Return_rt & get_wgt2()
Definition: CostFunctionCrowdData.h:60

optimize::VariableSet::size
size_type size() const
return the size
Definition: VariableSet.h:88

qmcplusplus::Units::charge::e
const real e
Definition: unit_conversion.h:78

qmcplusplus::CostFunctionCrowdData::get_e0
Return_rt & get_e0()
Definition: CostFunctionCrowdData.h:56

qmcplusplus::QMCCostFunctionBatched::resetPsi
void resetPsi(bool final_reset=false) override
reset the wavefunction
Definition: QMCCostFunctionBatched.cpp:440

qmcplusplus::conj
float conj(const float &c)
Workaround to allow conj on scalar to return real instead of complex.
Definition: complex_help.hpp:96

qmcplusplus::QMCCostFunctionBase::LOGPSI_FIXED
Definition: QMCCostFunctionBase.h:51

qmcplusplus::QMCCostFunctionBatched::correlatedSampling
EffectiveWeight correlatedSampling(bool needGrad=true) override
run correlated sampling return effective walkers ( w_i)^2/(Nw *  w^2_i)
Definition: QMCCostFunctionBatched.cpp:455

TrialWaveFunction.h
Declaration of a TrialWaveFunction.

qmcplusplus::DriverWalkerResourceCollection::ham_res
ResourceCollection ham_res
Definition: DriverWalkerTypes.h:34

qmcplusplus::CostFunctionCrowdData
Implements wave-function optimization.
Definition: CostFunctionCrowdData.h:28

qmcplusplus::QMCCostFunctionBase::ReportCounter
int ReportCounter
counter for output
Definition: QMCCostFunctionBase.h:199

qmcplusplus::OperatorBase
An abstract class for Local Energy operators.
Definition: OperatorBase.h:59

qmcplusplus::RefVector
std::vector< std::reference_wrapper< T > > RefVector
Definition: template_types.hpp:32

FairDivide
void FairDivide(int ntot, int npart, IV &adist)
Partition ntot over npart.
Definition: FairDivide.h:57

qmcplusplus::EngineHandle::prepareSampling
virtual void prepareSampling(int num_params, int num_samples)=0
Function for preparing derivative ratio vectors used by optimizer engines.

qmcplusplus::QMCCostFunctionBatched::HDerivRecords_
Matrix< Return_rt > HDerivRecords_
Definition: QMCCostFunctionBatched.h:75

qmcplusplus::TrialWaveFunction
Class to represent a many-body trial wave function.
Definition: TrialWaveFunction.h:60

qmcplusplus::CostFunctionCrowdData::get_h0_list
RefVector< QMCHamiltonian > get_h0_list(int len)
Definition: CostFunctionCrowdData.cpp:80

qmcplusplus::Matrix< Return_rt >

qmcplusplus::QMCCostFunctionBase::vmc_or_dmc
Return_rt vmc_or_dmc
Definition: QMCCostFunctionBase.h:224

qmcplusplus::QMCCostFunctionBatched::fill_timer_
NewTimer & fill_timer_
Definition: QMCCostFunctionBatched.h:89

qmcplusplus::QMCCostFunctionBatched::corr_sampling_timer_
NewTimer & corr_sampling_timer_
Definition: QMCCostFunctionBatched.h:88

qmcplusplus::QMCCostFunctionBase::SUM_ESQ_WGT
Definition: QMCCostFunctionBase.h:64

qmcplusplus::QMCCostFunctionBase::SumValue
std::vector< Return_rt > SumValue
Sum of energies and weights for averages.
Definition: QMCCostFunctionBase.h:284

qmcplusplus::ParticleSet::mw_update
static void mw_update(const RefVectorWithLeader< ParticleSet > &p_list, bool skipSK=false)
batched version of update
Definition: ParticleSet.cpp:362

qmcplusplus::QMCCostFunctionBase::needGrads
bool needGrads
Definition: QMCCostFunctionBase.h:225

qmcplusplus::CostFunctionCrowdData::get_log_psi_opt
std::vector< Return_rt > & get_log_psi_opt()
Definition: CostFunctionCrowdData.h:49

qmcplusplus::EngineHandle::takeSample
virtual void takeSample(const std::vector< FullPrecReal > &energy_list, const RecordArray< Value > &dlogpsi_array, const RecordArray< Value > &dhpsioverpsi_array, int base_sample_index)=0
Function for passing derivative ratios to optimizer engines.

qmcplusplus::CostFunctionCrowdData::get_wf_list
RefVector< TrialWaveFunction > get_wf_list(int len)
Definition: CostFunctionCrowdData.cpp:70

qmcplusplus::QMCCostFunctionBase::resetOptimizableObjects
void resetOptimizableObjects(TrialWaveFunction &psi, const opt_variables_type &opt_variables) const
Definition: QMCCostFunctionBase.cpp:1099

qmcplusplus::QMCCostFunctionBase::Psi
TrialWaveFunction & Psi
Trial function.
Definition: QMCCostFunctionBase.h:180

qmcplusplus::QMCCostFunctionBase::SUM_ABSE_WGT
Definition: QMCCostFunctionBase.h:65

qmcplusplus::QMCCostFunctionBase::getNumParams
int getNumParams() const override
return the number of optimizable parameters
Definition: QMCCostFunctionBase.h:103

qmcplusplus::Units::distance::pm
const real pm
Definition: unit_conversion.h:41

qmcplusplus::comm
Communicate * comm
Definition: test_EstimatorManagerNew.cpp:50

qmcplusplus::QMCCostFunctionBatched::RecordsOnNode_
Matrix< Return_rt > RecordsOnNode_
Definition: QMCCostFunctionBatched.h:70

qmcplusplus::ResourceCollectionTeamLock
handles acquire/release resource by the consumer (RefVectorWithLeader type).
Definition: ResourceCollection.h:58

qmcplusplus::QMCCostFunctionBase::MaxWeight
Return_rt MaxWeight
maximum weight beyond which the weight is set to 1
Definition: QMCCostFunctionBase.h:211

qmcplusplus::RefVectorWithLeader
Definition: RefVectorWithLeader.h:23

qmcplusplus::QMCCostFunctionBatched::samples_
SampleStack & samples_
Definition: QMCCostFunctionBatched.h:79

qmcplusplus::EngineHandle::finishSampling
virtual void finishSampling()=0
Function for having optimizer engines execute their sample_finish functions.

qmcplusplus::QMCCostFunctionBatched::walkers_per_crowd_
std::vector< int > walkers_per_crowd_
Definition: QMCCostFunctionBatched.h:85

qmcplusplus::QMCCostFunctionBase::SUM_ESQ_BARE
Definition: QMCCostFunctionBase.h:61

qmcplusplus::QMCCostFunctionBatched::QMCCostFunctionBatched
QMCCostFunctionBatched(ParticleSet &w, TrialWaveFunction &psi, QMCHamiltonian &h, SampleStack &samples, const std::vector< int > &walkers_per_crowd, Communicate *comm)
Constructor.
Definition: QMCCostFunctionBatched.cpp:30

qmcplusplus::CostFunctionCrowdData::get_rng_ptr_list
UPtrVector< RandomBase< FullPrecRealType > > & get_rng_ptr_list()
Definition: CostFunctionCrowdData.h:51

qmcplusplus::QMCCostFunctionBase::PowerE
int PowerE
|E-E_T|^PowerE is used for the cost function
Definition: QMCCostFunctionBase.h:191

qmcplusplus::DescentEngine
Definition: DescentEngine.h:27

qmcplusplus::QMCHamiltonian::setRandomGenerator
void setRandomGenerator(RandomBase< FullPrecRealType > *rng)
Definition: QMCHamiltonian.cpp:986

qmcplusplus::QMCCostFunctionBase::w_abs
Return_rt w_abs
Definition: QMCCostFunctionBase.h:201

qmcplusplus::QMCCostFunctionBatched::DerivRecords_
Matrix< Return_t > DerivRecords_
Temp derivative properties and Hderivative properties of all the walkers.
Definition: QMCCostFunctionBatched.h:74

qmcplusplus::CostFunctionCrowdData::zero_log_psi
void zero_log_psi()
Set the log_psi_* arrays to zero.
Definition: CostFunctionCrowdData.cpp:85

qmcplusplus::SampleStack::getGlobalNumSamples
size_t getGlobalNumSamples() const
Global number of samples is number of samples per rank * number of ranks.
Definition: SampleStack.h:45

CommOperators.h

qmcplusplus::QMCCostFunctionBase::curVar_w
Return_rt curVar_w
current weighted variance (correlated sampling)
Definition: QMCCostFunctionBase.h:219

MCWalkerConfiguration.h
Declaration of a MCWalkerConfiguration.

qmcplusplus::QMCCostFunctionBatched::fillOverlapHamiltonianMatrices
Return_rt fillOverlapHamiltonianMatrices(Matrix< Return_rt > &Left, Matrix< Return_rt > &Right) override
Definition: QMCCostFunctionBatched.cpp:698

CostFunctionCrowdData.h

qmcplusplus::QMCCostFunctionBatched::getConfigurations
void getConfigurations(const std::string &aroot) override
Definition: QMCCostFunctionBatched.cpp:171

qmcplusplus::Return_t
BareKineticEnergy::Return_t Return_t
Definition: BareKineticEnergy.cpp:29

qmcplusplus::QMCCostFunctionBatched::check_config_timer_
NewTimer & check_config_timer_
Definition: QMCCostFunctionBatched.h:87

qmcplusplus::QMCCostFunctionBase::setTargetEnergy
void setTargetEnergy(Return_rt et)
Definition: QMCCostFunctionBase.cpp:98

qmcplusplus::QMCCostFunctionBase::ENERGY_TOT
Definition: QMCCostFunctionBase.h:53

qmcplusplus::ScopeGuard
Definition: NewTimer.h:241

QMCCostFunctionBatched.h

qmcplusplus::QMCCostFunctionBase::EtargetEff
Return_rt EtargetEff
real target energy with the Correlation Factor
Definition: QMCCostFunctionBase.h:207

qmcplusplus::QMCCostFunctionBase::MoverRng
std::vector< RandomBase< FullPrecRealType > * > MoverRng
Definition: QMCCostFunctionBase.h:275