cuML C++ API: include/cuml/prims/opg/linalg/mm_aTa.hpp Source File

 /*

  * SPDX-FileCopyrightText: Copyright (c) 2019-2025, NVIDIA CORPORATION.

  * SPDX-License-Identifier: Apache-2.0

  */

 #pragma once


 #include "../matrix/data.hpp"

 #include "../matrix/part_descriptor.hpp"


 #include <raft/core/comms.hpp>

 #include <raft/core/handle.hpp>


 namespace MLCommon {

 namespace LinAlg {

 namespace opg {


 void mm_aTa(const raft::handle_t& handle,

             Matrix::Data<double>& out,

             const std::vector<Matrix::Data<double>*>& in1,

             const Matrix::PartDescriptor& in1Desc,

             cudaStream_t* streams,

             int n_streams);


 void mm_aTa(const raft::handle_t& handle,

             Matrix::Data<float>& out,

             const std::vector<Matrix::Data<float>*>& in1,

             const Matrix::PartDescriptor& in1Desc,

             cudaStream_t* streams,

             int n_streams);


 }  // end namespace opg

 }  // end namespace LinAlg

 }  // end namespace MLCommon

MLCommon::LinAlg::opg::mm_aTa
void mm_aTa(const raft::handle_t &handle, Matrix::Data< double > &out, const std::vector< Matrix::Data< double > * > &in1, const Matrix::PartDescriptor &in1Desc, cudaStream_t *streams, int n_streams)
performs MNMG A^T x A calculation.

MLCommon
Definition: comm_utils.h:11

MLCommon::Matrix::Data
This is a helper wrapper around the multi-gpu data blocks owned by a worker. It's design is NOT final...
Definition: data.hpp:18

MLCommon::Matrix::PartDescriptor
Definition: part_descriptor.hpp:40