cuML C++ API: include/cuml/prims/opg/matrix/matrix_utils.hpp Source File

 /*

  * SPDX-FileCopyrightText: Copyright (c) 2019-2025, NVIDIA CORPORATION.

  * SPDX-License-Identifier: Apache-2.0

  */

 #pragma once

 #include "data.hpp"

 #include "part_descriptor.hpp"


 #include <raft/core/handle.hpp>

 #include <raft/random/rng.cuh>


 namespace MLCommon {

 namespace Matrix {

 namespace opg {


 void gatherPart(const raft::handle_t& h,

                 float* gatheredPart,

                 std::vector<Matrix::Data<float>*>& parts,

                 Matrix::PartDescriptor& desc,

                 int partIndex,

                 int rootRank,

                 int myRank,

                 cudaStream_t stream);


 void allGatherPart(const raft::handle_t& h,

                    float* gatheredPart,

                    std::vector<Matrix::Data<float>*>& parts,

                    Matrix::PartDescriptor& desc,

                    int partIndex,

                    int myRank,

                    cudaStream_t stream);

 void gather(const raft::handle_t& h,

             float* gatheredMatrix,

             std::vector<Matrix::Data<float>*>& parts,

             Matrix::PartDescriptor& desc,

             int rootRank,

             int myRank,

             cudaStream_t stream);


 void allGather(const raft::handle_t& h,

                float* gatheredMatrix,

                std::vector<Matrix::Data<float>*>& parts,

                Matrix::PartDescriptor& desc,

                int myRank,

                cudaStream_t stream);


 void allocate(const raft::handle_t& h,

               std::vector<Matrix::Data<float>*>& parts,

               Matrix::PartDescriptor& desc,

               int myRank,

               cudaStream_t stream);


 void deallocate(const raft::handle_t& h,

                 std::vector<Matrix::Data<float>*>& parts,

                 Matrix::PartDescriptor& desc,

                 int myRank,

                 cudaStream_t stream);


 void randomize(const raft::handle_t& h,

                raft::random::Rng& r,

                std::vector<Matrix::Data<float>*>& parts,

                Matrix::PartDescriptor& desc,

                int myRank,

                cudaStream_t stream,

                float low  = -1.0f,

                float high = 1.0f);


 void reset(const raft::handle_t& h,

            std::vector<Matrix::Data<float>*>& parts,

            Matrix::PartDescriptor& desc,

            int myRank,

            cudaStream_t stream);


 void printRaw2D(float* buffer, int rows, int cols, bool isColMajor, cudaStream_t stream);


 void print(const raft::handle_t& h,

            std::vector<Matrix::Data<float>*>& parts,

            Matrix::PartDescriptor& desc,

            const char* matrixName,

            int myRank,

            cudaStream_t stream);


 //------------------------------------------------------------------------------


 void gatherPart(const raft::handle_t& h,

                 double* gatheredPart,

                 std::vector<Matrix::Data<double>*>& parts,

                 Matrix::PartDescriptor& desc,

                 int partIndex,

                 int rootRank,

                 int myRank,

                 cudaStream_t stream);


 void allGatherPart(const raft::handle_t& h,

                    double* gatheredPart,

                    std::vector<Matrix::Data<double>*>& parts,

                    Matrix::PartDescriptor& desc,

                    int partIndex,

                    int myRank,

                    cudaStream_t stream);


 void gather(const raft::handle_t& h,

             double* gatheredMatrix,

             std::vector<Matrix::Data<double>*>& parts,

             Matrix::PartDescriptor& desc,

             int rootRank,

             int myRank,

             cudaStream_t stream);


 void allGather(const raft::handle_t& h,

                double* gatheredMatrix,

                std::vector<Matrix::Data<double>*>& parts,

                Matrix::PartDescriptor& desc,

                int myRank,

                cudaStream_t stream);


 void allocate(const raft::handle_t& h,

               std::vector<Matrix::Data<double>*>& parts,

               Matrix::PartDescriptor& desc,

               int myRank,

               cudaStream_t stream);


 void deallocate(const raft::handle_t& h,

                 std::vector<Matrix::Data<double>*>& parts,

                 Matrix::PartDescriptor& desc,

                 int myRank,

                 cudaStream_t stream);


 void randomize(const raft::handle_t& h,

                raft::random::Rng& r,

                std::vector<Matrix::Data<double>*>& parts,

                Matrix::PartDescriptor& desc,

                int myRank,

                cudaStream_t stream,

                double low  = -1.0,

                double high = 1.0);


 void reset(const raft::handle_t& h,

            std::vector<Matrix::Data<double>*>& parts,

            Matrix::PartDescriptor& desc,

            int myRank,

            cudaStream_t stream);


 void printRaw2D(double* buffer, int rows, int cols, bool isColMajor, cudaStream_t stream);


 void print(const raft::handle_t& h,

            std::vector<Matrix::Data<double>*>& parts,

            Matrix::PartDescriptor& desc,

            const char* matrixName,

            int myRank,

            cudaStream_t stream);

 }  // end namespace opg

 }  // namespace Matrix

 }  // end namespace MLCommon

data.hpp

MLCommon::Matrix::opg::printRaw2D
void printRaw2D(float *buffer, int rows, int cols, bool isColMajor, cudaStream_t stream)

MLCommon::Matrix::opg::allGather
void allGather(const raft::handle_t &h, float *gatheredMatrix, std::vector< Matrix::Data< float > * > &parts, Matrix::PartDescriptor &desc, int myRank, cudaStream_t stream)

MLCommon::Matrix::opg::gather
void gather(const raft::handle_t &h, float *gatheredMatrix, std::vector< Matrix::Data< float > * > &parts, Matrix::PartDescriptor &desc, int rootRank, int myRank, cudaStream_t stream)

MLCommon::Matrix::opg::deallocate
void deallocate(const raft::handle_t &h, std::vector< Matrix::Data< float > * > &parts, Matrix::PartDescriptor &desc, int myRank, cudaStream_t stream)

MLCommon::Matrix::opg::allGatherPart
void allGatherPart(const raft::handle_t &h, float *gatheredPart, std::vector< Matrix::Data< float > * > &parts, Matrix::PartDescriptor &desc, int partIndex, int myRank, cudaStream_t stream)

MLCommon::Matrix::opg::randomize
void randomize(const raft::handle_t &h, raft::random::Rng &r, std::vector< Matrix::Data< float > * > &parts, Matrix::PartDescriptor &desc, int myRank, cudaStream_t stream, float low=-1.0f, float high=1.0f)

MLCommon::Matrix::opg::reset
void reset(const raft::handle_t &h, std::vector< Matrix::Data< float > * > &parts, Matrix::PartDescriptor &desc, int myRank, cudaStream_t stream)

MLCommon::Matrix::opg::print
void print(const raft::handle_t &h, std::vector< Matrix::Data< float > * > &parts, Matrix::PartDescriptor &desc, const char *matrixName, int myRank, cudaStream_t stream)

MLCommon::Matrix::opg::gatherPart
void gatherPart(const raft::handle_t &h, float *gatheredPart, std::vector< Matrix::Data< float > * > &parts, Matrix::PartDescriptor &desc, int partIndex, int rootRank, int myRank, cudaStream_t stream)

MLCommon::Matrix::opg::allocate
void allocate(const raft::handle_t &h, std::vector< Matrix::Data< float > * > &parts, Matrix::PartDescriptor &desc, int myRank, cudaStream_t stream)

MLCommon
Definition: comm_utils.h:11

part_descriptor.hpp

MLCommon::Matrix::Data
This is a helper wrapper around the multi-gpu data blocks owned by a worker. It's design is NOT final...
Definition: data.hpp:18

MLCommon::Matrix::PartDescriptor
Definition: part_descriptor.hpp:40