faster pim host constant folding

2026-04-14 19:58:26 +02:00
parent 95ae93e07d
commit ae93d1c563
4 changed files with 94 additions and 41 deletions
--- a/src/PIM/Pass/PimCodegen/HostConstantFolding/Patterns/Constant.cpp
+++ b/src/PIM/Pass/PimCodegen/HostConstantFolding/Patterns/Constant.cpp
@@ -419,32 +419,16 @@ struct FoldConstantMemCpPattern final : OpRewritePattern<pim::PimMemCopyOp> {

    DenseElementsAttr foldedAttr;
    if (succeeded(srcSubview)) {
-      auto sourceType = dyn_cast<RankedTensorType>(denseAttr->getType());
-      if (!sourceType || !sourceType.hasStaticShape())
-        return failure();
      if (llvm::any_of(srcSubview->strides, [](int64_t stride) { return stride != 1; }))
        return failure();
      auto staticOffsets = getStaticSubviewOffsets(*srcSubview);
      if (failed(staticOffsets))
        return failure();

-      auto resultTensorType = RankedTensorType::get(allocType.getShape(), allocType.getElementType());
-      const int64_t numResultElements = resultTensorType.getNumElements();
-      auto sourceStrides = computeRowMajorStrides(sourceType.getShape());
-      auto resultStrides = computeRowMajorStrides(resultTensorType.getShape());
-      SmallVector<Attribute> sourceValues(denseAttr->getValues<Attribute>());
-      SmallVector<Attribute> resultValues(numResultElements);
-
-      for (int64_t i = 0; i < numResultElements; ++i) {
-        auto resultIndices = delinearizeIndex(i, resultTensorType.getShape(), resultStrides);
-        SmallVector<int64_t> sourceIndices;
-        sourceIndices.reserve(resultIndices.size());
-        for (auto [off, idx] : llvm::zip_equal(*staticOffsets, resultIndices))
-          sourceIndices.push_back(off + idx);
-        int64_t srcLinear = linearizeIndex(sourceIndices, sourceStrides);
-        resultValues[i] = sourceValues[srcLinear];
-      }
-      foldedAttr = DenseElementsAttr::get(resultTensorType, resultValues);
+      auto maybeFoldedAttr = foldDenseSubview(*denseAttr, *staticOffsets, allocType.getShape());
+      if (failed(maybeFoldedAttr))
+        return failure();
+      foldedAttr = *maybeFoldedAttr;
    }
    else {
      auto resultTensorType = RankedTensorType::get(allocType.getShape(), allocType.getElementType());