add .clang-format

reformat all src
2026-02-26 19:16:42 +01:00
parent a2c31836ae
commit 810e5e75f9
32 changed files with 902 additions and 953 deletions
--- a/src/PIM/Conversion/ONNXToSpatial/Math/Conv.cpp
+++ b/src/PIM/Conversion/ONNXToSpatial/Math/Conv.cpp
@@ -11,20 +11,21 @@
 #include "mlir/IR/Value.h"
 #include "mlir/Support/LLVM.h"
 #include "mlir/Transforms/DialectConversion.h"
-#include "src/Accelerators/PIM/Common/PIMCommon.hpp"
-#include "src/Accelerators/PIM/Compiler/PimCompilerOptions.hpp"
-#include "src/Accelerators/PIM/Dialect/Spatial/SpatialOps.hpp"
-#include "src/Dialect/ONNX/ONNXOps.hpp"

-#include "src/Accelerators/PIM/Conversion/ONNXToSpatial/ONNXToSpatialCommon.hpp"
 #include "llvm/ADT/SmallVector.h"
 #include "llvm/Support/LogicalResult.h"
-#include <cstddef>

+#include <cstddef>
 #include <memory>
 #include <unordered_map>
 #include <vector>

+#include "src/Accelerators/PIM/Common/PIMCommon.hpp"
+#include "src/Accelerators/PIM/Compiler/PimCompilerOptions.hpp"
+#include "src/Accelerators/PIM/Conversion/ONNXToSpatial/ONNXToSpatialCommon.hpp"
+#include "src/Accelerators/PIM/Dialect/Spatial/SpatialOps.hpp"
+#include "src/Dialect/ONNX/ONNXOps.hpp"
+
 using namespace mlir;
 using namespace std;

@@ -40,8 +41,8 @@ namespace onnx_mlir {
 */
 class Core {
 public:
-  Core(const size_t coreId, ConversionPatternRewriter &rewriter)
-      : coreId(coreId), rewriter(rewriter) {}
+  Core(const size_t coreId, ConversionPatternRewriter& rewriter)
+  : coreId(coreId), rewriter(rewriter) {}

  /**
   * @brief Add a MVM operation to the core.
@@ -52,8 +53,7 @@ public:
   * @param mvmOutType The result's shape.
   * @return Value The result of the MVM operation.
   */
-  Value addMVM(
-      Value inputTile, size_t xbarIndex, size_t outputTileId, Type mvmOutType) {
+  Value addMVM(Value inputTile, size_t xbarIndex, size_t outputTileId, Type mvmOutType) {
    // Use the inputTile as the reference location for the MVM operation.
    Location loc = inputTile.getLoc();

@@ -72,8 +72,7 @@ public:
    // is correct.

    // Construct the MVM operation
-    Value result = rewriter.create<spatial::SpatWeightedMVMOp>(
-        loc, mvmOutType, xbarIndex, operand);
+    Value result = rewriter.create<spatial::SpatWeightedMVMOp>(loc, mvmOutType, xbarIndex, operand);

    // Since we are within the same core and no computation can happen in
    // paralllel, we can just apply a linear reduction in case we have multiple
@@ -84,8 +83,7 @@ public:
    if (lastMVM != outputTileToMVM.end()) {
      // MVM results should have the same type for reduction.
      assert(lastMVM->second.getType() == result.getType());
-      result = rewriter.create<spatial::SpatVAddOp>(
-          loc, mvmOutType, lastMVM->second, result);
+      result = rewriter.create<spatial::SpatVAddOp>(loc, mvmOutType, lastMVM->second, result);
    }

    outputTileToMVM[outputTileId] = result;
@@ -139,16 +137,14 @@ public:
  spatial::SpatWeightedCompute createWComputeOp(Location loc) {
    // Get the shape of the results.
    SmallVector<Type> resultTypes;
-    for (const auto &value : results) {
+    for (const auto& value : results)
      resultTypes.push_back(value.getType());
-    }

    // Create the WComputeOp, with non-remappable operands only.
-    wcomputeOp = rewriter.create<spatial::SpatWeightedCompute>(
-        loc, resultTypes, xbarWeights, operands);
+    wcomputeOp = rewriter.create<spatial::SpatWeightedCompute>(loc, resultTypes, xbarWeights, operands);

    // Add the body to the WComputeOp.
-    Block *releasedBlock = block.release();
+    Block* releasedBlock = block.release();
    wcomputeOp.getBody().push_back(releasedBlock);

    // Add the `yieldOp` at the end, with the results.
@@ -164,21 +160,18 @@ public:
  void remapResults() {
    // Remap all the results to the WComputeOp results.
    assert(resultsToRemap.size() == wcomputeOp->getNumResults());
-    for (size_t i = 0; i < resultsToRemap.size(); i++) {
+    for (size_t i = 0; i < resultsToRemap.size(); i++)
      *resultsToRemap[i] = wcomputeOp.getResult(i);
-    }
  }

  void addRemappedOperands() {
    // Insert the remappableOperands (which were remapped in
    // `addRemappableOperand` of another Core)
-    for (auto remappedValue : remappableOperands) {
+    for (auto remappedValue : remappableOperands)
      wcomputeOp->insertOperands(wcomputeOp->getNumOperands(), *remappedValue);
-    }

    // Update the wcomputeOp operandSegmentSize
-    incrementWeightedComputeInputsSegmentSize(
-        wcomputeOp, static_cast<int>(remappableOperands.size()));
+    incrementWeightedComputeInputsSegmentSize(wcomputeOp, static_cast<int>(remappableOperands.size()));
  }

  size_t addXbarWeight(Value weight) {
@@ -199,31 +192,27 @@ public:
    llvm::outs() << "Core " << coreId << ":\n";
    // Print the weights
    llvm::outs() << "Xbar Weights:\n";
-    for (auto weight : xbarWeights) {
+    for (auto weight : xbarWeights)
      weight.dump();
-    }
    // Print the operands
    llvm::outs() << "Operands:\n";
-    for (auto operand : operands) {
+    for (auto operand : operands)
      llvm::outs() << operand << "\n";
-    }

    // Dump the body block
-    for (auto &op : block->getOperations()) {
+    for (auto& op : block->getOperations())
      op.dump();
-    }

    // Print the results
    llvm::outs() << "Results:\n";
-    for (auto result : results) {
+    for (auto result : results)
      llvm::outs() << result << "\n";
-    }
  }

  const size_t coreId;

 private:
-  ConversionPatternRewriter &rewriter;
+  ConversionPatternRewriter& rewriter;

  // Should these be set<Value> instead? But I need to keep the order
  vector<Value> operands;
@@ -246,15 +235,16 @@ private:
 };

 struct ONNXConvOpTile : public OpConversionPattern<ONNXConvOp> {
-  ONNXConvOpTile(MLIRContext *ctx) : OpConversionPattern(ctx) {}
+  ONNXConvOpTile(MLIRContext* ctx)
+  : OpConversionPattern(ctx) {}

  struct Producer_t {
    Value value;
    shared_ptr<Core> core;
  };

-  LogicalResult matchAndRewrite(ONNXConvOp conv, ONNXConvOpAdaptor convAdaptor,
-      ConversionPatternRewriter &rewriter) const final {
+  LogicalResult
+  matchAndRewrite(ONNXConvOp conv, ONNXConvOpAdaptor convAdaptor, ConversionPatternRewriter& rewriter) const final {
    ShapedType xShape = mlir::cast<ShapedType>(convAdaptor.getX().getType());
    ShapedType wShape = mlir::cast<ShapedType>(convAdaptor.getW().getType());
    ShapedType bShape = mlir::cast<ShapedType>(convAdaptor.getB().getType());
@@ -264,11 +254,9 @@ struct ONNXConvOpTile : public OpConversionPattern<ONNXConvOp> {
    unpackOptionalPairVector(conv.getStrides(), stride_x, stride_y);
    unpackOptionalPairVector(conv.getDilations(), dilation_x, dilation_y);

-    auto padUnpackError =
-        unpackOptionalPadsVector(convAdaptor.getPads(), pad_x, pad_y);
-    if (padUnpackError.has_value()) {
+    auto padUnpackError = unpackOptionalPadsVector(convAdaptor.getPads(), pad_x, pad_y);
+    if (padUnpackError.has_value())
      return rewriter.notifyMatchFailure(conv, padUnpackError.value());
-    }

    // TODO: Pad value at beginning and end of each dimension could be
    // different. We should handle this case.
@@ -296,11 +284,9 @@ struct ONNXConvOpTile : public OpConversionPattern<ONNXConvOp> {

    Location loc = conv.getLoc();

-    size_t inputTileCount =
-        ceilIntegerDivide(GET_IMAGE_CHANNEL(xShape), crossbarSize.getValue());
+    size_t inputTileCount = ceilIntegerDivide(GET_IMAGE_CHANNEL(xShape), crossbarSize.getValue());
    size_t inputTileRemainder = GET_IMAGE_CHANNEL(xShape) % crossbarSize;
-    size_t outputTileCount =
-        ceilIntegerDivide(GET_IMAGE_CHANNEL(yShape), crossbarSize.getValue());
+    size_t outputTileCount = ceilIntegerDivide(GET_IMAGE_CHANNEL(yShape), crossbarSize.getValue());
    size_t outputTileRemainder = GET_IMAGE_CHANNEL(yShape) % crossbarSize;

    // Tile the input tensor
@@ -310,22 +296,20 @@ struct ONNXConvOpTile : public OpConversionPattern<ONNXConvOp> {
    //    c. Pixel `y` position
    // For example: inputTiles[channelTile][x][y]
    // Example complete input tensor: tensor<1x3x6x6xf32> (NxCxWxH)
-    SmallVector<SmallVector<SmallVector<Value>>> inputTiles(inputTileCount,
-        SmallVector<SmallVector<Value>>(input_w, SmallVector<Value>(input_h)));
+    SmallVector<SmallVector<SmallVector<Value>>> inputTiles(
+      inputTileCount, SmallVector<SmallVector<Value>>(input_w, SmallVector<Value>(input_h)));

-    auto resolveErrorOpt = resolveImgInputTiles(convAdaptor.getX(), inputTiles,
-        inputTileCount, inputTileRemainder, input_h, input_h, rewriter);
-    if (resolveErrorOpt.has_value()) {
+    auto resolveErrorOpt = resolveImgInputTiles(
+      convAdaptor.getX(), inputTiles, inputTileCount, inputTileRemainder, input_h, input_h, rewriter);
+    if (resolveErrorOpt.has_value())
      return rewriter.notifyMatchFailure(conv, *resolveErrorOpt);
-    }

-    SmallVector<OpFoldResult> strides =
-        SmallVector<OpFoldResult>(4, rewriter.getIndexAttr(1));
-    SmallVector<OpFoldResult> offsets =
-        SmallVector<OpFoldResult>(4, rewriter.getIndexAttr(0));
-    SmallVector<OpFoldResult> sizes = SmallVector<OpFoldResult>{
-        rewriter.getIndexAttr(1), rewriter.getIndexAttr(crossbarSize),
-        rewriter.getIndexAttr(1), rewriter.getIndexAttr(1)};
+    SmallVector<OpFoldResult> strides = SmallVector<OpFoldResult>(4, rewriter.getIndexAttr(1));
+    SmallVector<OpFoldResult> offsets = SmallVector<OpFoldResult>(4, rewriter.getIndexAttr(0));
+    SmallVector<OpFoldResult> sizes = SmallVector<OpFoldResult> {rewriter.getIndexAttr(1),
+                                                                 rewriter.getIndexAttr(crossbarSize),
+                                                                 rewriter.getIndexAttr(1),
+                                                                 rewriter.getIndexAttr(1)};

    // Tile the weight tensor
    // Weight tiles need to be indexed by:
@@ -336,31 +320,30 @@ struct ONNXConvOpTile : public OpConversionPattern<ONNXConvOp> {
    // For example: weightTiles[filterTile][channelTile][x][y]
    // Example complete weight tensor: tensor<32x3x3x3xf32> (FxCxWxH)
    SmallVector<SmallVector<SmallVector<SmallVector<Value>>>> weightTiles(
-        outputTileCount,
-        SmallVector<SmallVector<SmallVector<Value>>>(inputTileCount,
-            SmallVector<SmallVector<Value>>(krn_w, SmallVector<Value>(krn_h))));
+      outputTileCount,
+      SmallVector<SmallVector<SmallVector<Value>>>(inputTileCount,
+                                                   SmallVector<SmallVector<Value>>(krn_w, SmallVector<Value>(krn_h))));
    strides = SmallVector<OpFoldResult>(4, rewriter.getIndexAttr(1));
    offsets = SmallVector<OpFoldResult>(4, rewriter.getIndexAttr(0));
    sizes = {rewriter.getIndexAttr(crossbarSize),
-        rewriter.getIndexAttr(crossbarSize), rewriter.getIndexAttr(1),
-        rewriter.getIndexAttr(1)};
+             rewriter.getIndexAttr(crossbarSize),
+             rewriter.getIndexAttr(1),
+             rewriter.getIndexAttr(1)};
    for (size_t i = 0; i < outputTileCount; i++) {
-      if (i == outputTileCount - 1 && outputTileRemainder != 0) {
+      if (i == outputTileCount - 1 && outputTileRemainder != 0)
        sizes[0] = rewriter.getIndexAttr(outputTileRemainder);
-      }
      sizes[1] = rewriter.getIndexAttr(crossbarSize);
      offsets[0] = rewriter.getIndexAttr(i * crossbarSize);
      for (size_t j = 0; j < inputTileCount; j++) {
-        if (j == inputTileCount - 1 && inputTileRemainder != 0) {
+        if (j == inputTileCount - 1 && inputTileRemainder != 0)
          sizes[1] = rewriter.getIndexAttr(inputTileRemainder);
-        }
        for (size_t x = 0; x < krn_w; x++) {
          for (size_t y = 0; y < krn_h; y++) {
            offsets[1] = rewriter.getIndexAttr(j * crossbarSize);
            offsets[2] = rewriter.getIndexAttr(x);
            offsets[3] = rewriter.getIndexAttr(y);
-            weightTiles[i][j][x][y] = rewriter.create<tensor::ExtractSliceOp>(
-                loc, convAdaptor.getW(), offsets, sizes, strides);
+            weightTiles[i][j][x][y] =
+              rewriter.create<tensor::ExtractSliceOp>(loc, convAdaptor.getW(), offsets, sizes, strides);
          }
        }
      }
@@ -379,56 +362,45 @@ struct ONNXConvOpTile : public OpConversionPattern<ONNXConvOp> {
    // For example: outputTiles[filterTile][x][y]
    // Example complete output tensor: tensor<1x32x3x3xf32> (NxFxWxH)
    SmallVector<SmallVector<SmallVector<shared_ptr<Value>>>> outputTiles(
-        outputTileCount,
-        SmallVector<SmallVector<shared_ptr<Value>>>(
-            output_w, SmallVector<shared_ptr<Value>>(output_h, nullptr)));
+      outputTileCount,
+      SmallVector<SmallVector<shared_ptr<Value>>>(output_w, SmallVector<shared_ptr<Value>>(output_h, nullptr)));

    size_t replicationFactor;
-    if (!conv->hasAttr(REPLICATION_ATTR_NAME)) {
+    if (!conv->hasAttr(REPLICATION_ATTR_NAME))
      replicationFactor = 1;
-    } else {
-      replicationFactor =
-          conv->getAttrOfType<IntegerAttr>(REPLICATION_ATTR_NAME).getInt();
-    }
+    else
+      replicationFactor = conv->getAttrOfType<IntegerAttr>(REPLICATION_ATTR_NAME).getInt();
    // producers[outTile][out_x][out_y][producerIndex]
-    vector<vector<vector<vector<Producer_t>>>> producers =
-        vector<vector<vector<vector<Producer_t>>>>(outputTileCount,
-            vector<vector<vector<Producer_t>>>(output_w,
-                vector<vector<Producer_t>>(output_h, vector<Producer_t>())));
+    vector<vector<vector<vector<Producer_t>>>> producers = vector<vector<vector<vector<Producer_t>>>>(
+      outputTileCount,
+      vector<vector<vector<Producer_t>>>(output_w, vector<vector<Producer_t>>(output_h, vector<Producer_t>())));

    // Schedule in cores
    size_t coreId = 0;
    vector<shared_ptr<Core>> curCores(replicationFactor);
-    for (size_t i = 0; i < replicationFactor; i++) {
+    for (size_t i = 0; i < replicationFactor; i++)
      curCores[i] = make_shared<Core>(coreId++, rewriter);
-    }

    vector<shared_ptr<Core>> cores;

-    const size_t replicationSliceSize =
-        ceilIntegerDivide(input_w, replicationFactor);
+    const size_t replicationSliceSize = ceilIntegerDivide(input_w, replicationFactor);

    for (size_t krn_x = 0; krn_x < krn_h; krn_x++) {
      for (size_t krn_y = 0; krn_y < krn_w; krn_y++) {

        RankedTensorType mvmOutType =
-            RankedTensorType::get({1, static_cast<long>(crossbarSize), 1, 1},
-                bShape.getElementType());
+          RankedTensorType::get({1, static_cast<long>(crossbarSize), 1, 1}, bShape.getElementType());

        for (size_t outTile = 0; outTile < outputTileCount; outTile++) {

-          if (outTile == outputTileCount - 1 && outputTileRemainder != 0) {
-            mvmOutType = mvmOutType.clone(
-                {1, static_cast<long>(outputTileRemainder), 1, 1});
-          }
+          if (outTile == outputTileCount - 1 && outputTileRemainder != 0)
+            mvmOutType = mvmOutType.clone({1, static_cast<long>(outputTileRemainder), 1, 1});

          for (size_t inTile = 0; inTile < inputTileCount; inTile++) {

            vector<size_t> xbarIndexes(replicationFactor);
-            for (size_t i = 0; i < replicationFactor; i++) {
-              xbarIndexes[i] = curCores[i]->addXbarWeight(
-                  weightTiles[outTile][inTile][krn_x][krn_y]);
-            }
+            for (size_t i = 0; i < replicationFactor; i++)
+              xbarIndexes[i] = curCores[i]->addXbarWeight(weightTiles[outTile][inTile][krn_x][krn_y]);

            size_t out_x = 0;
            for (size_t in_x = 0; in_x < input_w; in_x += stride_x) {
@@ -443,25 +415,20 @@ struct ONNXConvOpTile : public OpConversionPattern<ONNXConvOp> {

              for (size_t in_y = 0; in_y < input_h; in_y += stride_y) {
                // Adjust the input based on the kernel
-                int actual_in_x = in_x - ((int)krn_w / 2) + krn_x * dilation_x;
-                int actual_in_y = in_y - ((int)krn_h / 2) + krn_y * dilation_y;
+                int actual_in_x = in_x - ((int) krn_w / 2) + krn_x * dilation_x;
+                int actual_in_y = in_y - ((int) krn_h / 2) + krn_y * dilation_y;

                // Check if we are within the input image
-                if (verifyWithinBoundsAndPaddings(input_w, input_h, actual_in_x,
-                        actual_in_y, pad_x, pad_y)
-                        .failed()) {
+                if (verifyWithinBoundsAndPaddings(input_w, input_h, actual_in_x, actual_in_y, pad_x, pad_y).failed()) {
                  out_y++;
                  continue;
                }

-                size_t outTileId =
-                    outTile * output_w * output_h + out_x * output_h + out_y;
+                size_t outTileId = outTile * output_w * output_h + out_x * output_h + out_y;
                auto mvm = curCores[coreIndex]->addMVM(
-                    inputTiles[inTile][actual_in_x][actual_in_y],
-                    xbarIndexes[coreIndex], outTileId, mvmOutType);
+                  inputTiles[inTile][actual_in_x][actual_in_y], xbarIndexes[coreIndex], outTileId, mvmOutType);

-                producers[outTile][out_x][out_y].push_back(
-                    {mvm, curCores[coreIndex]});
+                producers[outTile][out_x][out_y].push_back({mvm, curCores[coreIndex]});

                out_y++;
              }
@@ -481,11 +448,9 @@ struct ONNXConvOpTile : public OpConversionPattern<ONNXConvOp> {
      }
    }

-    for (auto &curCore : curCores) {
-      if (curCore->isCoreEmpty() == false) {
+    for (auto& curCore : curCores)
+      if (curCore->isCoreEmpty() == false)
        cores.emplace_back(std::move(curCore));
-      }
-    }
    curCores.clear();
    // Now, do the reduction of each output pixel tile
    for (size_t outTile = 0; outTile < outputTileCount; outTile++) {
@@ -497,9 +462,8 @@ struct ONNXConvOpTile : public OpConversionPattern<ONNXConvOp> {
          // core.

          std::unordered_map<size_t, Producer_t> withinCoreReducedProducers;
-          for (auto producer : producers[outTile][out_x][out_y]) {
+          for (auto producer : producers[outTile][out_x][out_y])
            withinCoreReducedProducers[producer.core->coreId] = producer;
-          }

          // Now, we need to apply inter-core reduction

@@ -509,8 +473,7 @@ struct ONNXConvOpTile : public OpConversionPattern<ONNXConvOp> {

            auto singleProducer = withinCoreReducedProducers.begin()->second;
            // Use last producer as the final result
-            auto reducedValue =
-                singleProducer.core->makeResultRemappable(singleProducer.value);
+            auto reducedValue = singleProducer.core->makeResultRemappable(singleProducer.value);
            outputTiles[outTile][out_x][out_y] = reducedValue;
            continue;
          }
@@ -535,9 +498,9 @@ struct ONNXConvOpTile : public OpConversionPattern<ONNXConvOp> {
            auto lastProducerCoreId = lastProducer.core->coreId;
            auto curProducerCoreId = curProducer.core->coreId;

-            assert(lastProducerCoreId != curProducerCoreId &&
-                   "We should have already applied within-core reduction, how "
-                   "could we have same cores here?");
+            assert(lastProducerCoreId != curProducerCoreId
+                   && "We should have already applied within-core reduction, how "
+                      "could we have same cores here?");

            // Sort the cores by coreId
            if (curProducerCoreId < lastProducerCoreId) {
@@ -545,7 +508,8 @@ struct ONNXConvOpTile : public OpConversionPattern<ONNXConvOp> {
              core1Value = curProducer.value;
              core2 = lastProducer.core;
              core2Value = lastProducer.value;
-            } else {
+            }
+            else {
              core1 = lastProducer.core;
              core1Value = lastProducer.value;
              core2 = curProducer.core;
@@ -556,9 +520,8 @@ struct ONNXConvOpTile : public OpConversionPattern<ONNXConvOp> {
            auto secondCoreBlockArg = core2->addRemappableOperand(newCoreRes);

            rewriter.setInsertionPointAfterValue(core2Value);
-            Value vaddRes =
-                rewriter.create<spatial::SpatVAddOp>(core2Value.getLoc(),
-                    core2Value.getType(), core2Value, secondCoreBlockArg);
+            Value vaddRes = rewriter.create<spatial::SpatVAddOp>(
+              core2Value.getLoc(), core2Value.getType(), core2Value, secondCoreBlockArg);

            lastProducer = {vaddRes, core2};

@@ -568,8 +531,7 @@ struct ONNXConvOpTile : public OpConversionPattern<ONNXConvOp> {
          // TODO: Add the bias and apply mapping (if present)

          // Use last producer as the final result
-          auto reducedValue =
-              lastProducer.core->makeResultRemappable(lastProducer.value);
+          auto reducedValue = lastProducer.core->makeResultRemappable(lastProducer.value);
          outputTiles[outTile][out_x][out_y] = reducedValue;
        }
      }
@@ -578,15 +540,14 @@ struct ONNXConvOpTile : public OpConversionPattern<ONNXConvOp> {
    // Now, we need to turn the cores into a spatial::SpatWeightedCompute.
    rewriter.setInsertionPointAfter(conv);
    spatial::SpatWeightedCompute lastWComputeOp;
-    for (auto &core : cores) {
+    for (auto& core : cores) {
      lastWComputeOp = core->createWComputeOp(loc);
      core->remapResults();
      rewriter.setInsertionPointAfter(lastWComputeOp);
    }

-    for (auto &core : cores) {
+    for (auto& core : cores)
      core->addRemappedOperands();
-    }

    // Set the insertion point after the last WComputeOp.
    rewriter.setInsertionPointAfter(lastWComputeOp);
@@ -597,8 +558,7 @@ struct ONNXConvOpTile : public OpConversionPattern<ONNXConvOp> {
        for (size_t outTile = 0; outTile < outputTileCount; outTile++)
          tilesToConcat.push_back(*outputTiles[outTile][outX][outY]);

-    Value outputImage = rewriter.create<spatial::SpatImgConcatOp>(
-        loc, conv.getY().getType(), tilesToConcat);
+    Value outputImage = rewriter.create<spatial::SpatImgConcatOp>(loc, conv.getY().getType(), tilesToConcat);

    // Value outputImage =
    //     createImgConcatOp(outputTiles, rewriter, loc, Y.getType());
@@ -616,9 +576,8 @@ struct ONNXConvOpTile : public OpConversionPattern<ONNXConvOp> {
  }
 };

-void populateTilingConvOpPattern(
-    RewritePatternSet &patterns, MLIRContext *ctx) {
+void populateTilingConvOpPattern(RewritePatternSet& patterns, MLIRContext* ctx) {
  patterns.insert<ONNXConvOpTile>(ctx);
 }

-} // namespace onnx_mlir
+} // namespace onnx_mlir