huggingface · fxmarty · Jun 28, 2023 · Jun 23, 2023 · Jun 23, 2023 · Jun 26, 2023
diff --git a/optimum/bettertransformer/models/encoder_models.py b/optimum/bettertransformer/models/encoder_models.py
@@ -639,7 +639,7 @@ def forward(self, x, attn_mask, head_mask=None, output_attentions=None, *_):
  attn_mask = torch.reshape(attn_mask, (attn_mask.shape[0], attn_mask.shape[-1]))
  seqlen = attn_mask.shape[1]
  lengths = torch.sum(~attn_mask, 1)
- if not all([l == seqlen for l in lengths]):
+ if not all(l == seqlen for l in lengths):
  x = torch._nested_tensor_from_mask(x, attn_mask)
  attn_mask = None
 

diff --git a/optimum/exporters/onnx/model_configs.py b/optimum/exporters/onnx/model_configs.py
@@ -550,6 +550,11 @@ def inputs(self) -> Dict[str, Dict[int, str]]:
  return {"pixel_values": {0: "batch_size", 1: "num_channels", 2: "height", 3: "width"}}
 
 
+class CvTOnnxConfig(ViTOnnxConfig):
+ DEFAULT_ONNX_OPSET = 13
+ ATOL_FOR_VALIDATION = 1e-2
+
+
 class LevitOnnxConfig(ViTOnnxConfig):
  pass
 

diff --git a/optimum/exporters/tasks.py b/optimum/exporters/tasks.py
@@ -402,6 +402,7 @@ class TasksManager:
  "image-classification",
  onnx="ConvNextOnnxConfig",
  ),
+ "cvt": supported_tasks_mapping("feature-extraction", "image-classification", onnx="CvTOnnxConfig"),
  "data2vec-text": supported_tasks_mapping(
  "feature-extraction",
  "fill-mask",

diff --git a/optimum/utils/normalized_config.py b/optimum/utils/normalized_config.py
@@ -205,6 +205,7 @@ class NormalizedConfigManager:
  "bloom": NormalizedTextConfig.with_args(num_layers="n_layer"),
  "camembert": NormalizedTextConfig,
  "codegen": GPT2LikeNormalizedTextConfig,
+ "cvt": NormalizedVisionConfig,
  "deberta": NormalizedTextConfig,
  "deberta-v2": NormalizedTextConfig,
  "deit": NormalizedVisionConfig,

diff --git a/tests/exporters/exporters_utils.py b/tests/exporters/exporters_utils.py
@@ -43,6 +43,7 @@
  "clip": "hf-internal-testing/tiny-random-CLIPModel",
  "convbert": "hf-internal-testing/tiny-random-ConvBertModel",
  "codegen": "hf-internal-testing/tiny-random-CodeGenModel",
+ "cvt": "hf-internal-testing/tiny-random-CvTModel",
  "data2vec-text": "hf-internal-testing/tiny-random-Data2VecTextModel",
  "data2vec-vision": "hf-internal-testing/tiny-random-Data2VecVisionModel",
  "data2vec-audio": "hf-internal-testing/tiny-random-Data2VecAudioModel",