Merge pull request #325 from roboflow/better-head-reinitialization

probicheaux · web-flow · commit 24ce179cb5d7 · 2025-08-19T13:12:40.000-07:00
Better head reinitialization
diff --git a/rfdetr/detr.py b/rfdetr/detr.py
@@ -137,7 +137,6 @@ def train_from_config(self, config: TrainConfig, **kwargs):
             )
             self.model.reinitialize_detection_head(num_classes)
         
-        
         train_config = config.dict()
         model_config = self.model_config.dict()
         model_config.pop("num_classes")
diff --git a/rfdetr/models/lwdetr.py b/rfdetr/models/lwdetr.py
@@ -103,20 +103,19 @@ def __init__(self,
         self._export = False
 
     def reinitialize_detection_head(self, num_classes):
-        # Create new classification head
-        del self.class_embed
-        self.add_module("class_embed", nn.Linear(self.transformer.d_model, num_classes))
+        base = self.class_embed.weight.shape[0]
+        num_repeats = int(math.ceil(num_classes / base))
+        self.class_embed.weight.data = self.class_embed.weight.data.repeat(num_repeats, 1)
+        self.class_embed.weight.data = self.class_embed.weight.data[:num_classes]
+        self.class_embed.bias.data = self.class_embed.bias.data.repeat(num_repeats)
+        self.class_embed.bias.data = self.class_embed.bias.data[:num_classes]
         
-        # Initialize with focal loss bias adjustment
-        prior_prob = 0.01
-        bias_value = -math.log((1 - prior_prob) / prior_prob)
-        self.class_embed.bias.data = torch.ones(num_classes) * bias_value
-
         if self.two_stage:
-            del self.transformer.enc_out_class_embed
-            self.transformer.add_module("enc_out_class_embed", nn.ModuleList(
-                [copy.deepcopy(self.class_embed) for _ in range(self.group_detr)]))
-
+            for enc_out_class_embed in self.transformer.enc_out_class_embed:
+                enc_out_class_embed.weight.data = enc_out_class_embed.weight.data.repeat(num_repeats, 1)
+                enc_out_class_embed.weight.data = enc_out_class_embed.weight.data[:num_classes]
+                enc_out_class_embed.bias.data = enc_out_class_embed.bias.data.repeat(num_repeats)
+                enc_out_class_embed.bias.data = enc_out_class_embed.bias.data[:num_classes]
 
     def export(self):
         self._export = True

Original file line number	Diff line number	Diff line change
`@@ -137,7 +137,6 @@ def train_from_config(self, config: TrainConfig, **kwargs):`
`137`	`137`	`)`
`138`	`138`	`self.model.reinitialize_detection_head(num_classes)`
`139`	`139`
`140`		`-`
`141`	`140`	`train_config = config.dict()`
`142`	`141`	`model_config = self.model_config.dict()`
`143`	`142`	`model_config.pop("num_classes")`