1111

gesen2egee · gesen2egee · commit 2327b1d1ba65 · 2024-12-26T22:25:41.000+08:00
diff --git a/library/train_util.py b/library/train_util.py
@@ -4720,6 +4720,15 @@ def get_optimizer(args, trainable_params):
         optimizer_class = lion_pytorch.Lion
         optimizer = optimizer_class(trainable_params, lr=lr, **optimizer_kwargs)
 
+    elif optimizer_type == "SGD_sai".lower():
+        try:
+            from sgd_sai import SGD_sai
+        except ImportError:
+            raise ImportError("No SGD_sai / SGD_sai がインストールされていないようです")
+        logger.info(f"use SGD_sai optimizer | {optimizer_kwargs}")
+        optimizer_class = SGD_sai
+        optimizer = optimizer_class(trainable_params, lr=lr, **optimizer_kwargs)
+
     elif optimizer_type.endswith("8bit".lower()):
         try:
             import bitsandbytes as bnb
diff --git a/preset.toml b/preset.toml
@@ -26,5 +26,5 @@ unet_target_name = [
     algo = "lokr"
     dim = 100000
     alpha = 100000
-    factor = 8
+    factor = 6
   
diff --git a/sdxl.bat b/sdxl.bat
@@ -1,8 +1,13 @@
 
+accelerate launch --num_cpu_threads_per_process=4 "./sdxl_train_network.py" --bucket_reso_steps=64 --caption_extension=".txt" --enable_bucket --min_bucket_reso=512 --max_bucket_reso=2048 --keep_tokens="5" --logging_dir="D:/SD/stable-diffusion-webui/models/LyCORIS/loli4" --resolution="1024,1024" --max_train_steps="2000" --mixed_precision="bf16"  --network_module=lycoris.kohya --output_dir="D:/SD/stable-diffusion-webui/models/LyCORIS/loli3" --output_name="sakuranomiya maika 036" --persistent_data_loader_workers --pretrained_model_name_or_path="D:/SD/stable-diffusion-webui/models/Stable-diffusion/illustriousXL_v01.safetensors" --save_every_n_steps="100" --save_model_as=safetensors --save_precision="fp16" --seed="1026" --train_batch_size="3" --fp8_base --gradient_checkpointing --xformers --save_state_on_train_end --cache_latents --cache_latents_to_disk --debiased_estimation_loss  --ip_noise_gamma 0.03  --noise_offset 0.06 --train_data_dir="F:/1_FAV"  --max_data_loader_n_workers 4 --save_state --save_last_n_steps_state 100 --no_half_vae --network_args "factor=8" "algo=lokr" "bypass_mode=False" "use_scalar=Ture" "full_matrix=True" "conv_dim=100000" "preset=full" --network_dim 100000 --caption_dropout_rate=0.05 --clip_skip 2 --unet_lr=0.001 --max_grad_norm=1 --optimizer_type SGD_sai --network_train_unet_only --lr_scheduler_type "custom.custom.RexWithRestarts"  --enable_wildcard --shuffle_caption
 
-accelerate launch --num_cpu_threads_per_process=4 "./sdxl_train_network.py" --bucket_reso_steps=64 --caption_extension=".txt" --enable_bucket --min_bucket_reso=512 --max_bucket_reso=2048 --keep_tokens="5" --logging_dir="D:/SD/stable-diffusion-webui/models/LyCORIS/loli4" --resolution="1024,1024" --max_train_steps="15000" --mixed_precision="bf16"  --network_module=lycoris.kohya --output_dir="D:/SD/stable-diffusion-webui/models/LyCORIS/loli3" --output_name="wangsec" --persistent_data_loader_workers --pretrained_model_name_or_path="D:/SD/stable-diffusion-webui/models/Stable-diffusion/sdXL_v10VAEFix.safetensors" --save_every_n_steps="250" --save_model_as=safetensors --save_precision="fp16" --seed="1026" --train_batch_size="3" --fp8_base --gradient_checkpointing --xformers --save_state_on_train_end --cache_latents --cache_latents_to_disk --noise_offset=0.06 --ip_noise_gamma 0.03  --train_data_dir="F:/train/sec"  --max_data_loader_n_workers 4 --save_state --save_last_n_steps_state 100 --debiased_estimation_loss  --network_train_unet_only --no_half_vae --network_args "factor=10" "algo=lokr" "train_norm=True" "bypass_mode=False" "use_scalar=Ture" "full_matrix=True" "conv_dim=100000" "preset=full" --caption_dropout_rate=0.05 --clip_skip 2 --optimizer_args "warmup_steps=500" "prodigy_steps=1250" "weight_decay=0.01" "use_bias_correction=True" "factored=False" "d_coef=1" "betas=0.9,0.99" "use_cautious=True" --unet_lr=1 --optimizer_type "prodigyplus.ProdigyPlusScheduleFree" --enable_wildcard 
 
-:::--alpha_mask 
+
+:::--unet_lr=0.0005 --max_grad_norm=1 --optimizer_type adamw8bit --optimizer_args "weight_decay=0.1" --network_train_unet_only --lr_scheduler_type "custom.custom.RexWithRestarts"  --enable_wildcard --shuffle_caption
+
+
+:::accelerate launch --num_cpu_threads_per_process=4 "./sdxl_train_network.py" --bucket_reso_steps=64 --caption_extension=".txt" --enable_bucket --min_bucket_reso=512 --max_bucket_reso=2048 --keep_tokens="5" --logging_dir="D:/SD/stable-diffusion-webui/models/LyCORIS/loli4" --resolution="1024,1024" --max_train_steps="100000" --mixed_precision="bf16"  --network_module=lycoris.kohya --output_dir="D:/SD/stable-diffusion-webui/models/LyCORIS/loli3" --output_name="real 008" --persistent_data_loader_workers --pretrained_model_name_or_path="D:/SD/stable-diffusion-webui/models/Stable-diffusion/illustriousXL_v01.safetensors" --save_every_n_steps="250" --save_model_as=safetensors --save_precision="fp16" --seed="1026" --train_batch_size="3" --fp8_base --gradient_checkpointing --xformers --save_state_on_train_end --cache_latents --cache_latents_to_disk --ip_noise_gamma 0.03  --noise_offset 0.06 --train_data_dir="e:/real"  --max_data_loader_n_workers 4 --save_state --save_last_n_steps_state 100 --debiased_estimation_loss  --no_half_vae --network_args "factor=8" "algo=lokr" "train_norm=True" "bypass_mode=False" "use_scalar=Ture" "full_matrix=True" "conv_dim=100000" "preset=preset.toml" --caption_dropout_rate=0.05 --clip_skip 2  --unet_lr=0.0001 --max_grad_norm=0 --optimizer_type bitsandbytes.optim.AdEMAMix8bit --optimizer_args "weight_decay=0.1" --network_train_unet_only --lr_scheduler_type "custom.custom.RexWithRestarts" --lr_scheduler_args "first_cycle=1000"  --enable_wildcard --shuffle_caption
+
 
 
 ::: --network_args  "preset=attn-only" "rescaled=True" "algo=diag-oft" "train_norm=True" "bypass_mode=False" "use_scalar=Ture" "constraint=1e-3" --network_dim=32--enable_wildcard --pretrained_model_name_or_path="D:/SD/stable-diffusion-webui/models/Stable-diffusion/illustriousXL_v01.safetensors"