An Open-Source Toolkit for Generative Watermarking of Latent Diffusion Models

🔥 As a new released project, We welcome PRs! If you have implemented a LDM watermarking algorithm or are interested in contributing one, we'd love to include it in MarkDiffusion. Join our community and help make generative watermarking more accessible to everyone!

Introduction to MarkDiffusion

Overview

MarkDiffusion is an open-source Python toolkit for generative watermarking of latent diffusion models. As the use of diffusion-based generative models expands, ensuring the authenticity and origin of generated media becomes critical. MarkDiffusion simplifies the access, understanding, and assessment of watermarking technologies, making it accessible to both researchers and the broader community. Note: if you are interested in LLM watermarking (text watermark), please refer to the MarkLLM toolkit from our group.

The toolkit comprises three key components: a unified implementation framework for streamlined watermarking algorithm integrations and user-friendly interfaces; a mechanism visualization suite that intuitively showcases added and extracted watermark patterns to aid public understanding; and a comprehensive evaluation module offering standard implementations of 24 tools across three essential aspects—detectability, robustness, and output quality, plus 8 automated evaluation pipelines.

Key Features

Unified Implementation Framework: MarkDiffusion provides a modular architecture supporting eight state-of-the-art generative image/video watermarking algorithms of LDMs.
Comprehensive Algorithm Support: Currently implements 8 watermarking algorithms from two major categories: Pattern-based methods (Tree-Ring, Ring-ID, ROBIN, WIND) and Key-based methods (Gaussian-Shading, PRC, SEAL, VideoShield).
Visualization Solutions: The toolkit includes custom visualization tools that enable clear and insightful views into how different watermarking algorithms operate under various scenarios. These visualizations help demystify the algorithms' mechanisms, making them more understandable for users.
Evaluation Module: With 20 evaluation tools covering detectability, robustness, and impact on output quality, MarkDiffusion provides comprehensive assessment capabilities. It features 5 automated evaluation pipelines: Watermark Detection Pipeline, Image Quality Analysis Pipeline, Video Quality Analysis Pipeline, and specialized robustness assessment tools.

Implemented Algorithms

Algorithm	Category	Target	Reference
Tree-Ring	Pattern	Image	Tree-Ring Watermarks: Fingerprints for Diffusion Images that are Invisible and Robust
Ring-ID	Pattern	Image	RingID: Rethinking Tree-Ring Watermarking for Enhanced Multi-Key Identification
ROBIN	Pattern	Image	ROBIN: Robust and Invisible Watermarks for Diffusion Models with Adversarial Optimization
WIND	Pattern	Image	Hidden in the Noise: Two-Stage Robust Watermarking for Images
Gaussian-Shading	Key	Image	Gaussian Shading: Provable Performance-Lossless Image Watermarking for Diffusion Models
PRC	Key	Image	An undetectable watermark for generative image models
SEAL	Key	Image	SEAL: Semantic Aware Image Watermarking
VideoShield	Key	Video	VideoShield: Regulating Diffusion-based Video Generation Models via Watermarking

Evaluation Module

Evaluation Pipelines

MarkDiffusion supports eight pipelines, two for detection (WatermarkedMediaDetectionPipeline and UnWatermarkedMediaDetectionPipeline), and six for quality analysis. The table below details the quality analysis pipelines.

Quality Analysis Pipeline	Input Type	Required Data	Applicable Metrics
DirectImageQualityAnalysisPipeline	Single image	Generated watermarked/unwatermarked image	Metrics for single image evaluation
ReferencedImageQualityAnalysisPipeline	Image + reference content	Generated watermarked/unwatermarked image + reference image/text	Metrics requiring computation between single image and reference content (text/image)
GroupImageQualityAnalysisPipeline	Image set (+ reference image set)	Generated watermarked/unwatermarked image set (+reference image set)	Metrics requiring computation on image sets
RepeatImageQualityAnalysisPipeline	Image set	Repeatedly generated watermarked/unwatermarked image set	Metrics for evaluating repeatedly generated image sets
ComparedImageQualityAnalysisPipeline	Two images for comparison	Generated watermarked and unwatermarked images	Metrics measuring differences between two images
DirectVideoQualityAnalysisPipeline	Single video	Generated video frame set	Metrics for overall video evaluation

Evaluation Tools

Tool Name	Evaluation Category	Function Description	Output Metrics
FundamentalSuccessRateCalculator	Detectability	Calculate classification metrics for fixed-threshold watermark detection	Various classification metrics
DynamicThresholdSuccessRateCalculator	Detectability	Calculate classification metrics for dynamic-threshold watermark detection	Various classification metrics
Image Attack Tools
Rotation	Robustness (Image)	Image rotation attack, testing watermark resistance to rotation transforms	Rotated images/frames
CrSc (Crop & Scale)	Robustness (Image)	Cropping and scaling attack, evaluating watermark robustness to size changes	Cropped/scaled images/frames
GaussianNoise	Robustness (Image)	Gaussian noise attack, testing watermark resistance to noise interference	Noise-corrupted images/frames
GaussianBlurring	Robustness (Image)	Gaussian blur attack, evaluating watermark resistance to blur processing	Blurred images/frames
JPEGCompression	Robustness (Image)	JPEG compression attack, testing watermark robustness to lossy compression	Compressed images/frames
Brightness	Robustness (Image)	Brightness adjustment attack, evaluating watermark resistance to brightness changes	Brightness-modified images/frames
Video Attack Tools
MPEG4Compression	Robustness (Video)	MPEG-4 video compression attack, testing video watermark compression robustness	Compressed video frames
FrameAverage	Robustness (Video)	Frame averaging attack, destroying watermarks through inter-frame averaging	Averaged video frames
FrameSwap	Robustness (Video)	Frame swapping attack, testing robustness by changing frame sequences	Swapped video frames
Image Quality Analyzers
InceptionScoreCalculator	Quality (Image)	Evaluate generated image quality and diversity	IS score
FIDCalculator	Quality (Image)	Fréchet Inception Distance, measuring distribution difference between generated and real images	FID value
LPIPSAnalyzer	Quality (Image)	Learned Perceptual Image Patch Similarity, evaluating perceptual quality	LPIPS distance
CLIPScoreCalculator	Quality (Image)	CLIP-based text-image consistency evaluation	CLIP similarity score
PSNRAnalyzer	Quality (Image)	Peak Signal-to-Noise Ratio, measuring image distortion	PSNR value (dB)
NIQECalculator	Quality (Image)	Natural Image Quality Evaluator, reference-free quality assessment	NIQE score
Video Quality Analyzers
SubjectConsistencyAnalyzer	Quality (Video)	Evaluate consistency of subject objects in video	Subject consistency score
BackgroundConsistencyAnalyzer	Quality (Video)	Evaluate background coherence and stability in video	Background consistency score
MotionSmoothnessAnalyzer	Quality (Video)	Evaluate smoothness of video motion	Motion smoothness metric
DynamicDegreeAnalyzer	Quality (Video)	Measure dynamic level and change magnitude in video	Dynamic degree value
ImagingQualityAnalyzer	Quality (Video)	Comprehensive evaluation of video imaging quality	Imaging quality score

Installation

Setting up the environment

Python 3.10+
PyTorch
Install dependencies:

pip install -r requirements.txt

Note: Some algorithms may require additional setup steps. Please refer to individual algorithm documentation for specific requirements.

Quick Start

Here's a simple example to get you started with MarkDiffusion:

import torch
from watermark.auto_watermark import AutoWatermark
from utils.diffusion_config import DiffusionConfig
from diffusers import StableDiffusionPipeline, DPMSolverMultistepScheduler

# Device setup
device = 'cuda' if torch.cuda.is_available() else 'cpu'

# Configure diffusion pipeline
scheduler = DPMSolverMultistepScheduler.from_pretrained("model_path", subfolder="scheduler")
pipe = StableDiffusionPipeline.from_pretrained("model_path", scheduler=scheduler).to(device)
diffusion_config = DiffusionConfig(
    scheduler=scheduler,
    pipe=pipe,
    device=device,
    image_size=(512, 512),
    num_inference_steps=50,
    guidance_scale=7.5,
    gen_seed=42,
    inversion_type="ddim"
)

# Load watermark algorithm
watermark = AutoWatermark.load('TR', 
                              algorithm_config='config/TR.json',
                              diffusion_config=diffusion_config)

# Generate watermarked media
prompt = "A beautiful sunset over the ocean"
watermarked_image = watermark.generate_watermarked_media(prompt)

# Detect watermark
detection_result = watermark.detect_watermark_in_media(watermarked_image)
print(f"Watermark detected: {detection_result}")

How to Use the Toolkit

We provide extensive examples in MarkDiffusion_demo.ipynb.

Generating and Detecting Watermarked Media

Cases for Generating and Detecting Watermarked Media

import torch
from watermark.auto_watermark import AutoWatermark
from utils.diffusion_config import DiffusionConfig

# Load watermarking algorithm
mywatermark = AutoWatermark.load(
    'GS',
    algorithm_config=f'config/GS.json',
    diffusion_config=diffusion_config
)

# Generate watermarked image
watermarked_image = mywatermark.generate_watermarked_media(
    input_data="A beautiful landscape with a river and mountains"
)

# Visualize the watermarked image
watermarked_image.show()

# Detect watermark
detection_result = mywatermark.detect_watermark_in_media(watermarked_image)
print(detection_result)

Visualizing Watermarking Mechanisms

The toolkit includes custom visualization tools that enable clear and insightful views into how different watermarking algorithms operate under various scenarios. These visualizations help demystify the algorithms' mechanisms, making them more understandable for users.

Cases for Visualizing Watermarking Mechanism

from visualize.auto_visualization import AutoVisualizer

# Get data for visualization
data_for_visualization = mywatermark.get_data_for_visualize(watermarked_image)

# Load Visualizer
visualizer = AutoVisualizer.load('GS', 
                                data_for_visualization=data_for_visualization)

# Draw diagrams on Matplotlib canvas
fig = visualizer.visualize(rows=2, cols=2, 
                          methods=['draw_watermark_bits', 
                                  'draw_reconstructed_watermark_bits', 
                                  'draw_inverted_latents', 
                                  'draw_inverted_latents_fft'])

Evaluation Pipelines

Cases for Evaluation

Watermark Detection Pipeline

from evaluation.dataset import StableDiffusionPromptsDataset
from evaluation.pipelines.detection import (
    WatermarkedMediaDetectionPipeline, 
    UnWatermarkedMediaDetectionPipeline, 
    DetectionPipelineReturnType
)
from evaluation.tools.image_editor import JPEGCompression
from evaluation.tools.success_rate_calculator import DynamicThresholdSuccessRateCalculator

# Dataset
my_dataset = StableDiffusionPromptsDataset(max_samples=200)

# Set up detection pipelines
pipeline1 = WatermarkedMediaDetectionPipeline(
    dataset=my_dataset,
    media_editor_list=[JPEGCompression(quality=60)],
    show_progress=True, 
    return_type=DetectionPipelineReturnType.SCORES
)

pipeline2 = UnWatermarkedMediaDetectionPipeline(
    dataset=my_dataset,
    media_editor_list=[],
    show_progress=True, 
    return_type=DetectionPipelineReturnType.SCORES
)

# Configure detection parameters
detection_kwargs = {
    "num_inference_steps": 50,
    "guidance_scale": 1.0,
}

# Calculate success rates
calculator = DynamicThresholdSuccessRateCalculator(
    labels=labels, 
    rule=rules,
    target_fpr=target_fpr
)

results = calculator.calculate(
    pipeline1.evaluate(my_watermark, detection_kwargs=detection_kwargs),
    pipeline2.evaluate(my_watermark, detection_kwargs=detection_kwargs)
)
print(results)

Image Quality Analysis Pipeline

from evaluation.dataset import StableDiffusionPromptsDataset, MSCOCODataset
from evaluation.pipelines.image_quality_analysis import (
    DirectImageQualityAnalysisPipeline,
    ReferencedImageQualityAnalysisPipeline,
    GroupImageQualityAnalysisPipeline,
    RepeatImageQualityAnalysisPipeline,
    ComparedImageQualityAnalysisPipeline,
    QualityPipelineReturnType
)
from evaluation.tools.image_quality_analyzer import (
    NIQECalculator, CLIPScoreCalculator, FIDCalculator, 
    InceptionScoreCalculator, LPIPSAnalyzer, PSNRAnalyzer
)

# Different quality metrics examples:

# NIQE (No-Reference Image Quality Evaluator)
if metric == 'NIQE':
    my_dataset = StableDiffusionPromptsDataset(max_samples=max_samples)
    pipeline = DirectImageQualityAnalysisPipeline(
        dataset=my_dataset,
        watermarked_image_editor_list=[],
        unwatermarked_image_editor_list=[],
        analyzers=[NIQECalculator()],
        show_progress=True,
        return_type=QualityPipelineReturnType.MEAN_SCORES
    )

# CLIP Score
elif metric == 'CLIP':
    my_dataset = MSCOCODataset(max_samples=max_samples)
    pipeline = ReferencedImageQualityAnalysisPipeline(
        dataset=my_dataset,
        watermarked_image_editor_list=[],
        unwatermarked_image_editor_list=[],
        analyzers=[CLIPScoreCalculator()],
        unwatermarked_image_source='generated',
        reference_image_source='natural',
        show_progress=True,
        return_type=QualityPipelineReturnType.MEAN_SCORES
    )

# FID (Fréchet Inception Distance)
elif metric == 'FID':
    my_dataset = MSCOCODataset(max_samples=max_samples)
    pipeline = GroupImageQualityAnalysisPipeline(
        dataset=my_dataset,
        watermarked_image_editor_list=[],
        unwatermarked_image_editor_list=[],
        analyzers=[FIDCalculator()],
        unwatermarked_image_source='generated',
        reference_image_source='natural',
        show_progress=True,
        return_type=QualityPipelineReturnType.MEAN_SCORES
    )

# IS (Inception Score)
elif metric == 'IS':
    my_dataset = StableDiffusionPromptsDataset(max_samples=max_samples)
    pipeline = GroupImageQualityAnalysisPipeline(
        dataset=my_dataset,
        watermarked_image_editor_list=[],
        unwatermarked_image_editor_list=[],
        analyzers=[InceptionScoreCalculator()],
        show_progress=True,
        return_type=QualityPipelineReturnType.MEAN_SCORES
    )

# LPIPS (Learned Perceptual Image Patch Similarity)
elif metric == 'LPIPS':
    my_dataset = StableDiffusionPromptsDataset(max_samples=10)
    pipeline = RepeatImageQualityAnalysisPipeline(
        dataset=my_dataset,
        prompt_per_image=20,
        watermarked_image_editor_list=[],
        unwatermarked_image_editor_list=[],
        analyzers=[LPIPSAnalyzer()],
        show_progress=True,
        return_type=QualityPipelineReturnType.MEAN_SCORES
    )

# PSNR (Peak Signal-to-Noise Ratio)
elif metric == 'PSNR':
    my_dataset = StableDiffusionPromptsDataset(max_samples=max_samples)
    pipeline = ComparedImageQualityAnalysisPipeline(
        dataset=my_dataset,
        watermarked_image_editor_list=[],
        unwatermarked_image_editor_list=[],
        analyzers=[PSNRAnalyzer()],
        show_progress=True,
        return_type=QualityPipelineReturnType.MEAN_SCORES
    )

# Load watermark and evaluate
my_watermark = AutoWatermark.load(
    f'{algorithm_name}',
    algorithm_config=f'config/{algorithm_name}.json',
    diffusion_config=diffusion_config
)

print(pipeline.evaluate(my_watermark))

Video Quality Analysis Pipeline

from evaluation.dataset import VBenchDataset
from evaluation.pipelines.video_quality_analysis import DirectVideoQualityAnalysisPipeline
from evaluation.tools.video_quality_analyzer import (
    SubjectConsistencyAnalyzer,
    MotionSmoothnessAnalyzer,
    DynamicDegreeAnalyzer,
    BackgroundConsistencyAnalyzer,
    ImagingQualityAnalyzer
)

# Load VBench dataset
my_dataset = VBenchDataset(max_samples=200, dimension=dimension)

# Initialize analyzer based on metric
if metric == 'subject_consistency':
    analyzer = SubjectConsistencyAnalyzer(device=device)
elif metric == 'motion_smoothness':
    analyzer = MotionSmoothnessAnalyzer(device=device)
elif metric == 'dynamic_degree':
    analyzer = DynamicDegreeAnalyzer(device=device)
elif metric == 'background_consistency':
    analyzer = BackgroundConsistencyAnalyzer(device=device)
elif metric == 'imaging_quality':
    analyzer = ImagingQualityAnalyzer(device=device)
else:
    raise ValueError(f'Invalid metric: {metric}. Supported metrics: 
                    subject_consistency, motion_smoothness, dynamic_degree,
                    background_consistency, imaging_quality')

# Create video quality analysis pipeline
pipeline = DirectVideoQualityAnalysisPipeline(
    dataset=my_dataset,
    watermarked_video_editor_list=[],
    unwatermarked_video_editor_list=[],
    watermarked_frame_editor_list=[],
    unwatermarked_frame_editor_list=[],
    analyzers=[analyzer],
    show_progress=True,
    return_type=QualityPipelineReturnType.MEAN_SCORES
)

print(pipeline.evaluate(my_watermark))

Citation

@misc{pan2025markdiffusionopensourcetoolkitgenerative,
      title={MarkDiffusion: An Open-Source Toolkit for Generative Watermarking of Latent Diffusion Models}, 
      author={Leyi Pan and Sheng Guan and Zheyu Fu and Luyang Si and Zian Wang and Xuming Hu and Irwin King and Philip S. Yu and Aiwei Liu and Lijie Wen},
      year={2025},
      eprint={2509.10569},
      archivePrefix={arXiv},
      primaryClass={cs.CR},
      url={https://arxiv.org/abs/2509.10569}, 
}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

An Open-Source Toolkit for Generative Watermarking of Latent Diffusion Models

Contents

Introduction to MarkDiffusion

Overview

Key Features

Implemented Algorithms

Evaluation Module

Evaluation Pipelines

Evaluation Tools

Installation

Setting up the environment

Quick Start

How to Use the Toolkit

Generating and Detecting Watermarked Media

Cases for Generating and Detecting Watermarked Media

Visualizing Watermarking Mechanisms

Cases for Visualizing Watermarking Mechanism

Evaluation Pipelines

Cases for Evaluation

Citation

About

Uh oh!

Releases

Packages

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
config		config
dataset		dataset
detection		detection
evaluation		evaluation
examples		examples
exceptions		exceptions
img		img
inversions		inversions
model		model
test		test
utils		utils
visualize		visualize
watermark		watermark
.gitignore		.gitignore
LICENSE		LICENSE
MarkDiffusion_demo.ipynb		MarkDiffusion_demo.ipynb
README.md		README.md
requirements.txt		requirements.txt

License

codelformat/MarkDiffusion

Folders and files

Latest commit

History

Repository files navigation

An Open-Source Toolkit for Generative Watermarking of Latent Diffusion Models

Contents

Introduction to MarkDiffusion

Overview

Key Features

Implemented Algorithms

Evaluation Module

Evaluation Pipelines

Evaluation Tools

Installation

Setting up the environment

Quick Start

How to Use the Toolkit

Generating and Detecting Watermarked Media

Cases for Generating and Detecting Watermarked Media

Visualizing Watermarking Mechanisms

Cases for Visualizing Watermarking Mechanism

Evaluation Pipelines

Cases for Evaluation

Citation

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages