StyleID — Stylization-Agnostic Identity Encoder

Name: kwanY/styleid
Brand: kwanY
Rating: 0.0 (4 reviews)

StyleID is a CLIP-based image encoder trained to produce identity embeddings that are robust to stylization.
It can be used for identity similarity, retrieval, evaluation, and conditioning in generative models.

Installation

pip install transformers pillow

Usage

Do not use for multiple faces or faces too small to recognize.

import torch
from transformers import CLIPModel, CLIPProcessor
from PIL import Image

device = "cuda" if torch.cuda.is_available() else "cpu"

model = CLIPModel.from_pretrained("kwanY/styleid").to(device)
processor = CLIPProcessor.from_pretrained("kwanY/styleid")

img = Image.open(img_path).convert("RGB")
inputs = processor(images=img, return_tensors="pt").to(device)

with torch.no_grad():
    emb = model.get_image_features(**inputs)
    emb = emb / emb.norm(dim=-1, keepdim=True)  # optional but recommended

kwanY/styleid

StyleID — Stylization-Agnostic Identity Encoder

Installation

Usage

Do not use for multiple faces or faces too small to recognize.

Open for non-commercial research. Do not use FFHQ for biometric human recognition

No reviews yet

Model Info

Community

Rating Guidelines