Exclude bad words in text generation #3434

sroy-forr · 2024-03-12T19:31:55Z

sroy-forr
Mar 12, 2024

Is there a way to exclude bad tokens when generating? This is different from stop_words mentioned in the vLLM docs.

Looking for something similar to this HF doc.
https://huggingface.co/docs/transformers/v4.38.2/en/internal/generation_utils#transformers.NoBadWordsLogitsProcessor

Answered by hverma-forrester

Mar 13, 2024

Just passing the logits of bad words token ID assigned with negative number worked for me:

def bad_word_processor(token_ids, logits):
    logits[121] = float("-inf")
    logits[345] = float("-inf")
    logits[420] = float("-inf")
    return logits

sampling_params = SamplingParams(temperature=0.2, top_p=0.99, max_tokens=512, frequency_penalty=1.1, logits_processors=[bad_word_processor])

outputs = llm.generate(prompts, sampling_params)

View full answer

hverma-forrester · 2024-03-13T08:59:25Z

hverma-forrester
Mar 13, 2024

Just passing the logits of bad words token ID assigned with negative number worked for me:

def bad_word_processor(token_ids, logits):
    logits[121] = float("-inf")
    logits[345] = float("-inf")
    logits[420] = float("-inf")
    return logits

sampling_params = SamplingParams(temperature=0.2, top_p=0.99, max_tokens=512, frequency_penalty=1.1, logits_processors=[bad_word_processor])

outputs = llm.generate(prompts, sampling_params)

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Exclude bad words in text generation #3434

{{title}}

Replies: 1 comment

{{title}}

Select a reply

Exclude bad words in text generation #3434

sroy-forr Mar 12, 2024

Replies: 1 comment

hverma-forrester Mar 13, 2024

sroy-forr
Mar 12, 2024

hverma-forrester
Mar 13, 2024